CN109584898B - 一种语音信号的处理方法、装置、存储介质及电子设备 - Google Patents
一种语音信号的处理方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN109584898B CN109584898B CN201811641579.4A CN201811641579A CN109584898B CN 109584898 B CN109584898 B CN 109584898B CN 201811641579 A CN201811641579 A CN 201811641579A CN 109584898 B CN109584898 B CN 109584898B
- Authority
- CN
- China
- Prior art keywords
- signal
- previous frame
- reference signal
- frequency domain
- filtering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 10
- 238000001914 filtration Methods 0.000 claims abstract description 135
- 238000012545 processing Methods 0.000 claims abstract description 64
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000005070 sampling Methods 0.000 claims abstract description 20
- 230000003044 adaptive effect Effects 0.000 claims abstract description 16
- 230000006870 function Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 17
- 238000001228 spectrum Methods 0.000 abstract description 10
- 238000004422 calculation algorithm Methods 0.000 abstract description 3
- 239000011159 matrix material Substances 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
本申请实施例公开一种语音信号的处理方法、装置、存储介质及电子设备,其中,本申请实施例通过获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠;对所述参考信号进行快速傅里叶变换,以获取频域参考信号;根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号;将参考信号与滤波信号相减,以得到目标语音信号。由于数据的采样重叠提高了语音信号输入时的收敛速度,同时能降低滤波算法中的频谱泄露。
Description
技术领域
本发明涉及语音数据处理领域,特别涉及一种语音信号的处理方法、装置、存储介质及电子设备。
背景技术
随着电子技术的不断发展,电子设备如手机的功能越来越强大,手机已经从最基本的语音通话设备,发展成为具有多种功能例如看电影、听音乐或者玩游戏的智能电子设备。另外,由于使用耳机听音乐或看视频既不影响旁人,亦可隔开外界环境的部分声响,故用户常会借助耳机来听手机中的音乐或者看视频,但在嘈杂的外界环境中,外界的噪声会导致用户无法通过耳机清晰的听清手机中播放的音乐或视频的语音内容,严重影响了听音乐以及看视频的体验。
发明内容
本申请实施例提供了一种语音信号的处理方法、装置、存储介质及电子设备,能够提升对语音信号的降噪效率。
第一方面,本申请实施例提供了一种语音信号的处理方法,包括:
获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠;
对所述参考信号进行快速傅里叶变换,以获取频域参考信号;
根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号;
将参考信号与滤波信号相减,以得到目标语音信号。
第二方面,本申请实施例提供了一种语音信号的处理装置,包括:
获取模块,用于获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠;
变换模块,用于对所述参考信号进行快速傅里叶变换,以获取频域参考信号;
处理模块,用于根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号;
目标模块,用于将参考信号与滤波信号相减,以得到目标语音信号。
第三方面,本申请实施例提供的存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如本申请任一实施例提供的语音信号的处理方法。
第四方面,本申请实施例提供的电子设备,包括处理器和存储器,所述存储器有计算机程序,该处理器通过调用所述计算机程序,用于执行如本申请任一实施例提供的语音信号的处理方法。
本申请实施例通过获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠;对所述参考信号进行快速傅里叶变换,以获取频域参考信号;根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号;将参考信号与滤波信号相减,以得到目标语音信号。由于上一帧的频域参考信号与当前帧的频域参考信号中存在部分采样数据重叠,在上述的两个参考信号的衔接位置处信号是平滑过渡的,故使得输出的滤波信号不会生成波形的断裂问题,从而降低临近信道的频谱泄露。
附图说明
图1为本申请实施例提供的语音信号的处理方法的流程示意图。
图2为本申请实施例提供的语音信号的处理方法的另一流程示意图。
图3为本申请实施例提供的语音信号的处理装置的结构示意图。
图4为本申请实施例提供的电子设备的结构示意图。
图5为本申请实施例提供的电子设备的另一结构示意图。
具体实施例
请参照图式,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。
本文所使用的术语「模块」可看做为在该运算系统上执行的软件对象。本文该的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文该的装置及方法优选的以软件的方式进行实施,当然也可在硬件上进行实施,均在本申请保护范围之内。
本申请实施例提供一种语音信号的处理方法,该语音信号的处理方法的执行主体可以是本申请实施例提供的语音信号的处理装置,或者集成了该语音信号的处理装置的电子设备,其中该语音信号的处理装置可以采用硬件或者软件的方式实现。其中,电子设备可以是智能手机、平板电脑、掌上电脑(PDA,Personal Digital Assistant)等。
请参阅图1,图1为本申请实施例提供的语音信号的处理方法的流程示意图。
在步骤S101中,获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠。
其中,参考信号为包含噪声信号的混合信号,期望信号为噪声信号,例如当用户在使用耳机听音乐时,此时参考信号x(i)为耳机内麦克风采集到的播放音乐和噪声的混合信号,期望信号即为耳机外采集到的噪声信号d(i)。
其中,参考信号x(i)与期望信号d(i)可以为长度为2N的信号,此时,参考信号x(i)与期望信号d(i)的表达式可以如下:
x(n)=[x(nN-2N+1),···,x(nN)],n为第n帧,N为整数;
d(n)=[d(nN-2N+1),···,d(nN)],n为第n帧,N为整数;
其中,x(n)和x(n-1)与d(n)和d(n-1)有50%的采样数据重叠,及存在长度为N的数据重叠。
在步骤S102中,对参考信号进行快速傅里叶变换,以获取频域参考信号。
其中,对参考信号x(i)进行快速傅里叶变换(Fast Fourier Transformation,FFT),以得到频域参考信号X(n),其中对参考信号x(i)进行快速傅里叶变换的表达式如下:
X(n)=F[x(n)],F为离散傅立叶变换矩阵。
其中,快速傅里叶变换利用蝶形因子(WN)的周期性和对称性,将长度为2N(N为整数)的参考信号x(i),分成两个长度分别为N的子序列,首先分别对两个长度为N的子序列的进行离散傅里叶变换(DFT),在对将经过离散傅里叶变换后的两个长度为N的子序列组合生成频域参考信号X(n)。故,由于参考信号的长度为2N,且在参考信号中存在50%的采样数据重叠即存在长度为N的数据重叠,从而在利用快速傅里叶变换对参考信号进行计算式,能大大的减少傅里叶变换的运算量。
在步骤S103中,根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号。
其中,根据上一帧的频域参考信号X(n-1)以及上一帧的滤波系数H(n-1)对当前帧的频域参考信号X(n)进行自适应滤波处理,以得到当前帧的滤波信号y(i),其中,滤波信号y(i)由长度为2N的信号组成,y(n)=[x(nN-2N+1),···,x(nN)],n为第n帧,N为整数。
在一些实施方式中,根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理的步骤可以包括:
(1)获取上一帧的滤波信号y(n-1)与上一帧的期望信号e(n-1)以生成上一帧的频域滤波误差Ew(n-1);
(2)根据上一帧的滤波系数H(n-1)与上一帧的频域滤波误差Ew(n-1)获取当前帧的滤波系数H(n);
(3)根据上一帧的频域参考信号X(n-1)与当前帧的滤波系数H(n)对当前帧的频域参考信号X(n)进行自适应滤波处理。
另外,由于上一帧的频域参考信号X(n-1)与当前帧的频域参考信号X(n)中存在部分采样数据重叠,故在上述的两个参考信号的衔接位置处信号是平滑过渡的,同时由于输出的滤波误差同样长度为2N的信号,从而输出的滤波信号与参考信号相同,在相邻信号的衔接位置处信号是平滑过渡的,故不会生成波形的断裂问题,从而降低临近信道的频谱泄露。
在步骤S104中,将参考信号与滤波信号相减,以得到目标语音信号。
其中,根据获取的滤波信号y(i)可以生成反向信号-y(i),根据参考信号x(i)与反向信号-y(i),生成目标语音信号。此时目标语音信号即为对x(i)进行主动降噪的语音信号。
由上可知,本申请实施例提供的一种语音数据的处理方法,通过获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠;对参考信号进行快速傅里叶变换,以获取频域参考信号;根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号;将参考信号与滤波信号相减,以得到目标语音信号。由于上一帧的频域参考信号与当前帧的频域参考信号中存在部分采样数据重叠且为长度为2N信号,在上述的两个参考信号的衔接位置处信号是平滑过渡的,故使得输出的滤波信号不会生成波形的断裂问题,从而降低临近信道的频谱泄露。
请参阅图2,图2为本申请实施例提供的语音数据的处理方法的另一流程示意图。具体而言,该语音数据的处理方法包括:
在步骤S201中,获取预设长度的多帧参考信号和多帧期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠。
其中,预设长度可以为2N点,其中N为整数,此时,参考信号x(i)与期望信号d(i)可以为长度为2N的信号,此时,参考信号x(i)与期望信号d(i)的表达式可以如下:
x(n)=[x(nN-2N+1),···,x(nN)],n为第n帧,N为整数;
d(n)=[d(nN-2N+1),···,d(nN)],n为第n帧,N为整数;
其中,x(n)和x(n-1)与d(n)和d(n-1)有50%的采样数据重叠。
当n=1时,则在x(1)与d(1)的前面加入N个以生成长度为2N的参考信号与期望信号。此时x(1)=[0,0,···0,···,x(1)···x(N)],N为整数;此时d(1)=[0,0,···0,···,d(1)···d(N)],N为整数。
在步骤S202中,对参考信号进行快速傅里叶变换,以获取频域参考信号。
其中,对参考信号x(i)进行快速傅里叶变换(Fast Fourier Transformation,FFT,以得到频域参考信号X(n),其中对参考信号x(i)进行快速傅里叶变换的表达式如下:
X(n)=F[x(n)],F为离散傅立叶变换矩阵。
其中,快速傅里叶变换利用蝶形因子(WN)的周期性和对称性,将长度为2N(N为整数)的参考信号x(i),分成两个长度分别为N的子序列,首先分别对两个长度为N的子序列的进行离散傅里叶变换(DFT),在对将经过离散傅里叶变换后的两个长度为N的子序列组合生成频域参考信号X(n)。
在步骤S203中,获取上一帧的滤波信号与上一帧的期望信号以生成上一帧的时域滤波误差。
其中,由滤波系数H(n)与频域参考信号X(n)进行卷积操作可以生成滤波信号y(n),即:
其中,F-为离散逆傅立叶变换矩阵矩阵,0N为N阶全为0的矩阵,IN为N阶全为1的单位矩阵,j=(-1)0.5
进一步的,根据滤波信号y(n)与期望信号d(n)可以获取时域滤波误差e(n),即:e(n)=d(n)-y(n),此时时域滤波误差e(n)的长度为2N。需要说明的是,H(n)为长度为2N的一维向量,其中H(1)为已知向量,可以为用户个人设定的向量,此时y(1)可根据X(1)和H(1)获得。此时,e(1)可根据d(1)与y(1)获得。
在步骤S204中,获取预设长度的对称缓变的窗函数。
其中,对称缓变的窗函数可以为tukey窗,同时窗函数的长度为与参考信号的长度相同即长度为2N(N为整数)。进一步的,由于tukey窗的为对称的锥形窗,锥形窗是一个特征函数的离散集合,故tukey窗函数可以解决最小化主频外半频率带频谱泄露的变量问题,从而降低算法中的频谱泄露。
在步骤S205中,利用窗函数和上一帧的时域滤波误差进行计算,生成与上一帧采样数据重叠相关联的第一频域滤波误差及与当前帧的目标采样数据相关联的第二频域滤波误差。
其中,根据tukey窗与时域滤波误差e(n)进行卷积计算并进行极速傅里叶变换(FFT)可以生成相关的频域滤波误差Ew,即:
Ew=F[w2e(n)],w2为长度2N的tukey窗;
此时,频域滤波误差Ew的长度为2N,其中频域滤波误差Ew中的前N点为根据滤波系数H(n)与当前帧参考信号X(n)中与上一帧的参考信号X(n-1)中采样数据重叠相关联的第一频域滤波误差E1,与当前帧参考信号X(n)的目标采样数据相关联的第二频域滤波误差E2。其中,目标采集数据为与上一帧参考数据不重叠部分的长度为N的数据。
在步骤S206中,根据第一频域滤波误差和第二频域滤波误差,获取预设长度的上一帧的频域滤波误差。
其中,根据第一频域滤波误差E1与第二频域滤波误差E2进行结合生成长度为2N的上一帧的频域滤波误差E1。
在步骤S207中,根据上一帧的滤波系数与上一帧的频域滤波误差获取当前帧的滤波系数。
其中,将再次输入的参考信号x(n)与tukey窗进行卷积计算后在进行快速傅里叶变换可以生成频域参考信号Xw,此时,Xw=F[w1x(n)],w1为长度2N的tukey窗。根据上一帧的频域滤波误差E1与频域参考信号Xw可对滤波系数进行更新,即:
其中,w3=[I1×N,01×N],A(n)是频域归一化因子,A(n)=βA(n-1)+(1-β)|Xw(n)|2
由上可知,由于H(1)为已知向量,可以为用户个人设定的向量,此时y(1)可根据X(1)和H(1)获得。此时e(1)可根据d(1)与y(1)获得。通过对e(1)与w2卷积处理后再进行快速傅里叶变换可以获得频域滤波误差E1。此时,H(2)可根据H(1)与E1获取的。
在步骤S208中,根据上一帧的频域参考信号与当前帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号。
其中,由滤波系数H(n)与频域参考信号X(n)进行卷积操作可以生成滤波信号y(n),即:
其中F-为离散逆傅立叶变换矩阵矩阵,0N为N阶全为0的矩阵,IN为N阶全为1的单位矩阵,j=(-1)0.5
同时,由于上一帧的频域参考信号X(n-1)与当前帧的频域参考信号X(n)中存在部分采样数据重叠,故在输出的滤波信号的相邻两个信号的衔接位置处信号是平滑过渡的,不会生成波形的断裂问题,从而降低临近信道的频谱泄露。
在步骤S209中,将参考信号与滤波信号相减,以得到目标语音信号。
其中,根据获取的滤波信号y(i)可以生成反向信号-y(i),根据参考信号x(i)与反向信号-y(i),生成目标语音信号。此时目标语音信号即为对x(i)进行主动降噪的语音信号。
由上可知,本申请实施例提供的一种语音数据的处理方法,通过获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠;对参考信号进行快速傅里叶变换,以获取频域参考信号;根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号;将参考信号与滤波信号相减,以得到目标语音信号。由于上一帧的频域参考信号与当前帧的频域参考信号中存在部分采样数据重叠且为长度为2N信号,在上述的两个参考信号的衔接位置处信号是平滑过渡的,故使得输出的滤波信号不会生成波形的断裂问题,从而降低临近信道的频谱泄露。
请参阅图3,图3为本申请实施例提供的一种语音信号的处理装置的模块示意图,该装置包括:
获取模块31,用于获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠。
其中,获取模块31获取的参考信号为包含噪声信号的混合信号,期望信号为噪声信号,例如当用户在使用耳机听音乐时,此时参考信号x(i)为耳机内麦克风采集到的播放音乐和噪声的混合信号,期望信号即为耳机外采集到的噪声信号d(i)。
其中,获取模块31获取的参考信号x(i)与期望信号d(i)可以为长度为2N的信号,此时,参考信号x(i)与期望信号d(i)的表达式可以如下:
x(n)=[x(nN-2N+1),···,x(nN)],n为第n帧,N为整数;
d(n)=[d(nN-2N+1),···,d(nN)],n为第n帧,N为整数;
其中,x(n)和x(n-1)与d(n)和d(n-1)有50%的采样数据重叠。
变换模块32,用于对该参考信号进行快速傅里叶变换,以获取频域参考信号。
其中,变换模块32对参考信号x(i)进行快速傅里叶变换,以得到频域参考信号X(n),其中对参考信号x(i)进行快速傅里叶变换的表达式如下:
X(n)=F[x(n)],F为离散傅立叶变换矩阵;
此时,快速傅里叶变换利用蝶形因子(WN)的周期性和对称性,将长度为2N(N为整数)的参考信号x(i),分成两个长度分别为N的子序列,首先分别对两个长度为N的子序列的进行离散傅里叶变换(DFT),在对将经过离散傅里叶变换后的两个长度为N的子序列组合生成频域参考信号X(n)。
处理模块33,用于根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号。
其中,根据上一帧的频域参考信号X(n-1)以及上一帧的滤波系数H(n-1)对当前帧的频域参考信号X(n)进行自适应滤波处理,以得到当前帧的滤波信号y(i),其中,滤波信号y(i)由长度为2N的信号组成,y(n)=[x(nN-2N+1),···,x(nN)],n为第n帧,N为整数。
在一些实施方式中,处理模块33还可包括:第一获取子模块、第二获取子模块及处理子模块。
第一获取子模块,用于获取上一帧的滤波信号与上一帧的期望信号以生成上一帧的频域滤波误差;
第二获取子模块,用于根据上一帧的滤波系数与上一帧的频域滤波误差获取当前帧的滤波系数;
处理子模块,用于根据上一帧的频域参考信号与当前帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理。
目标模块34,用于将参考信号与滤波信号相减,以得到目标语音信号。
由上可知,本申请实施例提供的一种语音数据的处理装置,获取模块31通过获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠;变换模块32对参考信号进行快速傅里叶变换,以获取频域参考信号;处理模块33根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号;目标模块34将参考信号与滤波信号相减,以得到目标语音信号。以实现增大语音信号输入时的收敛速度,同时能降低滤波算法中的频谱泄露。
本申请实施例还提供一种电子设备。请参阅图4,电子设备500包括处理器501以及存储器502。其中,处理器501与存储器502电性连接。
该处理器500是电子设备500的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器502内的计算机程序,以及调用存储在存储器502内的数据,执行电子设备500的各种功能并处理数据,从而对电子设备500进行整体监控。
该存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的计算机程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。
在本申请实施例中,电子设备500中的处理器501会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器502中,并由处理器501运行存储在存储器502中的计算机程序,从而实现各种功能,如下:
获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠;
对该参考信号进行快速傅里叶变换,以获取频域参考信号;
根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号;
将参考信号与滤波信号相减,以得到目标语音信号。
在一些实施方式中,当根据上一帧的参考信号以及滤波系数对当前帧的频域参考信号进行自适应滤波处理时,处理器501可以具体执行以下步骤:
获取上一帧的滤波信号与上一帧的期望信号以生成上一帧的频域滤波误差;
根据上一帧的滤波系数与上一帧的频域滤波误差获取当前帧的滤波系数;
根据上一帧的频域参考信号与当前帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理。
在一些实施方式中,在获取上一帧的滤波信号与上一帧的期望信号以生成上一帧的频域滤波误差时,处理器501可以具体执行以下步骤::
获取上一帧的滤波信号与上一帧的期望信号以生成上一帧的时域滤波误差;
采用对称缓变的窗函数和上一帧的时域滤波误差进行计算,以生成上一帧的频域滤波误差。
在一些实施方式中,在获取多帧的参考信号和期望信号时,处理器501可以具体执行以下步骤:
获取预设长度的多帧参考信号和多帧期望信号;
该采用对称缓变的窗函数对上一帧的时域滤波误差进行处理,以生成上一帧的频域滤波误差的步骤,包括:
获取预设长度的对称缓变的窗函数;
利用该窗函数和上一帧的时域滤波误差进行计算,以得到第一频域滤波误差和第二频域滤波误差,其中滤波误差的长度为预设长度;
根据前一帧的第一频域滤波误差和第二频域滤波误差获取预设长度的上一帧的频域滤波误差。
在一些实施方式中,在生成第一频域滤波误差和第二频域滤波误差时,处理器501可以具体执行以下步骤:
生成与上一帧采样数据重叠相关联的第一频域滤波误差及当前帧的目标采样数据相关联的第二频域滤波误差。
由上可知,本申请实施例提供的电子设备,通过获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠;对参考信号进行快速傅里叶变换,以获取频域参考信号;根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号;将参考信号与滤波信号相减,以得到目标语音信号。由于上一帧的频域参考信号与当前帧的频域参考信号中存在部分采样数据重叠且为长度为2N信号,故在上述的两个参考信号的衔接位置处信号是平滑过渡的,故使得输出的滤波信号不会生成波形的断裂问题,从而降低临近信道的频谱泄露。
请一并参阅图5,在某些实施方式中,电子设备500还可以包括:显示器503、射频电路504、音频电路505以及电源506。其中,其中,显示器503、射频电路504、音频电路505以及电源506分别与处理器501电性连接。
该显示器503可以用于显示由用户输入的信号或提供给用户的信号以及各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示器503可以包括显示面板,在某些实施方式中,可以采用液晶显示器(Liquid CrystalDisplay,LCD)、或者有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板。
该射频电路504可以用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。
该音频电路505可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。
该电源506可以用于给电子设备500的各个部件供电。在一些实施例中,电源506可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图5中未示出,电子设备500还可以包括摄像头、蓝牙模块等,在此不再赘述。
本申请实施例还提供一种存储介质,该存储介质存储有计算机程序,当该计算机程序在计算机上运行时,使得该计算机执行上述任一实施例中的语音信号的处理方法,比如:获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠;对该参考信号进行快速傅里叶变换,以获取频域参考信号;根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号;将参考信号与滤波信号相减,以得到目标语音信号。
在本申请实施例中,存储介质可以是磁碟、光盘、只读存储器(Read Only Memory,ROM,)、或者随机存取记忆体(Random Access Memory,RAM)等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对本申请实施例的语音信号的处理方法而言,本领域普通测试人员可以理解实现本申请实施例的语音信号的处理方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,如存储在电子设备的存储器中,并被该电子设备内的至少一个处理器执行,在执行过程中可包括如语音信号的处理方法的实施例的流程。其中,该的存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。
对本申请实施例的语音信号的处理装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。该集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,该存储介质譬如为只读存储器,磁盘或光盘等。
以上对本申请实施例所提供的一种语音信号的处理方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (8)
1.一种语音信号的处理方法,其特征在于,包括:
获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠;
对所述参考信号进行快速傅里叶变换,以获取频域参考信号;
获取上一帧的滤波信号与上一帧的期望信号以生成上一帧的频域滤波误差;
根据上一帧的滤波系数与上一帧的频域滤波误差获取当前帧的滤波系数;
根据上一帧的频域参考信号与当前帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号;
将参考信号与滤波信号相减,以得到目标语音信号。
2.根据权利要求1所述的方法,其特征在于,所述获取上一帧的滤波信号与上一帧的期望信号以生成上一帧的频域滤波误差的步骤,包括:
获取上一帧的滤波信号与上一帧的期望信号以生成上一帧的时域滤波误差;
采用对称缓变的窗函数和上一帧的时域滤波误差进行计算,以生成上一帧的频域滤波误差。
3.根据权利要求2所述的方法,其特征在于,所述获取多帧的参考信号和期望信号的步骤,包括:
获取预设长度的多帧参考信号和多帧期望信号;
所述采用对称缓变的窗函数对上一帧的时域滤波误差进行处理,以生成上一帧的频域滤波误差的步骤,包括:
获取预设长度的对称缓变的窗函数;
利用所述窗函数和上一帧的时域滤波误差进行计算,以生成第一频域滤波误差和第二频域滤波误差,其中频域滤波误差的长度为预设长度;
根据第一频域滤波误差和第二频域滤波误差获取预设长度的上一帧的频域滤波误差。
4.根据权利要求3所述的方法,其特征在于,所述生成第一频域滤波误差和第二频域滤波误差的步骤,包括:
生成与上一帧采样数据重叠相关联的第一频域滤波误差及当前帧的目标采样数据相关联的第二频域滤波误差。
5.一种语音信号的处理装置,其特征在于,包括:
获取模块,用于获取多帧的参考信号和期望信号,其中前一帧的参考信号和期望信号与后一帧的参考信号和期望信号有部分采样数据重叠;
变换模块,用于对所述参考信号进行快速傅里叶变换,以获取频域参考信号;
处理模块,用于根据上一帧的频域参考信号以及上一帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号;
目标模块,用于将参考信号与滤波信号相减,以得到目标语音信号;
其中,所述处理模块包括:
第一获取子模块,用于获取上一帧的滤波信号与上一帧的期望信号以生成上一帧的频域滤波误差;
第二获取子模块,用于根据上一帧的滤波系数与上一帧的频域滤波误差获取当前帧的滤波系数;
处理子模块,用于根据上一帧的频域参考信号与当前帧的滤波系数对当前帧的频域参考信号进行自适应滤波处理,以得到当前帧的滤波信号。
6.根据权利要求5所述的装置,其特征在于,所述第一获取子模块,具体用于:
获取上一帧的滤波信号与上一帧的期望信号以生成上一帧的时域滤波误差;
采用对称缓变的窗函数和上一帧的时域滤波误差进行计算,以生成上一帧的频域滤波误差。
7.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1至4任一项所述的语音信号的处理方法。
8.一种电子设备,包括处理器和存储器,所述存储器有计算机程序,其特征在于,所述处理器通过调用所述计算机程序,用于执行如权利要求1所述的语音信号的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811641579.4A CN109584898B (zh) | 2018-12-29 | 2018-12-29 | 一种语音信号的处理方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811641579.4A CN109584898B (zh) | 2018-12-29 | 2018-12-29 | 一种语音信号的处理方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109584898A CN109584898A (zh) | 2019-04-05 |
CN109584898B true CN109584898B (zh) | 2022-05-31 |
Family
ID=65932712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811641579.4A Active CN109584898B (zh) | 2018-12-29 | 2018-12-29 | 一种语音信号的处理方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109584898B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112242145A (zh) * | 2019-07-17 | 2021-01-19 | 南京人工智能高等研究院有限公司 | 语音滤波方法、装置、介质和电子设备 |
CN112447166A (zh) * | 2019-08-16 | 2021-03-05 | 阿里巴巴集团控股有限公司 | 一种针对目标频谱矩阵的处理方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6278294B2 (ja) * | 2013-03-11 | 2018-02-14 | 大学共同利用機関法人情報・システム研究機構 | 音声信号処理装置及び方法 |
CN104103278A (zh) * | 2013-04-02 | 2014-10-15 | 北京千橡网景科技发展有限公司 | 一种实时语音去噪的方法和设备 |
CN103871421B (zh) * | 2014-03-21 | 2018-02-02 | 厦门莱亚特医疗器械有限公司 | 一种基于子带噪声分析的自适应降噪方法与系统 |
CN105575397B (zh) * | 2014-10-08 | 2020-02-21 | 展讯通信(上海)有限公司 | 语音降噪方法及语音采集设备 |
CN108010536B (zh) * | 2017-12-05 | 2020-07-14 | 深圳市声扬科技有限公司 | 回声消除方法、装置、系统及存储介质 |
CN109102821B (zh) * | 2018-09-10 | 2021-05-25 | 思必驰科技股份有限公司 | 时延估计方法、系统、存储介质及电子设备 |
-
2018
- 2018-12-29 CN CN201811641579.4A patent/CN109584898B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109584898A (zh) | 2019-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111341336B (zh) | 一种回声消除方法、装置、终端设备及介质 | |
US20200243061A1 (en) | Methods and systems for operating a signal filter device | |
CN111951819A (zh) | 回声消除方法、装置及存储介质 | |
US9866792B2 (en) | Display apparatus and echo cancellation method thereof | |
CN107833579B (zh) | 噪声消除方法、装置及计算机可读存储介质 | |
CN109727607B (zh) | 时延估计方法、装置及电子设备 | |
KR20080005876A (ko) | 시간 및 주파수 도메인에서의 분할 고속 콘볼루션 | |
CN111402917B (zh) | 音频信号处理方法及装置、存储介质 | |
CN110827843A (zh) | 音频处理方法、装置、存储介质及电子设备 | |
CN109584898B (zh) | 一种语音信号的处理方法、装置、存储介质及电子设备 | |
CN108922558B (zh) | 一种语音处理方法、语音处理装置及移动终端 | |
US11822854B2 (en) | Automatic volume adjustment method and apparatus, medium, and device | |
CN111009257A (zh) | 一种音频信号处理方法、装置、终端及存储介质 | |
CN113763977A (zh) | 消除回声信号的方法、装置、计算设备和存储介质 | |
CN112037810B (zh) | 一种回音处理方法、装置、介质和计算设备 | |
CN112997249B (zh) | 语音处理方法、装置、存储介质及电子设备 | |
CN109509482B (zh) | 回声消除方法、回声消除装置、电子设备和可读介质 | |
US11164591B2 (en) | Speech enhancement method and apparatus | |
CN110021289B (zh) | 一种声音信号处理方法、装置及存储介质 | |
CN113489855B (zh) | 声音处理方法、装置、电子设备和存储介质 | |
CN113707170A (zh) | 风噪声抑制方法、电子设备和存储介质 | |
CN112863537B (zh) | 一种音频信号处理方法、装置及存储介质 | |
CN113763975B (zh) | 一种语音信号处理方法、装置及终端 | |
CN105718286A (zh) | 一种信息处理方法及装置、电子设备 | |
CN113421579B (zh) | 声音处理方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |