CN110890099A - 声音信号处理方法、装置以及存储介质 - Google Patents
声音信号处理方法、装置以及存储介质 Download PDFInfo
- Publication number
- CN110890099A CN110890099A CN201811047600.8A CN201811047600A CN110890099A CN 110890099 A CN110890099 A CN 110890099A CN 201811047600 A CN201811047600 A CN 201811047600A CN 110890099 A CN110890099 A CN 110890099A
- Authority
- CN
- China
- Prior art keywords
- signal
- interference
- vector
- sound signal
- obtaining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 127
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 239000013598 vector Substances 0.000 claims abstract description 89
- 238000012545 processing Methods 0.000 claims abstract description 65
- 239000011159 matrix material Substances 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000001914 filtration Methods 0.000 claims description 28
- 230000009466 transformation Effects 0.000 claims description 10
- 230000002452 interceptive effect Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000007613 environmental effect Effects 0.000 abstract description 3
- 230000001629 suppression Effects 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本公开提供了一种声音信号处理方法、装置以及存储介质,涉及信号处理技术领域,其中方法包括:获得与采集的声音信号相对应的干扰信号方位;基于干扰信号方位获得干扰方位导向矢量;获得干扰信号的功率和背景噪声信号的功率,根据干扰信号的功率和背景噪声信号的功率确定干扰权值;根据干扰方位导向矢量和干扰权值确定滤波器的噪声协方差矩阵;使用滤波器并基于噪声协方差矩阵对声音信号进行处理。本公开的方法、装置以及存储介质,能提高信干比,实现对干扰信号和环境噪音的抑制,减少期望信号的失真,对声音信号进行增强处理,提高了声音质量,提升了用户的使用体验。
Description
技术领域
本公开涉及信号处理技术领域,尤其涉及一种声音信号处理方法、装置以及存储介质。
背景技术
声音信号处理技术已经有了巨大的发展和广泛的应用,例如,应用于麦克风阵列基础上的语音增强技术和声源目标探测跟踪是研究和应用的热点之一,国内外已经有一些成熟的产品进入市场如车载对话系统、语音智能音响、电话会议对讲机。对声音信号处理使用MVDR(Minimum Variance Distortionless Response,最小方差无失真响应)等算法进行语音增强,MVDR等算法中的滤波器系数的计算需要用到噪声信号协方差矩阵。对噪声信号协方差矩阵的估计一直是语音增强领域研究的难点,目前采用的方法分为两类,一类是拿接收信号的协方差矩阵代替噪声协方差进行计算;另一类是假设背景噪声为白噪声,拿单位对角矩阵代替噪声协方差进行计算。但是,现有的方法都不能实时准确估计噪声协方差,导致算法性能的下降。特别是在复杂的声环境中,当干扰信号能量比较大时已经不能将其看成背景噪声,如果依旧采用现有的噪声协方差估计方法必然会降低语音增强效果。
发明内容
有鉴于此,本公开要解决的一个技术问题是提供一种声音信号处理方法、装置以及存储介质。
根据本公开的一个方面,提供一种声音信号处理方法,包括:获得与采集的声音信号相对应的干扰信号方位;基于所述干扰信号方位获得干扰方位导向矢量;获得干扰信号的功率和背景噪声信号的功率,根据所述干扰信号的功率和所述背景噪声信号的功率确定干扰权值;根据所述干扰方位导向矢量和所述干扰权值确定滤波器的噪声协方差矩阵;使用所述滤波器并基于所述噪声协方差矩阵对所述声音信号进行处理。
可选地,获得滤波器的噪声协方差矩阵
可选地,所述使用所述滤波器并基于所述噪声协方差矩阵对所述声音信号进行处理包括:获得与采集的声音信号相对应的期望信号方位;基于所述期望信号方位获得期望信号方位导向矢量;根据所述噪声协方差矩阵和所述期望信号方位导向矢量获得所述滤波器的加权向量;使用所述滤波器并基于所述加权向量对所述声音信号进行滤波处理。
可选地,获得所述滤波器的加权向量
其中,w为所述加权向量,Rn为所述噪声协方差矩阵,A为所述期望信号方位导向矢量。
可选地,当声音采集装置的采集通道采集到预设长度的时域上的声音信号时,对时域上的声音信号进行时频变换处理,获得频域上的声音信号以及相应的频点;所述使用所述滤波器并基于所述加权向量对所述声音信号进行滤波处理包括:获得在所述频点处的滤波系数,使用所述滤波器并基于所述加权向量和所述滤波系数对频域上的声音信号进行频域滤波处理;将进行了频域滤波处理的频域上的声音信号进行反时频变换处理,获得滤波后的时域上的声音信号。
可选地,对频域上的声音信号进行频域滤波处理为:
根据本公开的另一方面,提供一种声音信号处理装置,包括:干扰方位获得模块,用于获得与采集的声音信号相对应的干扰信号方位;干扰导向获得模块,用于基于所述干扰信号方位获得干扰方位导向矢量;干扰权值确定模块,用于获得干扰信号的功率和背景噪声信号的功率,根据所述干扰信号的功率和所述背景噪声信号的功率确定干扰权值;协方差获得模块,用于根据所述干扰方位导向矢量和所述干扰权值确定滤波器的噪声协方差矩阵;信号处理模块,用于使用所述滤波器并基于所述噪声协方差矩阵对所述声音信号进行处理。
可选地,所述协方差获得模块,用于获得滤波器的噪声协方差矩阵
可选地,期望方位获得模块,用于获得与采集的声音信号相对应的期望信号方位;期望导向获得模块,用于基于所述期望信号方位获得期望信号方位导向矢量;加权向量获得模块,用于根据所述噪声协方差矩阵和所述期望信号方位导向矢量获得所述滤波器的加权向量;所述信号处理模块,用于使用所述滤波器并基于所述加权向量对所述声音信号进行滤波处理。
可选地,所述加权向量获得模块,用于获得所述滤波器的加权向量
其中,w为所述加权向量,Rn为所述噪声协方差矩阵,A为所述期望信号方位导向矢量。
可选地,时频变换模块,用于当声音采集装置的采集通道采集到预设长度的时域上的声音信号时,对时域上的声音信号进行时频变换处理,获得频域上的声音信号以及相应的频点;所述信号处理模块,用于获得在所述频点处的滤波系数,使用所述滤波器并基于所述加权向量和所述滤波系数对频域上的声音信号进行频域滤波处理;所述时频变换模块,还用于将进行了频域滤波处理的频域上的声音信号进行反时频变换处理,获得滤波后的时域上的声音信号。
可选地,所述信号处理模块,用于对频域上的声音信号进行频域滤波处理为:
根据本公开的又一方面,提供一种声音信号处理装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上所述的方法。
根据本公开的再一方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行如上所述的方法。
本公开的声音信号处理方法、装置以及存储介质,获得与采集的声音信号相对应的干扰信号方位以及干扰方位导向矢量,根据干扰信号的功率和背景噪声信号的功率确定干扰权值,根据干扰方位导向矢量和干扰权值确定滤波器的噪声协方差矩阵,基于噪声协方差矩阵对声音信号进行处理;提出了新的噪声协方差估计方法,能提高信干比,实现对干扰信号和环境噪音的抑制,减少期望信号的失真,对声音信号进行增强处理,提高了声音质量,提升了用户的使用体验。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本公开的声音信号处理方法的一个实施例的流程示意图;
图2为根据本公开的声音信号处理方法的一个实施例中的进行滤波处理的流程示意图;
图3为根据本公开的声音信号处理方法的一个实施例中的对声音信号进行处理的流程示意图;
图4为根据本公开的声音信号处理方法的另一个实施例的流程示意图;
图5为根据本公开的声音信号处理装置的一个实施例的模块示意图;
图6为根据本公开的声音信号处理装置的另一个实施例的模块示意图;
图7为根据本公开的声音信号处理装置的又一个实施例的模块示意图。
具体实施方式
下面参照附图对本公开进行更全面的描述,其中说明本公开的示例性实施例。下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。下面结合各个图和实施例对本公开的技术方案进行多方面的描述。
图1为根据本公开的声音信号处理方法的一个实施例的流程示意图,如图1所示:
步骤101,获得与采集的声音信号相对应的干扰信号方位。
使用声音采集装置采集声音信号,声音采集装置包括麦克风单元,麦克风单元可以为麦克风单体或阵列麦克风等,阵列麦克风通常由一组按特定方式排列的声传感器组成。使用声音采集装置采集的声音信号中包括期望信号、干扰信号和背景噪声信号。
利用定位算法计算出采集到的声音信号的期望信号方位和干扰信号方位,期望信号方位和干扰信号方位包括水平角、俯仰角等。定位算法可以有多种,例如TDOA(TimeDifference Of Arrival,到达时间差)算法等。TDOA定位是一种利用时间差进行定位的方法,通过测量信号到达监测点的时间,可以确定信号源的距离,利用信号源到各个监测点的距离(以监测点为中心,距离为半径作圆),就能确定信号的位置。
利用麦克风阵列并基于TDOA算法可以计算出声源距离麦克风阵列的角度和距离,实现对目标声源的跟踪。通过波束形成技术,即在期望方向上有效地形成一个波束,仅拾取波束的信号,从而达到同时提取声源和抑制噪声的目的。
步骤102,基于干扰信号方位获得干扰方位导向矢量。
步骤103,获得干扰信号的功率和背景噪声信号的功率,根据干扰信号的功率和背景噪声信号的功率确定干扰权值。干扰权值可以为干扰信号的功率和背景噪声信号的功率的比值,或者为干扰信号的功率和背景噪声信号的功率的比值与预设权值的乘积等。
步骤104,根据干扰方位导向矢量和干扰权值确定滤波器的噪声协方差矩阵。
本实施例可采用多种滤波器,例如LMS(Least Mean Square,最小均方)滤波器、LCMV(线性约束最小方差,linearly constrained Minimum Variance)滤波器、MVDR滤波器等,优选地,本实施例的滤波器为MVDR滤波器。MVDR算法在保持期望信号响应不变的情况下使输出功率最小,且对信号模型的失配不是很敏感,不需要精准的获知期望信号方位,能让期望信号无失真输出,且噪声方差最小。
步骤105,使用滤波器并基于噪声协方差矩阵对声音信号进行处理。
上述实施例中的声音信号处理方法,通过新的噪声协方差估计方法,在有干扰信号的声环境中,能提高信干比(期望信号与干扰信号的能量比),实现对干扰信号以及环境噪声信号的抑制。
在一个实施例中,在存在干扰信号的声环境下,建立包含干扰信号的阵列信号接收模型,假设目标信号、干扰信号、环境噪声信号互不相关,可以推导出噪声协方差矩阵。获得滤波器的噪声协方差矩阵
其中,Rn为噪声协方差矩阵,为干扰信号的功率,为背景噪声信号的功率,干扰权值为和的比值,D为干扰方位导向矢量,I是单位对角矩阵,为背景噪声的协方差矩阵。由于干扰信号的功率和背景噪声信号的功率通常比较难确定,可以基于不同的语音环境对和的比值根据经验设置一个固定值。
图2为根据本公开的声音信号处理方法的一个实施例中的进行滤波处理的流程示意图,如图2所示:
步骤201,获得与采集的声音信号相对应的期望信号方位。期望信号方位可以包括水平角和俯仰角等。
步骤202,基于期望信号方位获得期望信号方位导向矢量。
步骤203,根据噪声协方差矩阵和期望信号方位导向矢量获得滤波器的加权向量。
步骤204,使用滤波器并基于加权向量对声音信号进行滤波处理。
在一个实施例中,获得滤波器的加权向量
其中,w为加权向量,Rn为噪声协方差矩阵,A为期望信号方位导向矢量。
图3为根据本公开的声音信号处理方法的一个实施例中的对声音信号进行处理的流程示意图,如图3所示:
步骤301,当声音采集装置的采集通道采集到预设长度的时域上的声音信号时,对时域上的声音信号进行时频变换处理,获得频域上的声音信号以及相应的频点。进行时频变换处理可以采用快速傅里叶变化等。
步骤302,获得在频点处的滤波系数,使用滤波器并基于加权向量和滤波系数对频域上的声音信号进行频域滤波处理。
步骤303,将进行了频域滤波处理的频域上的声音信号进行反时频变换处理,获得滤波后的时域上的声音信号。
图4为根据本公开的声音信号处理方法的另一个实施例的流程示意图,如图4所示:
步骤401,对麦克风阵列采集的声音信号进行分帧处理,获得每帧声音信号数据。
步骤402,对麦克风阵列的每个通道数据做傅里叶变换。
麦克风阵列具有M个阵元,即M个麦克风通道。当每个麦克风通道采集到长度为nfft的声音信号时进行一次傅里叶变换。nfft为2的指数倍,以便于对声音信号进行快速傅里叶变换。麦克风阵列接收到的时域上的声音信号数据用ym表示,频域上的声音信号数据用Ym表示。
步骤403,利用定位算法获取期望信号方位、干扰信号方位。
步骤404,计算期望信号方位导向矢量、干扰方位导向矢量。
可以利用下面的公式1-5计算出声音信号的期望信号方位导向矢量、干扰方位导向矢量。
期望信号方位导向矢量计算公式:
干扰方位导向矢量计算公式:
步骤405,计算噪声协方差矩阵。可以使用公式(1-1)估计出噪声协方差矩阵。
步骤406,计算滤波器系数。可以使用公式(1-2)计算出滤波器的加权向量,滤波器可以为MVDR滤波器等。
步骤407,对频域数据进行滤波。可以使用公式(1-8)完成频域滤波:
步骤408,将滤波后的信号做傅里叶反变换,得到该帧处理后的时域信号:
返回到401步骤,进行循环处理。
在一个实施例中,如图5所示,本公开提供一种声音信号处理装置50,包括:干扰方位获得模块51、干扰导向获得模块52、干扰权值确定模块53、协方差获得模块54和信号处理模块55。
干扰方位获得模块51获得与采集的声音信号相对应的干扰信号方位。干扰导向获得模块52基于干扰信号方位获得干扰方位导向矢量。干扰权值确定模块53获得干扰信号的功率和背景噪声信号的功率,根据干扰信号的功率和背景噪声信号的功率确定干扰权值。协方差获得模块54根据干扰方位导向矢量和干扰权值确定滤波器的噪声协方差矩阵。信号处理模块55使用滤波器并基于噪声协方差矩阵对声音信号进行处理。
协方差获得模块54获得滤波器的噪声协方差矩阵
在一个实施例中,如图6所示,声音信号处理装置50包括:期望方位获得模块56、期望导向获得模块57、加权向量获得模块58和时频变换模块59。
期望方位获得模块56获得与采集的声音信号相对应的期望信号方位。期望导向获得模块57基于期望信号方位获得期望信号方位导向矢量。加权向量获得模块58根据噪声协方差矩阵和期望信号方位导向矢量获得滤波器的加权向量。信号处理模块55使用滤波器并基于加权向量对声音信号进行滤波处理。
加权向量获得模块58获得滤波器的加权向量
其中,w为加权向量,Rn为噪声协方差矩阵,A为期望信号方位导向矢量。
在一个实施例中,当声音采集装置的采集通道采集到预设长度的时域上的声音信号时,时频变换模块59对时域上的声音信号进行时频变换处理,获得频域上的声音信号以及相应的频点。信号处理模块55获得在频点处的滤波系数,使用滤波器并基于加权向量和滤波系数对频域上的声音信号进行频域滤波处理。时频变换模块59将进行了频域滤波处理的频域上的声音信号进行反时频变换处理,获得滤波后的时域上的声音信号。
图7为根据本公开的声音信号处理装置的又一个实施例的模块示意图。如图7所示,该装置可包括存储器71、处理器72、通信接口73以及总线74。存储器71用于存储指令,处理器72耦合到存储器71,处理器72被配置为基于存储器71存储的指令执行实现上述的声音信号处理方法。
存储器71可以为高速RAM存储器、非易失性存储器(non-volatile memory)等,存储器71也可以是存储器阵列。存储器71还可能被分块,并且块可按一定的规则组合成虚拟卷。处理器72可以为中央处理器CPU,或专用集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本公开的声音信号处理方法的一个或多个集成电路。
在一个实施例中,本公开提供一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如上任一个实施例中的声音信号处理方法。
上述实施例中的声音信号处理方法、装置以及存储介质,获得与采集的声音信号相对应的干扰信号方位以及干扰方位导向矢量,根据干扰信号的功率和背景噪声信号的功率确定干扰权值,根据干扰方位导向矢量和干扰权值确定滤波器的噪声协方差矩阵,基于噪声协方差矩阵对声音信号进行处理;提出了新的噪声协方差估计方法,在有干扰信号的声环境中,能提高信干比,实现对干扰信号的抑制,减少期望信号的失真,对声音信号进行增强处理,提高了声音质量,提升了用户的使用体验。
可能以许多方式来实现本公开的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和系统。用于方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
本公开的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本公开限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本公开的原理和实际应用,并且使本领域的普通技术人员能够理解本公开从而设计适于特定用途的带有各种修改的各种实施例。
Claims (12)
1.一种声音信号处理方法,包括:
获得与采集的声音信号相对应的干扰信号方位;
基于所述干扰信号方位获得干扰方位导向矢量;
获得干扰信号的功率和背景噪声信号的功率,根据所述干扰信号的功率和所述背景噪声信号的功率确定干扰权值;
根据所述干扰方位导向矢量和所述干扰权值确定滤波器的噪声协方差矩阵;
使用所述滤波器并基于所述噪声协方差矩阵对所述声音信号进行处理。
3.如权利要求1所述的方法,所述使用所述滤波器并基于所述噪声协方差矩阵对所述声音信号进行处理包括:
获得与采集的声音信号相对应的期望信号方位;
基于所述期望信号方位获得期望信号方位导向矢量;
根据所述噪声协方差矩阵和所述期望信号方位导向矢量获得所述滤波器的加权向量;
使用所述滤波器并基于所述加权向量对所述声音信号进行滤波处理。
5.如权利要求3所述的方法,还包括:
当声音采集装置的采集通道采集到预设长度的时域上的声音信号时,对时域上的声音信号进行时频变换处理,获得频域上的声音信号以及相应的频点;
所述使用所述滤波器并基于所述加权向量对所述声音信号进行滤波处理包括:
获得在所述频点处的滤波系数,使用所述滤波器并基于所述加权向量和所述滤波系数对频域上的声音信号进行频域滤波处理;
将进行了频域滤波处理的频域上的声音信号进行反时频变换处理,获得滤波后的时域上的声音信号。
6.一种声音信号处理装置,包括:
干扰方位获得模块,用于获得与采集的声音信号相对应的干扰信号方位;
干扰导向获得模块,用于基于所述干扰信号方位获得干扰方位导向矢量;
干扰权值确定模块,用于获得干扰信号的功率和背景噪声信号的功率,根据所述干扰信号的功率和所述背景噪声信号的功率确定干扰权值;
协方差获得模块,用于根据所述干扰方位导向矢量和所述干扰权值确定滤波器的噪声协方差矩阵;
信号处理模块,用于使用所述滤波器并基于所述噪声协方差矩阵对所述声音信号进行处理。
8.如权利要求6所述的装置,包括:
期望方位获得模块,用于获得与采集的声音信号相对应的期望信号方位;
期望导向获得模块,用于基于所述期望信号方位获得期望信号方位导向矢量;
加权向量获得模块,用于根据所述噪声协方差矩阵和所述期望信号方位导向矢量获得所述滤波器的加权向量;
所述信号处理模块,用于使用所述滤波器并基于所述加权向量对所述声音信号进行滤波处理。
10.如权利要求8所述的装置,还包括:
时频变换模块,用于当声音采集装置的采集通道采集到预设长度的时域上的声音信号时,对时域上的声音信号进行时频变换处理,获得频域上的声音信号以及相应的频点;
所述信号处理模块,用于获得在所述频点处的滤波系数,使用所述滤波器并基于所述加权向量和所述滤波系数对频域上的声音信号进行频域滤波处理;
所述时频变换模块,还用于将进行了频域滤波处理的频域上的声音信号进行反时频变换处理,获得滤波后的时域上的声音信号。
11.一种声音信号处理装置,包括:
存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1至5中任一项所述的方法。
12.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行如权利要求1至5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811047600.8A CN110890099B (zh) | 2018-09-10 | 2018-09-10 | 声音信号处理方法、装置以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811047600.8A CN110890099B (zh) | 2018-09-10 | 2018-09-10 | 声音信号处理方法、装置以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110890099A true CN110890099A (zh) | 2020-03-17 |
CN110890099B CN110890099B (zh) | 2023-09-22 |
Family
ID=69744859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811047600.8A Active CN110890099B (zh) | 2018-09-10 | 2018-09-10 | 声音信号处理方法、装置以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110890099B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112447184A (zh) * | 2020-11-10 | 2021-03-05 | 北京小米松果电子有限公司 | 语音信号处理方法及装置、电子设备、存储介质 |
CN112880812A (zh) * | 2021-01-19 | 2021-06-01 | 广州特种机电设备检测研究院 | 扶梯故障检测方法、系统和存储介质 |
CN113782046A (zh) * | 2021-09-09 | 2021-12-10 | 清华大学 | 一种用于远距离语音识别的麦克风阵列拾音方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060133211A1 (en) * | 2004-12-17 | 2006-06-22 | Yang Tsih C | Method and apparatus for acoustic source tracking using a horizontal line array |
CN103364769A (zh) * | 2013-07-05 | 2013-10-23 | 南京邮电大学 | 空间非均匀海杂波协方差矩阵的自适应估计方法 |
CN103778102A (zh) * | 2014-01-15 | 2014-05-07 | 河南科技大学 | 基于干扰噪声矩阵重构的自适应波束形成方法 |
CN104502896A (zh) * | 2014-12-31 | 2015-04-08 | 电子科技大学 | 一种干扰协方差矩阵稳健重构方法 |
CN107167778A (zh) * | 2017-07-03 | 2017-09-15 | 电子科技大学 | 一种基于协方差矩阵重构和导向矢量估计的稳健波束形成方法 |
-
2018
- 2018-09-10 CN CN201811047600.8A patent/CN110890099B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060133211A1 (en) * | 2004-12-17 | 2006-06-22 | Yang Tsih C | Method and apparatus for acoustic source tracking using a horizontal line array |
CN103364769A (zh) * | 2013-07-05 | 2013-10-23 | 南京邮电大学 | 空间非均匀海杂波协方差矩阵的自适应估计方法 |
CN103778102A (zh) * | 2014-01-15 | 2014-05-07 | 河南科技大学 | 基于干扰噪声矩阵重构的自适应波束形成方法 |
CN104502896A (zh) * | 2014-12-31 | 2015-04-08 | 电子科技大学 | 一种干扰协方差矩阵稳健重构方法 |
CN107167778A (zh) * | 2017-07-03 | 2017-09-15 | 电子科技大学 | 一种基于协方差矩阵重构和导向矢量估计的稳健波束形成方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112447184A (zh) * | 2020-11-10 | 2021-03-05 | 北京小米松果电子有限公司 | 语音信号处理方法及装置、电子设备、存储介质 |
CN112880812A (zh) * | 2021-01-19 | 2021-06-01 | 广州特种机电设备检测研究院 | 扶梯故障检测方法、系统和存储介质 |
CN113782046A (zh) * | 2021-09-09 | 2021-12-10 | 清华大学 | 一种用于远距离语音识别的麦克风阵列拾音方法及系统 |
CN113782046B (zh) * | 2021-09-09 | 2024-09-17 | 清华大学 | 一种用于远距离语音识别的麦克风阵列拾音方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110890099B (zh) | 2023-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3703052B1 (en) | Echo cancellation method and apparatus based on time delay estimation | |
JP7011075B2 (ja) | マイク・アレイに基づく対象音声取得方法及び装置 | |
CN106251877B (zh) | 语音声源方向估计方法及装置 | |
WO2015196729A1 (zh) | 一种麦克风阵列语音增强方法及装置 | |
US20150310857A1 (en) | Apparatus and method for providing an informed multichannel speech presence probability estimation | |
CN110610718B (zh) | 一种提取期望声源语音信号的方法及装置 | |
CN109285557B (zh) | 一种定向拾音方法、装置及电子设备 | |
CN110890099B (zh) | 声音信号处理方法、装置以及存储介质 | |
KR20170053623A (ko) | 사운드 소스들을 향상시키기 위한 방법 및 장치 | |
CN107369460B (zh) | 基于声学矢量传感器空间锐化技术的语音增强装置及方法 | |
CN105989850B (zh) | 一种回声对消方法及装置 | |
WO2015106401A1 (zh) | 语音处理方法和语音处理装置 | |
CN108538306A (zh) | 提高语音设备doa估计的方法及装置 | |
CN113687305A (zh) | 声源方位的定位方法、装置、设备及计算机可读存储介质 | |
CN107393549A (zh) | 时延估计方法及装置 | |
CN113903353A (zh) | 一种基于空间区分性检测的定向噪声消除方法及装置 | |
CN110111802A (zh) | 基于卡尔曼滤波的自适应去混响方法 | |
CN105957536B (zh) | 基于通道聚合度频域回声消除方法 | |
JPWO2018037643A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN114242104A (zh) | 语音降噪的方法、装置、设备及存储介质 | |
CN113744752A (zh) | 语音处理方法及装置 | |
Zheng et al. | BSS for improved interference estimation for blind speech signal extraction with two microphones | |
CN116106826A (zh) | 声源定位方法、相关装置和介质 | |
CN113948101B (zh) | 一种基于空间区分性检测的噪声抑制方法及装置 | |
CN107919136B (zh) | 一种基于高斯混合模型的数字语音采样频率估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |