CN111063366A - 降低噪声的方法、装置、电子设备及可读存储介质 - Google Patents

降低噪声的方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN111063366A
CN111063366A CN201911368908.7A CN201911368908A CN111063366A CN 111063366 A CN111063366 A CN 111063366A CN 201911368908 A CN201911368908 A CN 201911368908A CN 111063366 A CN111063366 A CN 111063366A
Authority
CN
China
Prior art keywords
sound signal
signal
sound
frequency domain
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911368908.7A
Other languages
English (en)
Inventor
康力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ziguang Zhanrui (chongqing) Technology Co Ltd
Unisoc Chongqing Technology Co Ltd
Original Assignee
Ziguang Zhanrui (chongqing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ziguang Zhanrui (chongqing) Technology Co Ltd filed Critical Ziguang Zhanrui (chongqing) Technology Co Ltd
Priority to CN201911368908.7A priority Critical patent/CN111063366A/zh
Priority to EP20905296.8A priority patent/EP4075431A4/en
Priority to PCT/CN2020/086639 priority patent/WO2021128670A1/zh
Publication of CN111063366A publication Critical patent/CN111063366A/zh
Priority to US17/850,936 priority patent/US20220328058A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请实施例提供一种降低噪声的方法、装置、电子设备及可读存储介质,应用于电子设备上,该电子设备包括第一声音采集器和第二声音采集器,第一声音采集器和第二声音采集器的安装位置不同;上述方法包括:基于第一声音采集器采集到的第一声音信号与第二声音采集器采集到的第二声音信号,确定出期望声音信号与干扰声音信号,基于该干扰声音信号,对期望声音信号进行相干噪声消除处理,得到第三声音信号,然后再根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。本申请实施例不仅能够有效的降低目标声音信号中的噪声,还能有效保证目标声音信号中的语音不失真。

Description

降低噪声的方法、装置、电子设备及可读存储介质
技术领域
本申请实施例涉及降噪技术领域,尤其涉及一种降低噪声的方法、装置、电子设备及可读存储介质。
背景技术
随着科技的发展,人们对生活品质的要求越来越高,通过电子产品来进行语音通信、语音交互的方式也已越来越普遍。
当电子设备处于嘈杂的环境中时,周围环境的噪声会对电子设备采集到的语音质量造成较大影响,影响语音通信质量或语音交互过程,降低了用户体验和沟通效率。例如,在实时语音通信过程中,周围的环境噪声总会不可避免的被语音发送端采集到,若不对语音发送端采集到的语音信号进行处理就发送至语音接收端,则语音接收端用户就会受到这些环境噪声的干扰,影响正常交流,若处理不当则反而会使语音发送端发送的语音信息失真,影响语音的可懂度。再例如,在人机交互领域,若不对电子设备采集到的语音信号进行处理就进行语音识别,则会影响语音识别的准确率,出现错误的响应。
因此,目前亟需一种降低噪声的方法,能够在有效抑制噪声的同时,还能保证语音不失真。
发明内容
本申请实施例提供一种降低噪声的方法、装置、电子设备及可读存储介质,可以在有效抑制噪声的同时,还能保证语音不失真。
第一方面,本申请实施例提供一种降低噪声的方法,该方法可应用于电子设备上,所述电子设备包括第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同,所述方法包括:
获取所述第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号;
根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号;
基于所述干扰声音信号,对所述期望声音信号进行相干噪声消除处理,得到第三声音信号;
根据所述第三声音信号中存在语音的概率,对所述第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
在一种可能的设计中,所述根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号,包括:
确定所述第一声音信号在频域上的第一频域信号,以及所述第二声音信号在频域上的第二频域信号;
对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号与所述干扰声音信号。
在一种可能的设计中,所述对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号与所述干扰声音信号,包括:
确定所述第一声音信号的采集时刻与所述第二声音信号的采集时刻之间的延迟时长;
根据所述延迟时长,利用固定波束形成滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号,利用阻塞矩阵滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述干扰声音信号。
在一种可能的设计中,所述根据所述延迟时长,利用固定波束形成滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号,利用阻塞矩阵滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述干扰声音信号,包括:
按照以下公式计算所述期望声音信号Fout(ω):
Figure BDA0002339158710000021
按照以下公式计算所述干扰声音信号Bout(ω):
Figure BDA0002339158710000022
或者,
按照以下公式计算所述期望声音信号Fout(ω):
Figure BDA0002339158710000031
按照以下公式计算所述干扰声音信号Bout(ω):
Figure BDA0002339158710000032
其中,X1(ω)表示所述第一频域信号,X2(ω)表示所述第二频域信号,τ表示所述延迟时长。
在一种可能的设计中,所述根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号,包括:
确定所述第一声音信号在频域上的第一频域信号,与所述第二声音信号在频域上的第二频域信号;
将所述第一频域信号确定为所述期望声音信号,将所述第二频域信号确定为所述干扰声音信号;或者,
将所述第二频域信号确定为所述期望声音信号,将所述第一频域信号确定为所述干扰声音信号。
在一种可能的设计中,所述基于所述干扰声音信号,对所述期望声音信号进行相干噪声消除处理,得到第三声音信号,包括:
利用以下公式计算得到所述第三声音信号YD(k):
YD(k)=Fout(k)-W(k)·Bout(k);
其中,Fout(k)表示所述期望声音信号,Bout(k)表示所述干扰声音信号,k表示第k个频点,W(k)表示自适应滤波系数,且:
Figure BDA0002339158710000033
其中,μ0表示更新步长,μSIR表示可变更新步长,所述可变更新步长μSIR随所述期望声音信号与所述干扰声音信号的功率比值的变化而变化,δ为预设参数,Bout(k)YD(k)*表示所述干扰声音信号Bout(k)和所述第三声音信号YD(k)的共轭相关。
在一种可能的设计中,所述根据所述第三声音信号中存在语音的概率,对所述第三声音信号进行非相干噪声抑制处理,包括:
确定所述第三声音信号对应的平滑功率谱;
根据所述平滑功率谱,确定所述第三声音信号对应的先验语音不存在概率;
根据所述先验语音不存在概率,确定所述第三声音信号对应的后验语音存在概率;
利用所述后验语音存在概率,确定所述第三声音信号中存在的非相干噪声信号,并根据所述非相干噪声信号确定所述第三声音信号对应的有效增益函数;
利用所述有效增益函数,对所述第三声音信号进行非相干噪声抑制处理。
第二方面,本申请实施例提供一种降低噪声的装置,该装置应用于电子设备,该电子设备包括第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同,所述装置包括:
获取模块,用于获取所述第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号;
确定模块,用于根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号;
相干处理模块,基于所述干扰声音信号,对所述期望声音信号进行相干噪声消除处理,得到第三声音信号;
非相干处理模块,根据所述第三声音信号中存在语音的概率,对所述第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
在一种可能的设计中,所述确定模块具体包括:
第一确定模块,用于确定所述第一声音信号在频域上的第一频域信号,以及所述第二声音信号在频域上的第二频域信号;
空间滤波模块,用于对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号与所述干扰声音信号。
在一种可能的设计中,所述确定模块具体包括:
第二确定模块,用于确定所述第一声音信号在频域上的第一频域信号,与所述第二声音信号在频域上的第二频域信号;
第三确定模块,用于将所述第一频域信号确定为所述期望声音信号,将所述第二频域信号确定为所述干扰声音信号;或者,
将所述第二频域信号确定为所述期望声音信号,将所述第一频域信号确定为所述干扰声音信号。
在一种可能的设计中,所述非相干处理模块具体包括:
第一计算模块,用于确定所述第三声音信号对应的平滑功率谱;
第二计算模块,用于根据所述平滑功率谱,确定所述第三声音信号对应的先验语音不存在概率;
第三计算模块,用于根据所述先验语音不存在概率,确定所述第三声音信号对应的后验语音存在概率;
增益确定模块,用于利用所述后验语音存在概率确定所述第三声音信号中存在的非相干噪声信号,并根据所述非相干噪声信号确定所述第三声音信号对应的有效增益函数;
噪声抑制模块,用于利用所述有效增益函数,对所述第三声音信号进行非相干噪声抑制处理。
第三方面,本申请实施例提供一种电子设备,包括:至少一个处理器和存储器,以及第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面提供的降低噪声的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面提供的降低噪声的方法。
本申请实施例所提供的降低噪声的方法、装置、电子设备及可读存储介质,采用了第一声音采集器与第二声音采集器,来确定期望声音信号与干扰声音信号,并基于干扰声音信号来对期望声音信号进行相干噪声消除处理,得到第三声音信号,然后再根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。即在本申请实施例中,基于干扰声音信号,来对期望声音信号进行相干噪声消除处理,以及对相干噪声消除处理后的第三声音信号再次进行非相干噪声处理,可以有效降低目标声音信号中的噪声;另外,由于在进行非相干噪声抑制处理时,对第三声音信号中存在语音的概率进行了估计,使得在进行非相干噪声抑制处理时,还能有效保证语音不失真。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的降低噪声的方法的流程示意图一;
图2为本申请实施例中声音采集器采集到的声音在空间上的分布示意图;
图3为本申请实施例提供的降低噪声的方法的流程示意图二;
图4a为本申请实施例中降低噪声的方法中的空间滤波示意图一;
图4b为本申请实施例中降低噪声的方法中的空间滤波示意图二;
图5为本申请实施例中期望声音信号的波束示意图;
图6为本申请实施例中干扰声音信号的波束示意图;
图7为本申请实施例提供的降低噪声的方法的流程示意图二;
图8为本申请实施例提供的降低噪声的装置的程序模块示意图
图9为本申请实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种降低噪声的方法,该方法应用于电子设备上,该电子设备包括第一声音采集器和第二声音采集器,第一声音采集器和第二声音采集器的安装位置不同。
在一种可行的实施方式中,电子设备在正常使用时,第一声音采集器处于靠近人体嘴的位置,第二声音采集器处于远离人体嘴的位置。
在另一种可行的实施方式中,电子设备在正常使用时,第一声音采集器处于远离人体嘴的位置,第二声音采集器处于靠近人体嘴的位置。
其中,上述电子设备可以包括手机、平板电脑、智能手表等移动终端,也可以包括耳机、智能音响、电视机、车载终端等,本申请实施例在此不做限制,只要上述电子设备具备声音采集功能即可。
其中,上述电子设备可以包括两个声音采集器,即第一声音采集器和第二声音采集器;也可以包括两个以上声音采集器。本申请实施例所描述的声音采集器可以是麦克风阵列,也可以是其它具有声音采集功能的器件。
可选的,上述降低噪声的方法的应用场景包括无线耳机场景,例如,用户在佩戴无线耳机时,通过无线耳机来与其他用户进行语音通话的场景。
可选的,上述降低噪声的方法的应用场景还包括手持移动终端场景,例如,用户手持移动终端时,将嘴靠近第一声音采集器来与其他用户进行语音通话的场景。
参照图1,图1为本申请实施例提供的降低噪声的方法的流程示意图一,本实施例的执行主体可以为图1所示实施例中的电子设备,该方法包括:
S101、获取第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号。
在本申请实施例中,当电子设备进入通话模式或者语音交互模式时,第一声音采集器与第二声音采集器同时采集周围环境的中的声音,然后电子设备会获取第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号。
S102、根据第一声音信号与第二声音信号,确定出期望声音信号与干扰声音信号。
在本申请实施例中,声音采集器在采集声音的过程中,会接收到来自各个方向的声音,包括近场噪声与远场噪声。为了更好的理解本申请实施例,参照图2,图2为本申请实施例中声音采集器采集到的声音在空间上的分布示意图。
在图2中,声音采集器采用全指向的麦克风阵列,在采集声音的过程中,对于距离麦克风阵列较近的噪声源,其噪声的传播路径以直达路径为主,可以看成是点源噪声,常见的有周围的人说话产生的干扰等,视为近场干扰。而距离较远的噪声源,其传播路径以多径反射和混响为主,可以看成是扩散场噪声,常见的有人群的噪声,车辆噪声等,视为远场噪声。其中,近场的点源噪声具有较强的指向性,即麦克风阵列接收到特定方向的噪声能量远远大于其他方向的噪声能量。远场的扩散场噪声,不具有明显的指向性,即从各个方向到达麦克风阵列的噪声能量差别不大。
本实施例中,上述麦克风阵列的期望方向是固定的,在第一声音采集器处于靠近人体嘴的位置时,对于近场的点源噪声,可以利用麦克风阵列的指向性,对第一声音信号与第二声音信号进行空间滤波,增强第一声音信号中来自期望方向的声音信号,衰减其它方向的声音信号,来得到期望声音信号;以及衰减第二声音信号中来自期望方向的声音信号,增强其它方向的声音信号,来得到干扰声音信号。
另外,在第二声音采集器处于靠近人体嘴的位置时,也可以对第一声音信号与第二声音信号进行空间滤波,增强第二声音信号中来自期望方向的声音信号,衰减其它方向的声音信号,来得到期望声音信号;衰减第一声音信号中来自期望方向的声音信号,增强其它方向的声音信号,来得到干扰声音信号。
S103、基于干扰声音信号,对期望声音信号进行相干噪声消除处理,得到第三声音信号。
本实施例中,在得到上述期望声音信号与干扰声音信号之后,即可基于该干扰声音信号对期望声音信号进行相干噪声消除处理,衰减期望声音信号中的干扰声音信号,进而得到第三声音信号。
S104、根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
在实际场景中,在对期望声音信号进行相干噪声消除处理后,得到的第三声音信号中还会有大量的非相干噪声需要抑制。本实施例中,为了在进行非相干噪声抑制处理时,减少对第三声音信号中语音信号的影响,先确定出第三声音信号中存在语音的概率,然后根据该概率,对第三声音信号进行非相干噪声抑制处理,进而得到目标声音信号。
其中,如果存在语音的概率较大,说明第三声音信号中存在语音,则噪声估计的更新减弱甚至不更新,从而防止语音信号的失真;如果存在语音的概率较小,则说明第三声音信号中可能不存在语音,则更新噪声估计。
在进行非相干噪声抑制处理时,基于估计的噪声信号确定有效增益函数,并利用该有效增益函数,对第三声音信号进行非相干噪声抑制处理。为了更好的理解本申请实施例,参照图3,图3为本申请实施例提供的降低噪声的方法的流程示意图二。
图3中,对第一声音信号与第二声音信号分别进行空间滤波之后,得到期望声音信号与干扰声音信号,然后基于干扰声音信号,对期望声音信号进行相干噪声消除处理,得到第三声音信号,最后根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
可选的,本实施例中,可以采用固定波束形成(Fixed Beamforming,简称FBF)滤波器来对第一声音信号进行空间滤波,采用阻塞矩阵(Block Matrix,简称BM)滤波器对第二声音信号进行空间滤波。也可以采用固定波束形成滤波器来对第二声音信号进行空间滤波,采用阻塞矩阵滤波器对第一声音信号进行空间滤波。
本申请实施例所提供的降低噪声的方法,采用了第一声音采集器与第二声音采集器,来确定期望声音信号与干扰声音信号,并基于干扰声音信号来对期望声音信号进行相干噪声消除处理,得到第三声音信号,然后再根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号,可以有效降低目标声音信号中的噪声;另外,由于在进行非相干噪声抑制处理时,对第三声音信号中存在语音的概率进行了估计,使得在进行非相干噪声抑制处理时,还能有效保证语音不失真。
基于上述实施例所描述的内容,在一种可行的实施方式中,上述步骤S102中根据第一声音信号与第二声音信号,确定出期望声音信号与干扰声音信号,具体包括:
确定第一声音信号在频域上的第一频域信号,以及第二声音信号在频域上的第二频域信号;对第一频域信号与第二频域信号进行空间滤波,得到期望声音信号与干扰声音信号。
在本申请实施例中,对上述第一声音信号与第二声音信号的空间滤波处理可以在频域上进行,频域实现有三个优点:一是空间滤波的延迟设置更方便,时域的延迟受限于采样率,最小的延迟为一个采样周期,而小于一个采样周期的延迟需要通过改变采样率来获得。二是自适应滤波的运算量更少,时域的滤波是卷积运算,频域的滤波是直接乘法运算。三是非相干噪声抑制颗粒度更细,对于每一个频点的噪声估计和噪声抑制可以单独进行处理。
可选的,可以通过对第一声音信号进行短时傅立叶变换,得到第一声音信号在频域上的第一频域信号;对第二声音信号进行短时傅立叶变换,得到第二声音信号在频域上的第一频域信号。
可选的,在对第一频域信号与第二频域信号进行空间滤波时,可以先确定第一声音信号的采集时刻与第二声音信号的采集时刻之间的延迟时长,然后根据该延迟时长,利用固定波束形成滤波器对第一频域信号与第二频域信号进行空间滤波,得到期望声音信号,利用阻塞矩阵滤波器对第一频域信号与第二频域信号进行空间滤波,得到干扰声音信号。
在本申请一种可行的实施例中,参照图4a,图4a为本申请实施例中降低噪声的方法中的滤波示意图一。
在图4a中,以无线耳机为例,该无线耳机包括麦克风X1和麦克风X2,且麦克风X1和麦克风X2之间的距离为d。另外,该无线耳机的期望语音的方向是固定的,入射角为θ,即在实际使用时,麦克风X1相较于麦克风X2更靠近与人体嘴的位置。当入射角θ=0°时,声音信号在麦克风X1和麦克风X2之间的延迟为τA=d/c(c表示声速)。
假设麦克风X1和麦克风X2中间有一个虚拟麦克风X0,得到信号为X0(ω),则第一频域信号信号X1(ω)和第二频域信号X2(ω)分别是信号X0(ω)的提前和延迟,其中
Figure BDA0002339158710000101
λ表示声波波长。
Figure BDA0002339158710000102
Figure BDA0002339158710000103
可选的,可以按照以下公式计算期望声音信号Fout(ω):
Figure BDA0002339158710000104
按照以下公式计算干扰声音信号Bout(ω):
Figure BDA0002339158710000105
其中,X1(ω)表示上述第一频域信号,X2(ω)表示上述第二频域信号,τ表示延迟时长。
在本申请另一种可行的实施例中,参照图4b,图4b为本申请实施例中降低噪声的方法中的滤波示意图二。
在图4b中,仍以无线耳机为例,该无线耳机包括麦克风X1和麦克风X2,且麦克风X1和麦克风X2之间的距离为d。另外,该无线耳机的期望语音的方向是固定的,入射角为θ,即在实际使用时,麦克风X2相较于麦克风X1更靠近与人体嘴的位置。当入射角θ=0°时,声音信号在麦克风X1和麦克风X2之间的延迟为τA=d/c(c表示声速)。
假设麦克风X1和麦克风X2中间有一个虚拟麦克风X0,得到信号为X0(ω),则第一频域信号信号X2(ω)和第二频域信号X1(ω)分别是信号X0(ω)的提前和延迟,其中
Figure BDA0002339158710000111
λ表示声波波长。
Figure BDA0002339158710000112
Figure BDA0002339158710000113
可选的,可以按照以下公式计算期望声音信号Fout(ω):
Figure BDA0002339158710000114
按照以下公式计算干扰声音信号Bout(ω):
Figure BDA0002339158710000115
其中,X1(ω)表示上述第一频域信号,X2(ω)表示上述第二频域信号,τ表示延迟时长。
为了更好的理解本申请实施例,参照图5,图5为本申请实施例中期望声音信号的波束示意图。
在图5中,取延迟时长τ=τA,当期望语音信号从0°±30°范围的方向传播过来时,其他方向的声音信号可以认为是干扰信号。从得到的波束图可以看出,在0°±30°的范围增益为0dB,其他方向有不同程度的衰减,并在180°方向衰减最大。
参照图6,图6为本申请实施例中干扰声音信号的波束示意图。
在图6中,同样取延迟时长τ=τA,假设期望语音信号从0°±30°范围的方向传播过来,而其他方向的声音信号认为是干扰信号。从得到的波束图可以看出,干扰声音信号在0°方向衰减最大,180°方向的衰减最小。
即本申请实施例所提供的降低噪声的方法,对第一声音信号与第二声音信号进行空间滤波后,可以有效衰减期望声音信号中的干扰声音信号分量,以及衰减干扰声音信号中的期望声音信号分量,从而在基于干扰声音信号,对期望声音信号进行相干噪声消除处理时,能够有效滤除期望声音信号中的相干噪声。
基于上述实施例所描述的内容,在一种可行的实施方式中,上述步骤S102中根据第一声音信号与第二声音信号,确定出期望声音信号与干扰声音信号,具体还包括:
确定第一声音信号在频域上的第一频域信号与第二声音信号在频域上的第二频域信号,并将第一频域信号确定为期望声音信号,将第二频域信号确定为干扰声音信号;或者,将第二频域信号确定为期望声音信号,将第一频域信号确定为干扰声音信号。
即本申请实施例所提供的方法还适用于手持电子设备的场景,例如,用户在手持电子设备时,并将嘴靠近第一声音采集器时,靠近嘴的第一声音采集器拾取到的第一声音信号中期望声音信号会明显多于干扰声音信号;而远离嘴的第二声音采集器拾取到的第二声音信号中期望声音信号会明显少于干扰声音信号。此时,可以基于第二声音信号,对第一声音信号进行相干噪声消除处理,得到第三声音信号,然后根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
再例如,用户在手持电子设备时,并将嘴靠近第二声音采集器时,靠近嘴的第二声音采集器拾取到的第二声音信号中期望声音信号会明显多于干扰声音信号;而远离嘴的第一声音采集器拾取到的第一声音信号中期望声音信号会明显少于干扰声音信号。此时,可以基于第一声音信号,对第二声音信号进行相干噪声消除处理,得到第三声音信号,然后根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
即在本申请一种可行的实施方式中,可以不对第一声音信号与第二声音信号进行空间滤波,只进行相干噪声处理与非相干噪声抑制,即可有效降低得到的目标声音信号中的噪声。
基于上述实施例所描述的内容,在一种可行的实施方式中,上述步骤S103中基于干扰声音信号,对期望声音信号进行相干噪声消除处理,得到第三声音信号,具体包括:
利用以下公式计算得到第三声音信号YD(k):
YD(k)=Fout(k)-W(k)·Bout(k);
其中,Fout(k)表示期望声音信号,Bout(k)表示干扰声音信号,k表示第k个频点,W(k)表示自适应滤波系数,且:
Figure BDA0002339158710000131
其中,μ0表示更新步长,μSIR表示可变更新步长,可变更新步长μSIR随期望声音信号与干扰声音信号的功率比值的变化而变化,δ为预设参数,Bout(k)YD(k)*表示干扰声音信号Bout(k)和第三声音信号YD(k)的共轭相关。
其中,期望声音信号与干扰声音信号的功率比值可以作为相干噪声更新的控制条件,该比值可近似看做信干比(Signal to Interference Ratio,简称SIR)。
可选的,μ0为固定更新步长,取值一般在0.01~0.1之间,是一个定值。μSIR是一个随SIR变化的可变更新步长,与SIR呈负相关,SIR越大,μSIR越小,系数更新越慢。μSIR取值在0~1之间。分母是干扰声音信号Bout(k)的能量加上一个固定值δ,δ取值范围在1e-5~1e-10之间,能够避免分母为0。
即本实施例在自适应滤波器的系数更新时,使用了近似信干比的比值来进行控制。如果信干比较高,表示当前是语音信号,则自适应滤波减少更新甚至不更新;如果信干比较低,则表示当前是干扰信号,需要更新自适应滤波系数。
基于上述实施例所描述的内容,在一种可行的实施方式中,参照图7,图7为本申请实施例提供的降低噪声的方法的流程示意图二,上述步骤S104中根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,具体包括:
S701、确定第三声音信号对应的平滑功率谱。
S702、根据平滑功率谱,确定第三声音信号对应的先验语音不存在概率。
S703、根据先验语音不存在概率,确定第三声音信号对应的后验语音存在概率。
S704、利用后验语音存在概率确定第三声音信号中存在的非相干噪声信号,并根据非相干噪声信号确定第三声音信号对应的有效增益函数。
S705、利用有效增益函数,对第三声音信号进行非相干噪声抑制处理。
具体的,假设第三声音信号为X(k,t),代表第三声音信号在第k个频点和t帧的值,先对第三声音信号计算瞬时功率谱,然后由瞬时功率谱计算第三声音信号对应的平滑功率谱S1(k,t):
S1(k,t)=α1·S1(k,t-1)+(1-α1)·|X(k,t)|2
其中t-1代表前一帧的数值。而α1为平滑系数,一般取0.8~0.95。
然后使用平滑后的功率谱S1(k,t)和功率谱的最小值Smin(k,t)做比值:
Figure BDA0002339158710000141
通过上述比值的范围计算先验语音不存在概率q(k,t)的公式如下:
Figure BDA0002339158710000142
其中,δmin和δmax为预设值,一般分别取1和3。
得到先验语音不存在概率q(k,t)后,可以求得后验语音存在概率p(k,t),公式如下:
Figure BDA0002339158710000143
其中,ξ(k,t)=λs(k,t)/λn(k,t),λs(k,t)是估计出来的干净语音功率,λn(k,t)是估计出来的噪声语音功率。而v(k,t)=γ(k,t)·ξ(k,t)/[1+ξ(k,t)]。
使用后验语音存在概率p(k,t)更新噪声:
λn(k,t)=αn(k,t)·λn(k,t-1)+[1-αn(k,t)]·|X(k,t)|2
其中,αn(k,t)是平滑系数,与p(k,t)相关,其公式为:
αn(k,t)=α2+(1-α2)·p(k,t)。
其中,α2取值为0.8~0.95。
估计出当前帧噪声λn(k,t)可以得出当前帧的先验信噪比ξ(k,t)和后验信噪比γ(k,t),并进一步计算得到增益g(k,t)。增益计算有多种方法,如维纳增益和最优修正对数谱幅度估计(Optimally Modified Log-Spectral Amplitude Estimator,OMLSA)增益等,在此不做限制。
另外,还可以采用最小值统计(Minima Statistical,MS)、最小值控制递归平均噪声估计算法(Minima-Controlled Recursive Averaging,MCRA)、改进的最小值控制的递归平均噪声估计算法(improved minima controlled recursive averaging,IMCRA)等,来进行上述噪声估计,在此同样不做限制。
本实施例中,在非相干噪声抑制过程中,噪声的估计使用了存在语音的概率p(k,t)。如果p(k,t)较大,说明语音存在,则噪声估计的更新减弱甚至不更新,减少失真。反之,则更新噪声功率。
即本实施例所提供的降低噪声的方法,在进行非相干噪声抑制处理时,考虑了语音存在概率,先验信噪比和后验信噪比,使噪声的估计更加准确,增益的计算也更加的完善,这样能够极大地提高噪声抑制能力,并保持语音的保真度。
基于上述实施例所描述的内容,本申请实施例还提供一种降低噪声的装置,该装置应用于电子设备,该电子设备包括第一声音采集器和第二声音采集器,第一声音采集器和第二声音采集器的安装位置不同。
参照图8,图8为本申请实施例提供的降低噪声的装置的程序模块示意图,该装置包括:
获取模块801,用于获取第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号。
确定模块802,用于根据第一声音信号与第二声音信号,确定出期望声音信号与干扰声音信号。
相干处理模块803,基于干扰声音信号,对期望声音信号进行相干噪声消除处理,得到第三声音信号。
非相干处理模块804,根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
在一种可行的实施方式中,确定模块802具体包括:
第一确定模块,用于确定第一声音信号在频域上的第一频域信号,以及第二声音信号在频域上的第二频域信号。
空间滤波模块,用于对第一频域信号与第二频域信号进行空间滤波,得到期望声音信号与干扰声音信号。
在一种可行的实施方式中,空间滤波模块具体用于:
确定第一声音信号的采集时刻与第二声音信号的采集时刻之间的延迟时长;
根据所述延迟时长,利用固定波束形成滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号,利用阻塞矩阵滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述干扰声音信号。
在一种可行的实施方式中,按照以下公式计算上述期望声音信号Fout(ω):
Figure BDA0002339158710000161
按照以下公式计算所述干扰声音信号Bout(ω):
Figure BDA0002339158710000162
其中,X1(ω)表示第一频域信号,X2(ω)表示第二频域信号,τ表示上述延迟时长。
在另一种可行的实施方式中,按照以下公式计算期望声音信号Fout(ω):
Figure BDA0002339158710000163
按照以下公式计算所述干扰声音信号Bout(ω):
Figure BDA0002339158710000164
其中,X1(ω)表示第一频域信号,X2(ω)表示第二频域信号,τ表示上述延迟时长。
在一种可行的实施方式中,确定模块802具体包括:
第二确定模块,用于确定第一声音信号在频域上的第一频域信号与第二声音信号在频域上的第二频域信号。
第三确定模块,用于将第一频域信号确定为期望声音信号,将第二频域信号确定为干扰声音信号;或者,
将第二频域信号确定为期望声音信号,将第一频域信号确定为干扰声音信号。
在一种可行的实施方式中,相干处理模块803,具体用于:
利用以下公式计算得到所述第三声音信号YS(k):
YD(k)=Fout(k)-W(k)·Bout(k);
其中,Fout(k)表示所述期望声音信号,Bout(k)表示所述干扰声音信号,k表示第k个频点,W(k)表示自适应滤波系数,且:
Figure BDA0002339158710000171
其中,μ0表示更新步长,μSIR表示可变更新步长,所述可变更新步长μSIR随所述期望声音信号与所述干扰声音信号的功率比值的变化而变化,δ为预设参数,Bout(k)YD(k)*表示所述干扰声音信号Bout(k)和所述第三声音信号YD(k)的共轭相关。
在一种可行的实施方式中,非相干处理模块804具体包括:
第一计算模块,用于确定第三声音信号对应的平滑功率谱。
第二计算模块,用于根据平滑功率谱,确定第三声音信号对应的先验语音不存在概率。
第三计算模块,用于根据先验语音不存在概率,确定第三声音信号对应的后验语音存在概率。
增益确定模块,用于利用后验语音存在概率确定第三声音信号中存在的非相干噪声信号,并根据非相干噪声信号确定第三声音信号对应的有效增益函数。
噪声抑制模块,用于利用有效增益函数,对第三声音信号进行非相干噪声抑制处理。
可以理解的是,本实施例提供的上述降低噪声的装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,具体可参照上述方法实施例中的描述,本实施例此处不再赘述。
本申请实施例所提供的降低噪声的装置,采用了第一声音采集器与第二声音采集器,来确定期望声音信号与干扰声音信号,并基于干扰声音信号来对期望声音信号进行相干噪声消除处理,得到第三声音信号,然后再根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号,可以有效降低目标声音信号中的噪声;另外,由于在进行非相干噪声抑制处理时,对第三声音信号中存在语音的概率进行了估计,使得在进行非相干噪声抑制处理时,还能有效保证语音不失真。
本申请实施例还提供一种电子设备,包括:至少一个处理器和存储器,以及第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同;存储器存储计算机执行指令;至少一个处理器执行所述存储器存储的计算机执行指令,使得至少一个处理器执行如上述实施例在所描述的降低噪声的方法。
具体可参照图9,图9为本申请实施例提供的电子设备的硬件结构示意图。如图9所示,本实施例的电子设备90包括:处理器901以及存储器902;其中
存储器902,用于存储计算机执行指令;
处理器901,用于执行存储器存储的计算机执行指令,以实现上述实施例中电子设备所执行的各个步骤。具体可以参见前述方法实施例中的相关描述。
可选地,存储器902既可以是独立的,也可以跟处理器901集成在一起。
当存储器902独立设置时,该电子设备还包括总线903,用于连接所述存储器902和处理器901。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上所述的降低噪声的方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。
应理解,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称:ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (13)

1.一种降低噪声的方法,其特征在于,所述方法应用于电子设备上,所述电子设备包括第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同,所述方法包括:
获取所述第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号;
根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号;
基于所述干扰声音信号,对所述期望声音信号进行相干噪声消除处理,得到第三声音信号;
根据所述第三声音信号中存在语音的概率,对所述第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号,包括:
确定所述第一声音信号在频域上的第一频域信号,以及所述第二声音信号在频域上的第二频域信号;
对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号与所述干扰声音信号。
3.根据权利要求2所述的方法,其特征在于,所述对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号与所述干扰声音信号,包括:
确定所述第一声音信号的采集时刻与所述第二声音信号的采集时刻之间的延迟时长;
根据所述延迟时长,利用固定波束形成滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号,利用阻塞矩阵滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述干扰声音信号。
4.根据权利要求3所述的方法,其特征在于,所述根据所述延迟时长,利用固定波束形成滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号,利用阻塞矩阵滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述干扰声音信号,包括:
按照以下公式计算所述期望声音信号Fout(ω):
Figure FDA0002339158700000021
按照以下公式计算所述干扰声音信号Bout(ω):
Figure FDA0002339158700000022
或者,
按照以下公式计算所述期望声音信号Fout(ω):
Figure FDA0002339158700000023
按照以下公式计算所述干扰声音信号Bout(ω):
Figure FDA0002339158700000024
其中,X1(ω)表示所述第一频域信号,X2(ω)表示所述第二频域信号,τ表示所述延迟时长。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号,包括:
确定所述第一声音信号在频域上的第一频域信号,与所述第二声音信号在频域上的第二频域信号;
将所述第一频域信号确定为所述期望声音信号,将所述第二频域信号确定为所述干扰声音信号;或者,
将所述第二频域信号确定为所述期望声音信号,将所述第一频域信号确定为所述干扰声音信号。
6.根据权利要求4或5所述的方法,其特征在于,所述基于所述干扰声音信号,对所述期望声音信号进行相干噪声消除处理,得到第三声音信号,包括:
利用以下公式计算得到所述第三声音信号YD(k):
YD(k)=Fout(k)-W(k)·Bout(k);
其中,Fout(k)表示所述期望声音信号,Bout(k)表示所述干扰声音信号,k表示第k个频点,W(k)表示自适应滤波系数,且:
Figure FDA0002339158700000025
其中,μ0表示更新步长,μSIR表示可变更新步长,所述可变更新步长μSIR随所述期望声音信号与所述干扰声音信号的功率比值的变化而变化,δ为预设参数,Bout(k)YD(k)*表示所述干扰声音信号Bout(k)和所述第三声音信号YD(k)的共轭相关。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第三声音信号中存在语音的概率,对所述第三声音信号进行非相干噪声抑制处理,包括:
确定所述第三声音信号对应的平滑功率谱;
根据所述平滑功率谱,确定所述第三声音信号对应的先验语音不存在概率;
根据所述先验语音不存在概率,确定所述第三声音信号对应的后验语音存在概率;
利用所述后验语音存在概率,确定所述第三声音信号中存在的非相干噪声信号,并根据所述非相干噪声信号确定所述第三声音信号对应的有效增益函数;
利用所述有效增益函数,对所述第三声音信号进行非相干噪声抑制处理。
8.一种降低噪声的装置,其特征在于,所述装置应用于电子设备,所述电子设备包括第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同,所述装置包括:
获取模块,用于获取所述第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号;
确定模块,用于根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号;
相干处理模块,基于所述干扰声音信号,对所述期望声音信号进行相干噪声消除处理,得到第三声音信号;
非相干处理模块,根据所述第三声音信号中存在语音的概率,对所述第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
9.根据权利要求8所述的装置,其特征在于,所述确定模块具体包括:
第一确定模块,用于确定所述第一声音信号在频域上的第一频域信号,以及所述第二声音信号在频域上的第二频域信号;
空间滤波模块,用于对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号与所述干扰声音信号。
10.根据权利要求8所述的装置,其特征在于,所述确定模块具体包括:
第二确定模块,用于确定所述第一声音信号在频域上的第一频域信号,与所述第二声音信号在频域上的第二频域信号;
第三确定模块,用于将所述第一频域信号确定为所述期望声音信号,将所述第二频域信号确定为所述干扰声音信号;或者,
将所述第二频域信号确定为所述期望声音信号,将所述第一频域信号确定为所述干扰声音信号。
11.根据权利要求8至10任一项所述的方法,其特征在于,所述非相干处理模块具体包括:
第一计算模块,用于确定所述第三声音信号对应的平滑功率谱;
第二计算模块,用于根据所述平滑功率谱,确定所述第三声音信号对应的先验语音不存在概率;
第三计算模块,用于根据所述先验语音不存在概率,确定所述第三声音信号对应的后验语音存在概率;
增益确定模块,用于利用所述后验语音存在概率确定所述第三声音信号中存在的非相干噪声信号,并根据所述非相干噪声信号确定所述第三声音信号对应的有效增益函数;
噪声抑制模块,用于利用所述有效增益函数,对所述第三声音信号进行非相干噪声抑制处理。
12.一种电子设备,其特征在于,包括:至少一个处理器和存储器,以及第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至7任一项所述的降低噪声的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至7任一项所述的降低噪声的方法。
CN201911368908.7A 2019-12-26 2019-12-26 降低噪声的方法、装置、电子设备及可读存储介质 Pending CN111063366A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201911368908.7A CN111063366A (zh) 2019-12-26 2019-12-26 降低噪声的方法、装置、电子设备及可读存储介质
EP20905296.8A EP4075431A4 (en) 2019-12-26 2020-04-24 NOISE REDUCTION METHOD, DEVICE, ELECTRONIC DEVICE AND READABLE STORAGE MEDIA
PCT/CN2020/086639 WO2021128670A1 (zh) 2019-12-26 2020-04-24 降低噪声的方法、装置、电子设备及可读存储介质
US17/850,936 US20220328058A1 (en) 2019-12-26 2022-06-27 Method and apparatus of noise reduction, electronic device and readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911368908.7A CN111063366A (zh) 2019-12-26 2019-12-26 降低噪声的方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN111063366A true CN111063366A (zh) 2020-04-24

Family

ID=70303963

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911368908.7A Pending CN111063366A (zh) 2019-12-26 2019-12-26 降低噪声的方法、装置、电子设备及可读存储介质

Country Status (4)

Country Link
US (1) US20220328058A1 (zh)
EP (1) EP4075431A4 (zh)
CN (1) CN111063366A (zh)
WO (1) WO2021128670A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681665A (zh) * 2020-05-20 2020-09-18 浙江大华技术股份有限公司 一种全向降噪方法、设备及存储介质
CN112669869A (zh) * 2020-12-23 2021-04-16 紫光展锐(重庆)科技有限公司 噪声抑制方法、设备、装置及存储介质
CN112802486A (zh) * 2020-12-29 2021-05-14 紫光展锐(重庆)科技有限公司 一种噪声抑制方法、装置及电子设备
CN113223552A (zh) * 2021-04-28 2021-08-06 锐迪科微电子(上海)有限公司 语音增强方法、装置、设备、存储介质及程序
CN113347544A (zh) * 2021-06-03 2021-09-03 中国科学院声学研究所 助听器的信号处理方法、装置及助听器
CN113539291A (zh) * 2021-07-09 2021-10-22 北京声智科技有限公司 音频信号的降噪方法、装置、电子设备及存储介质
CN114724574A (zh) * 2022-02-21 2022-07-08 大连理工大学 一种期望声源方向可调的双麦克风降噪方法
WO2022246737A1 (zh) * 2021-05-27 2022-12-01 深圳市韶音科技有限公司 一种语音增强方法和系统
WO2022247427A1 (zh) * 2021-05-26 2022-12-01 中兴通讯股份有限公司 信号滤波方法及装置、存储介质、电子装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009043066A1 (en) * 2007-10-02 2009-04-09 Akg Acoustics Gmbh Method and device for low-latency auditory model-based single-channel speech enhancement
CN105940445B (zh) * 2016-02-04 2018-06-12 曾新晓 一种语音通信系统及其方法
CN105590630B (zh) * 2016-02-18 2019-06-07 深圳永顺智信息科技有限公司 基于指定带宽的定向噪音抑制方法
CN106653043B (zh) * 2016-12-26 2019-09-27 云知声(上海)智能科技有限公司 降低语音失真的自适应波束形成方法
CN107993670B (zh) * 2017-11-23 2021-01-19 华南理工大学 基于统计模型的麦克风阵列语音增强方法
CN109994120A (zh) * 2017-12-29 2019-07-09 福州瑞芯微电子股份有限公司 基于双麦的语音增强方法、系统、音箱及存储介质
CN109308904A (zh) * 2018-10-22 2019-02-05 上海声瀚信息科技有限公司 一种阵列语音增强算法
CN109473118B (zh) * 2018-12-24 2021-07-20 思必驰科技股份有限公司 双通道语音增强方法及装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681665A (zh) * 2020-05-20 2020-09-18 浙江大华技术股份有限公司 一种全向降噪方法、设备及存储介质
CN112669869A (zh) * 2020-12-23 2021-04-16 紫光展锐(重庆)科技有限公司 噪声抑制方法、设备、装置及存储介质
CN112802486A (zh) * 2020-12-29 2021-05-14 紫光展锐(重庆)科技有限公司 一种噪声抑制方法、装置及电子设备
CN112802486B (zh) * 2020-12-29 2023-02-14 紫光展锐(重庆)科技有限公司 一种噪声抑制方法、装置及电子设备
CN113223552A (zh) * 2021-04-28 2021-08-06 锐迪科微电子(上海)有限公司 语音增强方法、装置、设备、存储介质及程序
WO2022247427A1 (zh) * 2021-05-26 2022-12-01 中兴通讯股份有限公司 信号滤波方法及装置、存储介质、电子装置
WO2022246737A1 (zh) * 2021-05-27 2022-12-01 深圳市韶音科技有限公司 一种语音增强方法和系统
CN113347544A (zh) * 2021-06-03 2021-09-03 中国科学院声学研究所 助听器的信号处理方法、装置及助听器
CN113539291A (zh) * 2021-07-09 2021-10-22 北京声智科技有限公司 音频信号的降噪方法、装置、电子设备及存储介质
CN114724574A (zh) * 2022-02-21 2022-07-08 大连理工大学 一种期望声源方向可调的双麦克风降噪方法

Also Published As

Publication number Publication date
EP4075431A4 (en) 2023-01-11
EP4075431A1 (en) 2022-10-19
WO2021128670A1 (zh) 2021-07-01
US20220328058A1 (en) 2022-10-13

Similar Documents

Publication Publication Date Title
WO2021128670A1 (zh) 降低噪声的方法、装置、电子设备及可读存储介质
JP7011075B2 (ja) マイク・アレイに基づく対象音声取得方法及び装置
US7206418B2 (en) Noise suppression for a wireless communication device
US8787587B1 (en) Selection of system parameters based on non-acoustic sensor information
US20190320261A1 (en) Adaptive beamforming
CN106161751B (zh) 一种噪声抑制方法及装置
CN110782914B (zh) 信号处理方法、装置、终端设备及存储介质
US9330677B2 (en) Method and apparatus for generating a noise reduced audio signal using a microphone array
US20180308503A1 (en) Real-time single-channel speech enhancement in noisy and time-varying environments
CN112802486B (zh) 一种噪声抑制方法、装置及电子设备
CN112242148B (zh) 一种基于头戴式耳机的风噪抑制方法及装置
CN113539285A (zh) 音频信号降噪方法、电子装置和存储介质
CN112735370B (zh) 一种语音信号处理方法、装置、电子设备和存储介质
CN113421583B (zh) 降噪方法、存储介质、芯片及电子设备
CN112201273A (zh) 一种噪声功率谱密度计算方法、系统、设备及介质
CN110199528B (zh) 远场声音捕获
CN111445916B (zh) 一种会议系统中音频去混响方法、装置及存储介质
CN115412803A (zh) 音频信号补偿方法及装置、耳机、存储介质
CN112669869B (zh) 噪声抑制方法、设备、装置及存储介质
CN113223552B (zh) 语音增强方法、装置、设备、存储介质及程序
CN109308907B (zh) 单信道降噪
CN112785997B (zh) 一种噪声估计方法、装置、电子设备和可读存储介质
EP2816818B1 (en) Sound field spatial stabilizer with echo spectral coherence compensation
CN113205824A (zh) 声音信号处理方法、装置、存储介质、芯片及相关设备
EP2816817B1 (en) Sound field spatial stabilizer with spectral coherence compensation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200424