CN117558286A - 语音降噪方法、装置、车辆、电子设备和存储介质 - Google Patents

语音降噪方法、装置、车辆、电子设备和存储介质 Download PDF

Info

Publication number
CN117558286A
CN117558286A CN202311687258.9A CN202311687258A CN117558286A CN 117558286 A CN117558286 A CN 117558286A CN 202311687258 A CN202311687258 A CN 202311687258A CN 117558286 A CN117558286 A CN 117558286A
Authority
CN
China
Prior art keywords
voice signal
signal
voice
noise
noise reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311687258.9A
Other languages
English (en)
Inventor
张子洋
管青松
马峰
高建清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN202311687258.9A priority Critical patent/CN117558286A/zh
Publication of CN117558286A publication Critical patent/CN117558286A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02087Noise filtering the noise being separate speech, e.g. cocktail party
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本发明提供一种语音降噪方法、装置、车辆、电子设备和存储介质,所述方法包括:确定目标麦克风采集的待降噪语音信号,以及参考麦克风采集的参考语音信号,目标麦克风与参考麦克风之间的距离大于阈值;基于待降噪语音信号与参考语音信号之间的相关度,确定加权系数;基于加权系数,以及参考语音信号,从待降噪语音信号中提取得到干净语音信号。本发明提供的语音降噪方法、装置、车辆、电子设备和存储介质,由于目标麦克风与参考麦克风之间的距离大于阈值,从而可以保证目标麦克风采集到的待降噪语音信号与参考麦克风采集到的参考语音信号之间存在差异,进而将参考语音信号作为辅助信号,能够更加准确识别和抑制待降噪语音信号中的噪声。

Description

语音降噪方法、装置、车辆、电子设备和存储介质
技术领域
本发明涉及信号处理技术领域,尤其涉及一种语音降噪方法、装置、车辆、电子设备和存储介质。
背景技术
车载语音交互一般分为唤醒和识别两轮交互,而车载语音降噪是提升复杂场景下唤醒和识别准确率的关键技术之一。
目前,多通过回声消除、波束形成、语音分离等方法实现对车内麦克风采集的语音信号进行降噪处理,但在行车开窗场景下,降噪效果较差,进而影响用户车载交互体验。
发明内容
本发明提供一种语音降噪方法、装置、车辆、电子设备和存储介质,用以解决现有技术中在行车开窗场景下,降噪效果较差的缺陷。
本发明提供一种语音降噪方法,包括:
确定目标麦克风采集的待降噪语音信号,以及参考麦克风采集的参考语音信号,所述目标麦克风与所述参考麦克风之间的距离大于阈值;
基于所述待降噪语音信号与所述参考语音信号之间的相关度,确定加权系数;
基于所述加权系数,以及所述参考语音信号,从所述待降噪语音信号中提取得到干净语音信号。
根据本发明提供的一种语音降噪方法,所述基于所述加权系数,以及所述参考语音信号,从所述待降噪语音信号中提取得到干净语音信号,包括:
基于所述加权系数,对所述参考语音信号进行加权,得到加权语音信号;
基于所述加权语音信号,从所述待降噪语音信号中提取得到所述干净语音信号。
根据本发明提供的一种语音降噪方法,所述基于所述加权语音信号,从所述待降噪语音信号中提取得到所述干净语音信号,包括:
对所述加权语音信号以及所述待降噪语音信号进行信号相加,得到混合语音信号;
对所述混合语音信号进行语音降噪,得到所述干净语音信号。
根据本发明提供的一种语音降噪方法,在存在多个目标麦克风的情况下,所述从所述待降噪语音信号中提取得到干净语音信号,之后还包括:
基于任意两个干净语音信号之间的相关度,确定权重系数;
基于所述权重系数,以及所述任意两个中任意一个干净语音信号,从另一个干净语音信号中提取得到期望语音信号;
基于各干净语音信号对应的期望语音信号,确定各期望语音信号对应的目标麦克风位置。
根据本发明提供的一种语音降噪方法,所述基于所述待降噪语音信号与所述参考语音信号之间的相关度,确定加权系数,之前还包括:
基于所述待降噪语音信号与所述参考语音信号之间的时域差异和/或频域差异,确定滤波参数;
基于所述滤波参数,对所述待降噪语音信号进行滤波。
根据本发明提供的一种语音降噪方法,所述对所述待降噪语音信号进行滤波,之后还包括:
对滤波后的待降噪语音信号进行单通道降噪,并基于单通道降噪后的待降噪语音信号定位所述待降噪语音信号的声源。
本发明还提供一种语音降噪装置,包括:
信号确定单元,用于确定目标麦克风采集的待降噪语音信号,以及参考麦克风采集的参考语音信号,所述目标麦克风与所述参考麦克风之间的距离大于阈值;
系数确定单元,用于基于所述待降噪语音信号与所述参考语音信号之间的相关度,确定加权系数;
信号降噪单元,用于基于所述加权系数,以及所述参考语音信号,从所述待降噪语音信号中提取得到干净语音信号。
本发明还提供一种车辆,包括:
如上所述的语音降噪装置,所述目标麦克风以及所述参考麦克风,所述目标麦克风设置于车内或车外,所述参考麦克风设置于车外。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述语音降噪方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述语音降噪方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述语音降噪方法。
本发明提供的语音降噪方法、装置、车辆、电子设备和存储介质,由于目标麦克风与参考麦克风之间的距离大于阈值,从而可以保证目标麦克风采集到的待降噪语音信号与参考麦克风采集到的参考语音信号之间存在差异,进而将参考语音信号作为辅助信号,能够更加准确识别和抑制待降噪语音信号中的噪声。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的语音降噪方法的流程示意图;
图2是本发明提供的语音降噪方法中步骤130的实施方式的流程示意图;
图3是本发明提供的语音降噪方法中步骤132的实施方式的流程示意图;
图4是本发明提供的目标麦克风定位方法的流程示意图;
图5是本发明提供的车内外麦克风布局示意图;
图6是本发明提供的车内语音降噪方法的流程示意图;
图7是本发明提供的车外语音降噪方法的流程示意图;
图8是本发明提供的语音降噪装置的结构示意图;
图9是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,多通过回声消除、波束形成、语音分离等方法实现对车内麦克风采集的语音信号进行降噪处理,但在行车开窗场景下,车内麦克风采集的语音信号中混合有外部噪声(如风噪、胎噪等),导致降噪效果较差,进而影响用户车载交互体验。
对此,本发明提供一种语音降噪方法。图1是本发明提供的语音降噪方法的流程示意图,如图1所示,该方法不仅可以用于车载场景下的语音降噪,还可以用于其它场景(如会议场景、音频录制场景等)下的语音降噪,为了便于解释说明,以下实施例均以车载场景下(目标麦克风设置于车内,参考麦克风设置于车外)的语音降噪为例进行说明,该方法包括如下步骤:
步骤110、确定目标麦克风采集的待降噪语音信号,以及参考麦克风采集的参考语音信号,目标麦克风与参考麦克风之间的距离大于阈值。
此处,待降噪语音信号即需要进行语音降噪的信号,对应的目标麦克风指用于采集待降噪语音信号的麦克风。参考语音信号可以理解为参考麦克风采集的用于辅助对待降噪语音信号进行降噪的信号。
其中,目标麦克风与参考麦克风之间的距离大于阈值,从而可以保证目标麦克风采集到的待降噪语音信号与参考麦克风采集到的参考语音信号之间存在差异,进而将参考语音信号作为辅助信号,对比待降噪语音信号,能够更加准确识别和抑制待降噪语音信号中的噪声。
例如,设置于车内的目标麦克风采集的待降噪语音信号包含车内人声噪音,由于参考麦克风设置于车外,且目标麦克风与参考麦克风之间的距离大于阈值,从而参考语音信号中不包含车内人声噪音,因此将参考语音信号作为辅助信号,能够更加准确识别和抑制待降噪语音信号中的车内人声噪声。
步骤120、基于待降噪语音信号与参考语音信号之间的相关度,确定加权系数。
具体地,待降噪语音信号与参考语音信号之间的相关度用于表征待降噪信号与参考语音信号之间的相似程度,加权系数用于表征参考语音信号在对待降噪语音信号进行降噪过程中所占的比重,加权系数也可以理解为参考语音信号对待降噪语音信号进行降噪的影响程度。其中,加权系数可以基于待降噪语音信号与参考语音信号之间的互相关系数确定。
待降噪语音信号与参考语音信号之间的相关度越高,表明待降噪语音信号所包含的信号成分与参考信号所包含的语音信号成分相似度越高,进而参考语音信号所提供的辅助信息(如语音特征、信噪比信息、时频信息等)更具有参考意义,即参考语音信号对待降噪语音信号进行降噪的影响程度越大,对应的加权系数也越大,进而基于参考语音信号能够更好去除待降噪语音信号中的噪声,提高降噪效果。
步骤130、基于加权系数,以及参考语音信号,从待降噪语音信号中提取得到干净语音信号。
作为一种可选实施例,在确定加权系数后,可以基于加权系数对参考语音信号进行加权,得到加权语音信号,并对加权语音信号与待降噪语音信号进行线性组合,如对加权语音信号与待降噪语音信号进行信号相加,以增强待降噪语音信号中的有用语音成分,从而可以从相加后的信号中准确提取得到干净语音信号,其中,干净语音信号指从待降噪语音信号滤除噪声后的语音信号。
可以理解的是,由于信号传播存在时间差异,在对加权语音信号与待降噪语音信号进行线性组合之前,可以对加权语音信号进行延迟对齐,以使对齐后的加权语音信号与待降噪语音信号在时间上对齐,从而可以保持对齐后的加权语音信号与待降噪语音信号之间的一致。
本发明实施例提供的语音降噪方法,由于目标麦克风与参考麦克风之间的距离大于阈值,从而可以保证目标麦克风采集到的待降噪语音信号与参考麦克风采集到的参考语音信号之间存在差异,进而将参考语音信号作为辅助信号,能够更加准确识别和抑制待降噪语音信号中的噪声。
基于上述实施例,图2是本发明提供的语音降噪方法中步骤130的实施方式的流程示意图,如图2所示,步骤130包括:
步骤131、基于加权系数,对参考语音信号进行加权,得到加权语音信号;
步骤132、基于加权语音信号,从待降噪语音信号中提取得到干净语音信号。
具体地,在确定加权系数后,可以确定参考语音信号对待降噪语音信号进行降噪的影响程度,进而基于加权系数对参考语音信号进行加权后,得到的加权语音信号能够最大程度抑制待降噪语音信号中的噪声成分,从而能够最大程度精确从待降噪语音信号中提取得到干净语音信号。
作为一种可选实施例,图3是本发明提供的语音降噪方法中步骤132的实施方式的流程示意图,如图3所示,步骤132包括:
步骤1321、对加权语音信号以及待降噪语音信号进行信号相加,得到混合语音信号;
步骤1322、对混合语音信号进行语音降噪,得到干净语音信号。
具体地,由于参考麦克风与目标麦克风之间的距离大于阈值,即参考麦克风与目标麦克风之间的距离较远,从而参考语音信号与待降噪语音信号中对应的噪声成分不完全相同,也就是加权语音信号与待降噪语音信号中对应的噪声成分不完全相同。
在此基础上,对加权语音信号以及待降噪语音信号进行信号相加后,可以增强待降噪语音信号中的语音成分,减少待降噪语音信号中的噪声成分,即得到的混合语音信号最大程度抑制了待降噪语音信号中的噪声成分。
在此基础上,对混合语音信号进行语音降噪,能够最大程度滤除噪声成分,得到干净语音信号。其中,可以对混合语音信号进行滤波降噪,也可以进行其它算法降噪处理,本发明实施例对此不作具体限定。
基于上述任一实施例,图4是本发明提供的目标麦克风定位方法的流程示意图,如图4所示,在存在多个目标麦克风的情况下,从待降噪语音信号中提取得到干净语音信号,之后还包括:
步骤410、基于任意两个干净语音信号之间的相关度,确定权重系数;
步骤420、基于权重系数,以及任意两个中任意一个干净语音信号,从另一个干净语音信号中提取得到期望语音信号;
步骤430、基于各干净语音信号对应的期望语音信号,确定各期望语音信号对应的目标麦克风位置。
具体地,在存在多个目标麦克风的情况下,即车内设置有多个目标麦克风,从各目标麦克风对应的待降噪语音信号中提取得到干净语音信号之后,基于任意两个干净语音信号之间的相关度,确定权重系数。
由于任意两个干净语音信号所对应的目标麦克风的位置不同,进而对应两个干净语音信号之间存在差异,进而可以将对应两个干净语音信号中任意一个干净语音信号(以下简称“降噪信号”)看作是步骤110中的待降噪语音信号,另一个干净语音信号(以下简称“参考信号”)看作是步骤110中的参考语音信号。
任意两个干净语音信号之间的相关度用于表降噪信号与参考信号之间的相似程度,权重系数用于表征参考信号在对降噪信号进行降噪过程中所占的比重,即参考信号对降噪信号进行降噪的影响程度。
降噪信号与参考信号之间的相关度越高,表明降噪信号所包含的信号成分与参考语音信号所包含的信号成分相似度越高,进而参考信号所提供的辅助信息(如语音特征、信噪比信息、时频信息等)更具有参考意义,即参考信号对降噪信号进行降噪的影响程度越大,对应的权重系数也越大,进而基于参考信号能够更好去除降噪信号中的噪声,提高降噪效果。
作为一种可选实施例,在确定权重系数后,可以基于权重系数,对参考信号进行加权,并对加权后的参考信号和降噪信号进行信号相加,得到混合信号,并对混合信号进行降噪得到降噪信号对应的期望语音信号,该期望语音信号可以理解为降噪信号对应的干净语音信号。
需要说明的是,基于参考麦克风采集得到的参考语音信号,可以滤除待降噪语音信号中车内噪声(如人声噪声),虽然参考语音信号中不会混有车内噪声,但其可能混有车外噪声(如胎噪声),进而导致提取得到的干净语音信号中也可能混有车外噪声,因此本发明实施例在提取得到干净语音信号后,将任一干净语音信号作为参考信号,抑制另一干净语音信号中的车外噪声,从而能够滤除干净语音信号中的车外噪声,进而能够得到滤除车外噪声后的期望语音信号。
同理,基于上述方法,可以确定每个干净语音信号对应的期望语音信号,并基于各干净语音信号对应的期望语音信号,确定各期望语音信号对应的目标麦克风位置,以使对应麦克风输出对应的期望语音信号。
可选地,可以将各干净语音信号对应的期望语音信号输入至预先训练得到的分区模型中,由分区模型基于各干净语音信号对应的期望语音信号确定各期望语音信号对应的目标麦克风位置。其中,分区模型基于样本期望语音信号以及样本期望语音信号对应的麦克风位置标签训练得到。
基于上述任一实施例,基于待降噪语音信号与参考语音信号之间的相关度,确定加权系数,之前还包括:
基于待降噪语音信号与参考语音信号之间的时域差异和/或频域差异,确定滤波参数;
基于滤波参数,对待降噪语音信号进行滤波。
具体地,时域差异指待降噪语音信号与参考语音信号在时间上的波形差异,频域差异指待降噪语音信号与参考语音信号在频率上的特性差异。滤波参数可以理解为滤波器的权重,基于待降噪语音信号与参考语音信号之间的时域差异和/或频域差异,实时调整滤波参数,从而可以基于滤波参数确定一个滤波器,并将待降噪语音信号和参考语音信号输入至滤波器后,使得滤波器输出的干净语音信号与待降噪语音信号尽可能匹配。
基于上述任一实施例,对所述待降噪语音信号进行滤波,之后还包括:
对滤波后的待降噪语音信号进行单通道降噪,并基于单通道降噪后的待降噪语音信号定位待降噪语音信号的声源。
具体地,单通道降噪是指单独基于滤波后的待降噪语音信号的特征信息对滤波后的待降噪语音信号进行降噪,其中,单通道降噪的方法可以包括基于统计建模的方法、频域滤波方法和深度学习方法等。
在对滤波后的待降噪语音信号进行单通道降噪后,可以通过声源定位算法确定待降噪语音信号的声源位置,进而可以基于声源位置更高效进行唤醒和识别。
例如,滤波后的待降噪语音信号滤波后的待降噪语音信号为“打开车窗”,此时若定位到对应的声源位于驾驶座,则可以控制驾驶座旁边的窗户开启,而不用开启所有车窗,提高了用户车载交互体验。
基于上述任一实施例,图5是本发明提供的车内外麦克风布局示意图,如图5所示,mic1、mic2、mic3和mic4是设置于车内的麦克风,mic5和mic6是设置于车外的麦克风。
图6是本发明提供的车内语音降噪方法的流程示意图,在图5所示的车内外麦克风布局下,图6所示的方法包括:
首先,分别对mic1、mic2、mic3、mic4、mic5和mic6采集的语音信号进行回声消除处理,得到对应的语音信号为mic1′、mic2′、mic3′、mic4′、mic5′和mic6′。
接着,以mic5′作为参考语音信号,以mic1′作为待降噪语音信号,采用广义旁瓣抑制器算法(Generalized Sidelobe Canceller,GSC)对mic1′进行降噪,得到对应的干净语音信号mic1″。
同理,以mic5′作为参考语音信号,以mic3′作为待降噪语音信号,采用GSC对mic3′进行降噪,得到对应的干净语音信号mic3″。以mic6′作为参考语音信号,以mic2′作为待降噪语音信号,采用GSC对mic2′进行降噪,得到对应的干净语音信号mic2″。以mic6′作为参考语音信号,以mic4′作为待降噪语音信号,采用GSC对mic4′进行降噪,得到对应的干净语音信号mic4″。
接着,对4麦(mic1″、mic″2、mic″3和mic″4)联合进行GSC算法处理,得到对应的期望语音信号,并将对应的期望语音信号输入至分区模型,由分区模型确定各期望语音信号分别对应的车内麦克风位置,并由对应车内麦克风输出对应的期望语音信号。其中,分区模型基于样本期望语音信号以及样本期望语音信号对应麦克风位置标签训练得到。
图7是本发明提供的车外语音降噪方法的流程示意图,在图5所示的车内外麦克风布局下,图7所示的方法包括:
首先,分别对mic5和mic6采集的语音信号进行回声消除处理,得到对应的语音信号为mic5′和mic6′。
接着,对mic5′和mic6′进行最小失真响应滤波器算法(Minimum DistortionlessResponse Filter,MDF)处理,得到滤波后的语音信号。
对滤波后的语音信号进行2麦联合GSC算法处理,得到对应的干净语音信号,并将干净语音信号通过对应车外麦克输出。
同时,对滤波后的语音信号分别进行单通道降噪,并基于单通道降噪后的语音信号定位对应的声源。
下面对本发明提供的语音降噪装置进行描述,下文描述的语音降噪装置与上文描述的语音降噪方法可相互对应参照。
基于上述任一实施例,图8是本发明提供的语音降噪装置的结构示意图,如图8所示,该装置包括:
信号确定单元810,用于确定目标麦克风采集的待降噪语音信号,以及参考麦克风采集的参考语音信号,目标麦克风与参考麦克风之间的距离大于阈值;
系数确定单元820,用于基于待降噪语音信号与参考语音信号之间的相关度,确定加权系数;
信号降噪单元830,用于基于加权系数,以及参考语音信号,从待降噪语音信号中提取得到干净语音信号。
基于上述任一实施例,基于加权系数,以及参考语音信号,从待降噪语音信号中提取得到干净语音信号,包括:
基于加权系数,对参考语音信号进行加权,得到加权语音信号;
基于加权语音信号,从待降噪语音信号中提取得到干净语音信号。
基于上述任一实施例,基于加权语音信号,从待降噪语音信号中提取得到干净语音信号,包括:
对加权语音信号以及待降噪语音信号进行信号相加,得到混合语音信号;
对混合语音信号进行语音降噪,得到干净语音信号。
基于上述任一实施例,在存在多个目标麦克风的情况下,从待降噪语音信号中提取得到干净语音信号,之后还包括:
基于任意两个干净语音信号之间的相关度,确定权重系数;
基于权重系数,以及任意两个中任意一个干净语音信号,从另一个干净语音信号中提取得到期望语音信号;
基于各干净语音信号对应的期望语音信号,确定各期望语音信号对应的目标麦克风位置。
基于上述任一实施例,基于待降噪语音信号与参考语音信号之间的相关度,确定加权系数,之前还包括:
基于待降噪语音信号与参考语音信号之间的时域差异和/或频域差异,确定滤波参数;
基于滤波参数,对待降噪语音信号进行滤波。
基于上述任一实施例,对待降噪语音信号进行滤波,之后还包括:
对滤波后的待降噪语音信号进行单通道降噪,并基于单通道降噪后的待降噪语音信号定位待降噪语音信号的声源。
基于上述任一实施例,本发明还提供一种车辆,包括:
如上任一实施例所述的语音降噪装置,目标麦克风以及参考麦克风,目标麦克风设置于车内或车外,参考麦克风设置于车外。
具体地,在目标麦克风设置于车内时,可以基于设置于车外的参考麦克风进行如图6所示的车内语音降噪。在目标麦克风设置于车外时,可以基于设置于车外的参考麦克风进行如图7所示的车外语音降噪。
图9是本发明提供的电子设备的结构示意图,如图9所示,该电子设备可以包括:处理器(processor)910、存储器(memory)920、通信接口(Communications Interface)930和通信总线940,其中,处理器910,存储器920,通信接口930通过通信总线940完成相互间的通信。处理器910可以调用存储器920中的逻辑指令,以执行语音降噪方法,该方法包括:确定目标麦克风采集的待降噪语音信号,以及参考麦克风采集的参考语音信号,所述目标麦克风与所述参考麦克风之间的距离大于阈值;基于所述待降噪语音信号与所述参考语音信号之间的相关度,确定加权系数;基于所述加权系数,以及所述参考语音信号,从所述待降噪语音信号中提取得到干净语音信号。
此外,上述的存储器920中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的语音降噪方法,该方法包括:确定目标麦克风采集的待降噪语音信号,以及参考麦克风采集的参考语音信号,所述目标麦克风与所述参考麦克风之间的距离大于阈值;基于所述待降噪语音信号与所述参考语音信号之间的相关度,确定加权系数;基于所述加权系数,以及所述参考语音信号,从所述待降噪语音信号中提取得到干净语音信号。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的语音降噪方法,该方法包括:确定目标麦克风采集的待降噪语音信号,以及参考麦克风采集的参考语音信号,所述目标麦克风与所述参考麦克风之间的距离大于阈值;基于所述待降噪语音信号与所述参考语音信号之间的相关度,确定加权系数;基于所述加权系数,以及所述参考语音信号,从所述待降噪语音信号中提取得到干净语音信号。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种语音降噪方法,其特征在于,包括:
确定目标麦克风采集的待降噪语音信号,以及参考麦克风采集的参考语音信号,所述目标麦克风与所述参考麦克风之间的距离大于阈值;
基于所述待降噪语音信号与所述参考语音信号之间的相关度,确定加权系数;
基于所述加权系数,以及所述参考语音信号,从所述待降噪语音信号中提取得到干净语音信号。
2.根据权利要求1所述的语音降噪方法,其特征在于,所述基于所述加权系数,以及所述参考语音信号,从所述待降噪语音信号中提取得到干净语音信号,包括:
基于所述加权系数,对所述参考语音信号进行加权,得到加权语音信号;
基于所述加权语音信号,从所述待降噪语音信号中提取得到所述干净语音信号。
3.根据权利要求2所述的语音降噪方法,其特征在于,所述基于所述加权语音信号,从所述待降噪语音信号中提取得到所述干净语音信号,包括:
对所述加权语音信号以及所述待降噪语音信号进行信号相加,得到混合语音信号;
对所述混合语音信号进行语音降噪,得到所述干净语音信号。
4.根据权利要求1至3任一项所述的语音降噪方法,其特征在于,在存在多个目标麦克风的情况下,所述从所述待降噪语音信号中提取得到干净语音信号,之后还包括:
基于任意两个干净语音信号之间的相关度,确定权重系数;
基于所述权重系数,以及所述任意两个中任意一个干净语音信号,从另一个干净语音信号中提取得到期望语音信号;
基于各干净语音信号对应的期望语音信号,确定各期望语音信号对应的目标麦克风位置。
5.根据权利要求1至3任一项所述的语音降噪方法,其特征在于,所述基于所述待降噪语音信号与所述参考语音信号之间的相关度,确定加权系数,之前还包括:
基于所述待降噪语音信号与所述参考语音信号之间的时域差异和/或频域差异,确定滤波参数;
基于所述滤波参数,对所述待降噪语音信号进行滤波。
6.根据权利要求5所述的语音降噪方法,其特征在于,所述对所述待降噪语音信号进行滤波,之后还包括:
对滤波后的待降噪语音信号进行单通道降噪,并基于单通道降噪后的待降噪语音信号定位所述待降噪语音信号的声源。
7.一种语音降噪装置,其特征在于,包括:
信号确定单元,用于确定目标麦克风采集的待降噪语音信号,以及参考麦克风采集的参考语音信号,所述目标麦克风与所述参考麦克风之间的距离大于阈值;
系数确定单元,用于基于所述待降噪语音信号与所述参考语音信号之间的相关度,确定加权系数;
信号降噪单元,用于基于所述加权系数,以及所述参考语音信号,从所述待降噪语音信号中提取得到干净语音信号。
8.一种车辆,其特征在于,包括:
如权利要求7所述的语音降噪装置,所述目标麦克风以及所述参考麦克风,所述目标麦克风设置于车内或车外,所述参考麦克风设置于车外。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述语音降噪方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述语音降噪方法。
CN202311687258.9A 2023-12-06 2023-12-06 语音降噪方法、装置、车辆、电子设备和存储介质 Pending CN117558286A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311687258.9A CN117558286A (zh) 2023-12-06 2023-12-06 语音降噪方法、装置、车辆、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311687258.9A CN117558286A (zh) 2023-12-06 2023-12-06 语音降噪方法、装置、车辆、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN117558286A true CN117558286A (zh) 2024-02-13

Family

ID=89814681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311687258.9A Pending CN117558286A (zh) 2023-12-06 2023-12-06 语音降噪方法、装置、车辆、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN117558286A (zh)

Similar Documents

Publication Publication Date Title
EP3698360B1 (en) Noise reduction using machine learning
CN110610715B (zh) 一种基于cnn-dnn混合神经网络的降噪方法
US10614827B1 (en) System and method for speech enhancement using dynamic noise profile estimation
KR20180115984A (ko) 심화신경망 기반의 잡음 및 에코의 통합 제거 방법 및 장치
CN112700786B (zh) 语音增强方法、装置、电子设备和存储介质
CN112017682B (zh) 一种单通道语音同时降噪和去混响系统
CN110503967B (zh) 一种语音增强方法、装置、介质和设备
CN104505099A (zh) 去除语音信号中已知干扰的方法和设备
JP7486266B2 (ja) 深層フィルタを決定するための方法および装置
Jangjit et al. A new wavelet denoising method for noise threshold
CN111798860A (zh) 音频信号处理方法、装置、设备及存储介质
JP2016143042A (ja) 雑音除去装置及び雑音除去プログラム
CN103295580A (zh) 一种语音信号噪声抑制方法及装置
CN111009259B (zh) 一种音频处理方法和装置
Higuchi et al. Optimization of Speech Enhancement Front-End with Speech Recognition-Level Criterion.
CN117558286A (zh) 语音降噪方法、装置、车辆、电子设备和存储介质
KR101610708B1 (ko) 음성 인식 장치 및 방법
Miyazaki et al. Theoretical analysis of parametric blind spatial subtraction array and its application to speech recognition performance prediction
Chun et al. Comparison of cnn-based speech dereverberation using neural vocoder
Indumathi et al. An efficient speaker recognition system by employing BWT and ELM
KR20090111739A (ko) 잡음 제거 장치 및 방법
Soni et al. Comparing front-end enhancement techniques and multiconditioned training for robust automatic speech recognition
Wu et al. SADDEL: Joint speech separation and denoising model based on multitask learning
Prasad et al. Two microphone technique to improve the speech intelligibility under noisy environment
JP2006084928A (ja) 音声入力装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination