CN112017680A - 一种去混响方法及装置 - Google Patents

一种去混响方法及装置 Download PDF

Info

Publication number
CN112017680A
CN112017680A CN202010882329.0A CN202010882329A CN112017680A CN 112017680 A CN112017680 A CN 112017680A CN 202010882329 A CN202010882329 A CN 202010882329A CN 112017680 A CN112017680 A CN 112017680A
Authority
CN
China
Prior art keywords
sub
filter parameter
signal
filter
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010882329.0A
Other languages
English (en)
Other versions
CN112017680B (zh
Inventor
杨文星
黄公平
陈景东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202010882329.0A priority Critical patent/CN112017680B/zh
Publication of CN112017680A publication Critical patent/CN112017680A/zh
Application granted granted Critical
Publication of CN112017680B publication Critical patent/CN112017680B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请提供一种去混响方法及装置,方法包括:接收麦克风采集并发送的声源信号;根据声源信号、两个子滤波器参数的初始值以及去混响算法,确定两个子滤波器参数的确定值,以使代价函数的值最小;其中,去混响算法包括两个子滤波器参数,两个子滤波器参数之间运用克罗内克积运算;根据两个子滤波器参数的确定值,确定去混响后的声音信号。在上述方案中,将现有技术中的多通道线性预测滤波器,分解为时域和空域两个子滤波器参数的克罗内克积。由于经过基于克罗内克积的分解,因此去混响算法中所需要求逆的协方差矩阵的尺寸大大减小,从而使得去混响算法所需要的计算量随之减小,进而较低了计算的复杂度。

Description

一种去混响方法及装置
技术领域
本申请涉及语音信号处理领域,具体而言,涉及一种去混响方法及装置。
背景技术
在远程或者非手持模式下的语音通信以及人机交互系统中,由于声源信号在传播过程中会经过墙壁、地板或天花板等的反射,因此,麦克风传感器除了可以接收到直达波和一些对于听觉有益的早期反射之外,将不可避免地接收到由晚期反射所构成的混响成分。其中,这些混响成分的存在会使语音的质量以及可懂度降低,严重影响语音识别、声源定位等信号处理算法的性能。
现有技术中,去混响的方法主要包括四种类型:基于信道均衡的方法、基于谱抑制的方法、基于空域滤波的方法以及基于线性预测的方法。其中,基于线性预测的方法是设计一个预测滤波器来估计出混响成分,然后从观测信号去除掉这一部分得到期望信号的估计。其中,加权预测误差方法(Weighted-prediction-error,WPE)是基于线性预测的方法的一种。
WPE算法通过引入了预测时延并用随时间变化的期望信号的方差来对预测误差进行加权,从而提升了算法的性能,但是,WPE算法存在计算复杂度较高的问题。
发明内容
本申请实施例的目的在于提供一种去混响方法及装置,用以解决计算复杂度较高的技术问题。
为了实现上述目的,本申请实施例所提供的技术方案如下所示:
第一方面,本申请实施例提供一种去混响方法,包括:获取麦克风阵列采集的混响信号;其中,所述混响信号为声源信号经过多次反射产生的信号;;根据所述声源信号、所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小;其中,所述去混响算法包括第一子滤波器参数以及第二子滤波器参数,所述第一子滤波器参数以及所述第二子滤波器参数之间运用克罗内克积运算;根据所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,确定所述混响信号对应的期望信号的估计值为去混响后的声音信号。在上述方案中,将现有技术中的多通道线性预测滤波器,分解为时域和空域两个子滤波器参数的克罗内克积。由于经过基于克罗内克积的分解,因此去混响算法中所需要求逆的协方差矩阵的尺寸大大减小,从而使得去混响算法所需要的计算量随之减小,进而较低了计算的复杂度。
在本申请的可选实施例中,所述根据所述声源信号、所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小,包括:根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值;根据所述期望信号的估计值确定所述声源信号的方差;根据所述期望信号的估计值以及所述方差确定所述声源信号的两个子协方差矩阵以及一个子协方差向量;根据所述子协方差矩阵以及所述子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值;以所述新的第一子滤波器的值为所述第一子滤波器参数的初始值以及以所述新的第二子滤波器的值为所述第二子滤波器参数的初始值,执行所述根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值的步骤,直至所述去混响算法满足预设条件,并得到所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值。
在本申请的可选实施例中,所述根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值,包括:利用如下公式计算所述期望信号的估计值:
Figure BDA0002651532150000031
其中,
Figure BDA0002651532150000032
为所述期望信号的估计值,g1为所述第一子滤波器参数,长为L,g2为所述第二子滤波器参数,长为M,y(n)为第n帧的观测信号向量,
Figure BDA0002651532150000033
为长为ML的观测信号向量,D为预测时延,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量。
在本申请的可选实施例中,所述根据所述期望信号的估计值以及所述方差确定所述声源信号的两个子协方差矩阵,包括:利用如下公式计算所述声源信号的两个子协方差矩阵:
Figure BDA0002651532150000034
Figure BDA0002651532150000035
其中,
Figure BDA0002651532150000036
为大小为L×L的子协方差矩阵,
Figure BDA0002651532150000037
为大小为M×M的子协方差矩阵,
Figure BDA0002651532150000038
是长为L的向量,
Figure BDA0002651532150000039
为尺寸为ML×L的矩阵,
Figure BDA00026515321500000310
是长为M的向量,
Figure BDA00026515321500000311
为尺寸为ML×M的矩阵,g1为所述第一子滤波器参数,长为L,g2为所述第二子滤波器参数,长为M,IL为尺寸为L×L的单位矩阵,IM为尺寸为M×M的单位矩阵,y(n)为第n帧的观测信号向量,
Figure BDA00026515321500000312
为长为ML的观测信号向量,D为预测时延,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量,
Figure BDA0002651532150000041
为所述方差,
Figure BDA0002651532150000042
为所述期望信号的估计值。
在本申请的可选实施例中,所述根据所述期望信号的估计值以及所述方差确定所述声源信号的一个子协方差向量,包括:利用如下公式计算所述声源信号的一个子协方差向量:
Figure BDA0002651532150000043
其中,
Figure BDA0002651532150000044
为长为L的所述子协方差向量,
Figure BDA0002651532150000045
是长为L的向量,
Figure BDA0002651532150000046
为尺寸为ML×L的矩阵,
Figure BDA0002651532150000047
为长为ML的观测信号向量,IL为尺寸为L×L的单位矩阵,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量,D为预测时延,
Figure BDA0002651532150000048
为所述方差,
Figure BDA0002651532150000049
为所述期望信号的估计值。
在本申请的可选实施例中,所述根据所述子协方差矩阵以及所述子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值,包括:利用如下公式计算所述新的第一子滤波器的值以及所述新的第二子滤波器的值:
Figure BDA00026515321500000410
Figure BDA00026515321500000411
其中,g1 (1)为所述新的第一子滤波器的值,g2 (1)为所述新的第二子滤波器的值,
Figure BDA00026515321500000412
为大小为M×M的子协方差矩阵,
Figure BDA00026515321500000413
为大小为L×L的子协方差矩阵,
Figure BDA00026515321500000414
为长为L的所述子协方差向量,
Figure BDA00026515321500000415
是长为L的向量,
Figure BDA00026515321500000416
为尺寸为ML×L的矩阵,
Figure BDA0002651532150000051
是长为M的向量,
Figure BDA0002651532150000052
为尺寸为ML×M的矩阵,g1为所述第一子滤波器参数,长为L,g2为所述第二子滤波器参数,长为M,IL为尺寸为L×L的单位矩阵,IM为尺寸为M×M的单位矩阵,y(n)为第n帧的观测信号向量,
Figure BDA0002651532150000053
为长为ML的观测信号向量,D为预测时延,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量,d为短时傅里叶变换域中能够对应于期望方向的导向适量或者相对早期传递函数。
在本申请的可选实施例中,在所述获取麦克风阵列采集的混响信号之后,所述方法还包括:对所述声源信号进行傅里叶变换;根据所述傅里叶变换后的信号构建期望信号模型,并根据所述期望信号模型估计出对应的期望信号;基于所述克罗内克积运算对所述期望信号模型进行变换,得到所述去混响算法;根据所述去混响算法确定去混响输出信号;根据所述去混响输出信号确定所述代价函数。
第二方面,本申请实施例提供一种去混响装置,包括:获取模块,用于获取麦克风阵列采集的混响信号;其中,所述混响信号为声源信号经过多次反射产生的信号;第一确定模块,用于根据所述声源信号、所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小;其中,所述去混响算法包括第一子滤波器参数以及第二子滤波器参数,所述第一子滤波器参数以及所述第二子滤波器参数之间运用克罗内克积运算;第二确定模块,用于根据所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,确定所述混响信号对应的期望信号的估计值为去混响后的声音信号。在上述方案中,将现有技术中的多通道线性预测滤波器,分解为时域和空域两个子滤波器参数的克罗内克积。由于经过基于克罗内克积的分解,因此去混响算法中所需要求逆的协方差矩阵的尺寸大大减小,从而使得去混响算法所需要的计算量随之减小,进而较低了计算的复杂度。
在本申请的可选实施例中,所述第一确定模块还用于:根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值;根据所述期望信号的估计值确定所述声源信号的方差;根据所述期望信号的估计值以及所述方差确定所述声源信号的两个子协方差矩阵以及一个子协方差向量;根据所述子协方差矩阵以及所述子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值;以所述新的第一子滤波器的值为所述第一子滤波器参数的初始值以及以所述新的第二子滤波器的值为所述第二子滤波器参数的初始值,执行所述根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值的步骤,直至所述去混响算法满足预设条件,并得到所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值。
在本申请的可选实施例中,所述第一确定模块还用于:利用如下公式计算所述期望信号的估计值:
Figure BDA0002651532150000061
其中,
Figure BDA0002651532150000062
为所述期望信号的估计值,g1为所述第一子滤波器参数,长为L,g2为所述第二子滤波器参数,长为M,y(n)为第n帧的观测信号向量,
Figure BDA0002651532150000063
为长为ML的观测信号向量,D为预测时延,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量。
在本申请的可选实施例中,所述第一确定模块还用于:利用如下公式计算所述声源信号的两个子协方差矩阵:
Figure BDA0002651532150000064
Figure BDA0002651532150000071
其中,
Figure BDA0002651532150000072
为大小为L×L的子协方差矩阵,
Figure BDA0002651532150000073
为大小为M×M的子协方差矩阵,
Figure BDA0002651532150000074
是长为L的向量,
Figure BDA0002651532150000075
为尺寸为ML×L的矩阵,
Figure BDA0002651532150000076
是长为M的向量,
Figure BDA0002651532150000077
为尺寸为ML×M的矩阵,g1为所述第一子滤波器参数,长为L,g2为所述第二子滤波器参数,长为M,IL为尺寸为L×L的单位矩阵,IM为尺寸为M×M的单位矩阵,y(n)为第n帧的观测信号向量,
Figure BDA0002651532150000078
为长为ML的观测信号向量,D为预测时延,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量,
Figure BDA0002651532150000079
为所述方差,
Figure BDA00026515321500000710
为所述期望信号的估计值。
在本申请的可选实施例中,所述第一确定模块还用于:利用如下公式计算所述声源信号的一个子协方差向量:
Figure BDA00026515321500000711
其中,
Figure BDA00026515321500000712
为长为L的所述子协方差向量,
Figure BDA00026515321500000713
是长为L的向量,
Figure BDA00026515321500000714
为尺寸为ML×L的矩阵,
Figure BDA00026515321500000715
为长为ML的观测信号向量,IL为尺寸为L×L的单位矩阵,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量,D为预测时延,
Figure BDA00026515321500000716
为所述方差,
Figure BDA00026515321500000717
为所述期望信号的估计值。
在本申请的可选实施例中,所述第一确定模块还用于:利用如下公式计算所述新的第一子滤波器的值以及所述新的第二子滤波器的值:
Figure BDA00026515321500000718
Figure BDA0002651532150000081
其中,g1 (1)为所述新的第一子滤波器的值,g2 (1)为所述新的第二子滤波器的值,
Figure BDA0002651532150000082
为大小为M×M的子协方差矩阵,
Figure BDA0002651532150000083
为大小为L×L的子协方差矩阵,
Figure BDA0002651532150000084
为长为L的所述子协方差向量,
Figure BDA0002651532150000085
是长为L的向量,
Figure BDA0002651532150000086
为尺寸为ML×L的矩阵,
Figure BDA0002651532150000087
是长为M的向量,
Figure BDA0002651532150000088
为尺寸为ML×M的矩阵,g1为所述第一子滤波器参数,长为L,g2为所述第二子滤波器参数,长为M,IL为尺寸为L×L的单位矩阵,IM为尺寸为M×M的单位矩阵,y(n)为第n帧的观测信号向量,
Figure BDA0002651532150000089
为长为ML的观测信号向量,D为预测时延,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量,d为短时傅里叶变换域中能够对应于期望方向的导向适量或者相对早期传递函数。
在本申请的可选实施例中,所述装置还包括:第一变换模块,用于对所述声源信号进行傅里叶变换;估计模块,用于根据所述傅里叶变换后的信号构建期望信号模型,并根据所述期望信号模型估计出对应的期望信号;第二变换模块,用于基于所述克罗内克积运算对所述期望信号模型进行变换,得到所述去混响算法;第三确定模块,用于根据所述去混响算法确定去混响输出信号;第四确定模块,用于根据所述去混响输出信号确定所述代价函数。
第三方面,本申请实施例提供一种电子设备,包括:处理器、存储器和总线;所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如第一方面中的去混响方法。
第四方面,本申请实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如第一方面中的去混响方法。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举本申请实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种去混响方法的流程图;
图2为本申请实施例提供的另一种去混响方法的流程图;
图3为本申请实施例提供的步骤S202的具体实施方式;
图4为本申请实施例提供的一种去混响装置的结构框图;
图5为本申请实施例提供的一种电子设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
请参照图1,图1为本申请实施例提供的一种去混响方法的流程图,该去混响方法可以包括如下步骤:
步骤S101:对声源信号进行傅里叶变换。
步骤S102:根据傅里叶变换后的信号构建期望信号模型,并根据期望信号模型估计出对应的期望信号。
步骤S103:基于克罗内克积运算对期望信号模型进行变换,得到去混响算法。
步骤S104:根据去混响算法确定去混响输出信号。
步骤S105:根据去混响输出信号确定代价函数。
具体的,在一个室内环境内(例如:录音室、教室等)内的声信号采集过程中,一个由M个麦克风组成的阵列接收到的信号不仅包含了由声源信号卷积上房间冲激响应所产生的混响信号,还包含了一部分的背景噪声。在离散时间k,第m个麦克风所接收到的信号ym(k)可表示为:
ym(k)=hm(k)*s(k)+vm(k),m=1,2,...,M; (1)
其中,hm(k)为声源信号到第m个麦克风的房间冲激响应,s(k)为声源信号,*表示线性卷积,vm(k)为第m个麦克风所接收到的加性噪声。
为了提高算法效率,可以在频域进行处理(步骤S101),因此,在短时傅里叶变换域,公式(1)可以重新表示为Ym(n,w):
Figure BDA0002651532150000101
其中,n是时帧指数,w表示角频率,Hm(l,w)是hm(k)的傅里叶变换,阶数为L,而Ym(n,w)、S(n,w)和Vm(n,w)分别是ym(k)、s(k)和vm(k)的傅里叶变换。需要说明的是,为了表示简洁,后续实施例中将省略w。
在现有技术中,基于多通道线性预测的去混响技术通过从当前帧之前的L帧观测信号中估计出混响,然后将其从观测信号中减去从而得到直达波和早期反射的估计(即期望信号的估计值
Figure BDA0002651532150000102
)。这个过程可以通过下面去混响算法表示(步骤S102):
Figure BDA0002651532150000103
其中,g为预测滤波器,长为ML,Ym(n)为参考信号,
Figure BDA0002651532150000104
为长为ML的观测信号向量,而在第n-D-l的长为M的观测信号向量可以表示为
y(n-D-l)=[Y1(n-D-l)…YM(n-D-l)]T,l=0,1,2,...L-1; (5)
其中,D为预测时延,用来避免过白化的问题。
在WPE算法中,纯净语音信号的时频域系数假定服从一个均值为0,方差为λ(n)的高斯分布,从而根据最大似然估计法可以构造代价函数J(g)为:
Figure BDA0002651532150000111
其中,N是总时帧数,
Figure BDA0002651532150000112
为所估计的期望信号的方差。
通过最小化代价函数,就可以得到多通道线性预测滤波器g的解:
Figure BDA0002651532150000113
其中,
Figure BDA0002651532150000114
Figure BDA0002651532150000115
Figure BDA0002651532150000116
Figure BDA0002651532150000117
是经过加权的观测信号的协方差矩阵和向量,大小分别为ML×ML和ML×1。
然而,采用上述WPE算法存在计算复杂度较高的问题。因此,本申请实施例提供一种去混响算法,将现有技术中的多通道线性预测滤波器,分解为时域和空域两个子滤波器参数的克罗内克积(Kronocker)。由于经过基于克罗内克积的分解,因此去混响算法中所需要求逆的协方差矩阵的尺寸大大减小,从而使得去混响算法所需要的计算量随之减小,进而较低了计算的复杂度。
其中,本申请实施例提供的去混响算法为(步骤S103):
Figure BDA0002651532150000121
其中,
Figure BDA0002651532150000122
表示克罗内克积,g1为第一子滤波器参数,长为L,L为第一子滤波器参数的阶数,g2为第二子滤波器参数,长为M。
在上述公式(10)中,由于第一子滤波器参数以及第二滤波器参数的长度明显小于ML,因此有助于减小算法复杂度。同时,分解后的第二子滤波器可以采用波束形成器,对当前帧的观测信号向量进行滤波,去除掉一部分的混响和噪声,以此波束形成的输出
Figure BDA0002651532150000128
来替换原本的参考信号Ym(n),这样可以在不影响观测信号帧间相关性的同时去掉噪声和混响,使得上述去混响算法具有较好的抗噪性能。
接着,可以利用如下的克罗内克积运算具有的性质:
Figure BDA0002651532150000123
其中,IL为尺寸为L×L的单位矩阵,IM为尺寸为M×M的单位矩阵,
Figure BDA0002651532150000124
为尺寸为ML×L的矩阵,
Figure BDA0002651532150000125
为尺寸为ML×M的矩阵。
得到去混响输出信号(步骤S104):
Figure BDA0002651532150000126
以及,
Figure BDA0002651532150000127
其中,
Figure BDA0002651532150000131
Figure BDA0002651532150000132
Figure BDA0002651532150000133
Figure BDA0002651532150000134
基于上述公式(10),代价函数可以表示为(步骤S105):
Figure BDA0002651532150000135
上述公式(18)还可以表示为:
Figure BDA0002651532150000136
Figure BDA0002651532150000137
其中,
Figure BDA0002651532150000138
Figure BDA0002651532150000139
是长为L的子协方差向量,
Figure BDA00026515321500001310
为大小为L×L的子协方差矩阵,
Figure BDA0002651532150000141
为大小为M×M的子协方差矩阵。
进一步的,请参照图2,图2为本申请实施例提供的另一种去混响方法的流程图,该去混响方法基于上述去混响算法,对麦克风采集到的声源信号进行去混响处理。该去混响方法可以包括如下步骤:
步骤S201:获取麦克风阵列采集的混响信号。
步骤S202:根据声源信号、第一子滤波器参数的初始值、第二子滤波器参数的初始值以及去混响算法,确定第一子滤波器参数的确定值以及第二子滤波器参数的确定值,以使代价函数的值最小。
步骤S203:根据第一子滤波器参数的确定值以及第二子滤波器参数的确定值,确定混响信号对应的期望信号的估计值为去混响后的声音信号。
具体的,请参照图3,图3为本申请实施例提供的步骤S202的具体实施方式,上述步骤S202可以包括如下步骤:
步骤S301:根据第一子滤波器参数的初始值、第二子滤波器参数的初始值以及去混响算法计算声源信号对应的期望信号的估计值。
步骤S302:根据期望信号的估计值确定声源信号的方差。
步骤S303:根据期望信号的估计值以及方差确定声源信号的两个子协方差矩阵以及一个子协方差向量。
步骤S304:根据子协方差矩阵以及子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值。
步骤S305:以新的第一子滤波器的值为第一子滤波器参数的初始值以及以新的第二子滤波器的值为第二子滤波器参数的初始值,执行步骤S301,直至去混响算法满足预设条件,并得到第一子滤波器参数的确定值以及第二子滤波器参数的确定值。
其中,可以给定第一子滤波器参数的初始值g1 (0)=0以及第二子滤波器参数的初始值
Figure BDA0002651532150000151
然后利用公式(10)计算期望信号的估计值:
Figure BDA0002651532150000152
以及声源信号的方差
Figure BDA0002651532150000153
随后,可以利用公式(22)及公式(23)计算声源信号的两个子协方差矩阵:
Figure BDA0002651532150000154
Figure BDA0002651532150000155
以及利用公式(21)计算所述声源信号的一个子协方差向量:
Figure BDA0002651532150000156
其中,再给定第一子滤波器参数g1 (0)的初始值之后,可以在保证期望方向无失真响应的前提下,最小化代价函数,即
minJ(g2|g1 (0))s.t.g2 Hd=1; (24)
其中,d为短时傅里叶变换域中能够对应于期望方向的导向适量或者相对早期传递函数。
因此,可以将上述优化问题的解表示为:
Figure BDA0002651532150000157
相似的,再给定第二子滤波器参数g2 (0)的初始值之后,可以在保证期望方向无失真响应的前提下,最小化代价函数,即
minJ(g1|g2 (0)); (26)
因此,同样的可以将上述优化问题的解表示为:
Figure BDA0002651532150000161
显然,请参照图3,可以看出,上述求解第一子滤波器参数以及第二子滤波器参数的过程是一个迭代循环的过程:
根据第一子滤波器参数的初始值、第二子滤波器参数的初始值以及去混响算法计算声源信号对应的期望信号的估计值;根据期望信号的估计值确定声源信号的方差;根据方差确定声源信号的两个子协方差矩阵以及一个子协方差向量;根据子协方差矩阵以及子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值;以新的第一子滤波器的值为第一子滤波器参数的初始值以及以新的第二子滤波器的值为第二子滤波器参数的初始值,根据第一子滤波器参数的初始值、第二子滤波器参数的初始值以及去混响算法计算声源信号对应的期望信号的估计值;根据期望信号的估计值确定声源信号的方差;根据方差确定声源信号的两个子协方差矩阵以及一个子协方差向量;根据子协方差矩阵以及子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值……直至去混响算法满足预设条件,并得到第一子滤波器参数的确定值g1=g1 (P)以及第二子滤波器参数的确定值g2=g2 (P)
其中,去混响算法满足预设条件可以有多种情况,例如:去混响算法收敛、迭代次数达到预设次数(如:三次等)等,本申请实施例对此不作具体的限定。
因此,在上述方案中,将现有技术中的多通道线性预测滤波器,分解为时域和空域两个子滤波器参数的克罗内克积。由于经过基于克罗内克积的分解,因此去混响算法中所需要求逆的协方差矩阵的尺寸大大减小,从而使得去混响算法所需要的计算量随之减小,进而较低了计算的复杂度。
请参照图4,图4为本申请实施例提供的一种去混响装置的结构框图,该去混响装置可以包括:获取模块401,用于获取麦克风阵列采集的混响信号;其中,所述混响信号为声源信号经过多次反射产生的信号;第一确定模块402,用于根据所述声源信号、所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小;其中,所述去混响算法包括第一子滤波器参数以及第二子滤波器参数,所述第一子滤波器参数以及所述第二子滤波器参数之间运用克罗内克积运算;第二确定模块403,用于根据所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,确定所述混响信号对应的期望信号的估计值为去混响后的声音信号。
在本申请实施例中,将现有技术中的多通道线性预测滤波器,分解为时域和空域两个子滤波器参数的克罗内克积。由于经过基于克罗内克积的分解,因此去混响算法中所需要求逆的协方差矩阵的尺寸大大减小,从而使得去混响算法所需要的计算量随之减小,进而较低了计算的复杂度。
进一步的,所述第一确定模块402还用于:根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值;根据所述期望信号的估计值确定所述声源信号的方差;根据所述期望信号的估计值以及所述方差确定所述声源信号的两个子协方差矩阵以及一个子协方差向量;根据所述子协方差矩阵以及所述子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值;以所述新的第一子滤波器的值为所述第一子滤波器参数的初始值以及以所述新的第二子滤波器的值为所述第二子滤波器参数的初始值,执行所述根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值的步骤,直至所述去混响算法满足预设条件,并得到所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值。
进一步的,所述第一确定模块402还用于:利用如下公式计算所述期望信号的估计值:
Figure BDA0002651532150000181
其中,
Figure BDA0002651532150000182
为所述期望信号的估计值,g1为所述第一子滤波器参数,长为L,g2为所述第二子滤波器参数,长为M,y(n)为第n帧的观测信号向量,
Figure BDA0002651532150000183
为长为ML的观测信号向量,D为预测时延,L为第一子滤波器参数的阶数,M为所述麦克风的数量。
进一步的,所述第一确定模块402还用于:利用如下公式计算所述声源信号的两个子协方差矩阵:
Figure BDA0002651532150000184
Figure BDA0002651532150000185
其中,
Figure BDA0002651532150000186
为大小为L×L的子协方差矩阵,
Figure BDA0002651532150000187
为大小为M×M的子协方差矩阵,
Figure BDA0002651532150000188
是长为L的向量,
Figure BDA0002651532150000189
为尺寸为ML×L的矩阵,
Figure BDA00026515321500001810
是长为M的向量,
Figure BDA00026515321500001811
为尺寸为ML×M的矩阵,g1为所述第一子滤波器参数,长为L,g2为所述第二子滤波器参数,长为M,IL为尺寸为L×L的单位矩阵,IM为尺寸为M×M的单位矩阵,y(n)为第n帧的观测信号向量,
Figure BDA00026515321500001812
为长为ML的观测信号向量,D为预测时延,L为第一子滤波器参数的阶数,M为所述麦克风的数量,
Figure BDA00026515321500001813
为所述方差,
Figure BDA00026515321500001814
为所述期望信号的估计值。
进一步的,所述第一确定模块402还用于:利用如下公式计算所述声源信号的一个子协方差向量:
Figure BDA0002651532150000191
其中,
Figure BDA0002651532150000192
为长为L的所述子协方差向量,
Figure BDA0002651532150000193
是长为L的向量,
Figure BDA0002651532150000194
为尺寸为ML×L的矩阵,
Figure BDA0002651532150000195
为长为ML的观测信号向量,IL为尺寸为L×L的单位矩阵,L为第一子滤波器参数的阶数,M为所述麦克风的数量,D为预测时延,
Figure BDA0002651532150000196
为所述方差,
Figure BDA0002651532150000197
为所述期望信号的估计值。
进一步的,所述第一确定模块402还用于:利用如下公式计算所述新的第一子滤波器的值以及所述新的第二子滤波器的值:
Figure BDA0002651532150000198
Figure BDA0002651532150000199
其中,g1 (1)为所述新的第一子滤波器的值,g2 (1)为所述新的第二子滤波器的值,
Figure BDA00026515321500001910
为大小为M×M的子协方差矩阵,
Figure BDA00026515321500001911
为大小为L×L的子协方差矩阵,
Figure BDA00026515321500001912
为长为L的所述子协方差向量,
Figure BDA00026515321500001913
是长为L的向量,
Figure BDA00026515321500001914
为尺寸为ML×L的矩阵,
Figure BDA00026515321500001915
是长为M的向量,
Figure BDA00026515321500001916
为尺寸为ML×M的矩阵,g1为所述第一子滤波器参数,长为L,g2为所述第二子滤波器参数,长为M,IL为尺寸为L×L的单位矩阵,IM为尺寸为M×M的单位矩阵,y(n)为第n帧的观测信号向量,
Figure BDA00026515321500001917
为长为ML的观测信号向量,D为预测时延,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量,d为短时傅里叶变换域中能够对应于期望方向的导向适量或者相对早期传递函数。
进一步的,所述去混响装置400还包括:第一变换模块,用于对所述声源信号进行傅里叶变换;估计模块,用于根据所述傅里叶变换后的信号构建期望信号模型,并根据所述期望信号模型估计出对应的期望信号;第二变换模块,用于基于所述克罗内克积运算对所述期望信号模型进行变换,得到所述去混响算法;第三确定模块,用于根据所述去混响算法确定去混响输出信号;第四确定模块,用于根据所述去混响输出信号确定所述代价函数。
请参照图5,图5为本申请实施例提供的一种电子设备的结构框图,该电子设备500包括:至少一个处理器501,至少一个通信接口502,至少一个存储器503和至少一个通信总线504。其中,通信总线504用于实现这些组件直接的连接通信,通信接口502用于与其他节点设备进行信令或数据的通信,存储器503存储有处理器501可执行的机器可读指令。当电子设备500运行时,处理器501与存储器503之间通过通信总线504通信,机器可读指令被处理器501调用时执行上述去混响方法。
例如,本申请实施例的处理器501通过通信总线504从存储器503读取计算机程序并执行该计算机程序可以实现如下方法:步骤S201:获取麦克风阵列采集的混响信号。步骤S202:根据声源信号、第一子滤波器参数的初始值、第二子滤波器参数的初始值以及去混响算法,确定第一子滤波器参数的确定值以及第二子滤波器参数的确定值,以使代价函数的值最小。步骤S203:根据第一子滤波器参数的确定值以及第二子滤波器参数的确定值,确定混响信号对应的期望信号的估计值为去混响后的声音信号。
处理器501可以是一种集成电路芯片,具有信号处理能力。上述处理器501可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各种方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器503可以包括但不限于随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
可以理解,图5所示的结构仅为示意,电子设备500还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。图5中所示的各组件可以采用硬件、软件或其组合实现。于本申请实施例中,电子设备500可以是,但不限于台式机、笔记本电脑、智能手机、智能穿戴设备、车载设备等实体设备,还可以是虚拟机等虚拟设备。另外,电子设备500也不一定是单台设备,还可以是多台设备的组合,例如服务器集群,等等。
本申请实施例还提供一种计算机程序产品,包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述实施例中去混响方法的步骤,例如包括:获取麦克风阵列采集的混响信号;根据所述声源信号、所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小;其中,所述去混响算法包括第一子滤波器参数以及第二子滤波器参数,所述第一子滤波器参数以及所述第二子滤波器参数之间运用克罗内克积运算;根据所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,确定所述混响信号对应的期望信号的估计值为去混响后的声音信号。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种去混响方法,其特征在于,包括:
获取麦克风阵列采集的混响信号;其中,所述混响信号为声源信号经过多次反射产生的信号;
根据所述声源信号、第一子滤波器参数的初始值、第二子滤波器参数的初始值以及去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小;其中,所述去混响算法包括第一子滤波器参数以及第二子滤波器参数,所述第一子滤波器参数以及所述第二子滤波器参数之间运用克罗内克积运算;
根据所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,确定所述混响信号对应的期望信号的估计值为去混响后的声音信号。
2.根据权利要求1所述的去混响方法,其特征在于,所述根据所述声源信号、所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小,包括:
根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值;
根据所述期望信号的估计值确定所述声源信号的方差;
根据所述期望信号的估计值以及所述方差确定所述声源信号的两个子协方差矩阵以及一个子协方差向量;
根据所述子协方差矩阵以及所述子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值;
以所述新的第一子滤波器的值为所述第一子滤波器参数的初始值以及以所述新的第二子滤波器的值为所述第二子滤波器参数的初始值,执行所述根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值的步骤,直至所述去混响算法满足预设条件,并得到所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值。
3.根据权利要求2所述的去混响方法,其特征在于,所述根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值,包括:
利用如下公式计算所述期望信号的估计值:
Figure FDA0002651532140000021
其中,
Figure FDA0002651532140000022
为所述期望信号的估计值,g1为所述第一子滤波器参数,长为L,g2为所述第二子滤波器参数,长为M,y(n)为第n帧的观测信号向量,
Figure FDA0002651532140000023
为长为ML的观测信号向量,D为预测时延,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量。
4.根据权利要求2所述的去混响方法,其特征在于,所述根据所述期望信号的估计值以及所述方差确定所述声源信号的两个子协方差矩阵,包括:
利用如下公式计算所述声源信号的两个子协方差矩阵:
Figure FDA0002651532140000024
Figure FDA0002651532140000025
其中,
Figure FDA0002651532140000026
为大小为L×L的子协方差矩阵,
Figure FDA0002651532140000027
为大小为M×M的子协方差矩阵,
Figure FDA0002651532140000028
是长为L的向量,
Figure FDA0002651532140000029
为尺寸为ML×L的矩阵,
Figure FDA00026515321400000210
是长为M的向量,
Figure FDA00026515321400000211
为尺寸为ML×M的矩阵,g1为所述第一子滤波器参数,长为L,g2为所述第二子滤波器参数,长为M,IL为尺寸为L×L的单位矩阵,IM为尺寸为M×M的单位矩阵,y(n)为第n帧的观测信号向量,
Figure FDA0002651532140000031
为长为ML的观测信号向量,D为预测时延,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量,
Figure FDA0002651532140000032
为所述方差,
Figure FDA0002651532140000033
为所述期望信号的估计值。
5.根据权利要求2所述的去混响方法,其特征在于,所述根据所述期望信号的估计值以及所述方差确定所述声源信号的一个子协方差向量,包括:
利用如下公式计算所述声源信号的一个子协方差向量:
Figure FDA0002651532140000034
其中,
Figure FDA0002651532140000035
为长为L的所述子协方差向量,
Figure FDA0002651532140000036
是长为L的向量,
Figure FDA0002651532140000037
为尺寸为ML×L的矩阵,
Figure FDA0002651532140000038
为长为ML的观测信号向量,IL为尺寸为L×L的单位矩阵,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量,D为预测时延,
Figure FDA0002651532140000039
为所述方差,
Figure FDA00026515321400000310
为所述期望信号的估计值。
6.根据权利要求2所述的去混响方法,其特征在于,所述根据所述子协方差矩阵以及所述子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值,包括:
利用如下公式计算所述新的第一子滤波器的值以及所述新的第二子滤波器的值:
Figure FDA00026515321400000311
Figure FDA00026515321400000312
其中,g1 (1)为所述新的第一子滤波器的值,g2 (1)为所述新的第二子滤波器的值,
Figure FDA0002651532140000041
为大小为M×M的子协方差矩阵,
Figure FDA0002651532140000042
为大小为L×L的子协方差矩阵,
Figure FDA0002651532140000043
为长为L的所述子协方差向量,
Figure FDA0002651532140000044
是长为L的向量,
Figure FDA0002651532140000045
为尺寸为ML×L的矩阵,
Figure FDA0002651532140000046
是长为M的向量,
Figure FDA0002651532140000047
为尺寸为ML×M的矩阵,g1为所述第一子滤波器参数,长为L,g2为所述第二子滤波器参数,长为M,IL为尺寸为L×L的单位矩阵,IM为尺寸为M×M的单位矩阵,y(n)为第n帧的观测信号向量,
Figure FDA0002651532140000048
为长为ML的观测信号向量,D为预测时延,L为所述第一子滤波器参数的阶数,M为所述麦克风的数量,d为短时傅里叶变换域中对应于期望方向的导向适量或者相对早期传递函数。
7.根据权利要求1所述的去混响方法,其特征在于,在所述获取麦克风阵列采集的混响信号之后,所述方法还包括:
对所述声源信号进行傅里叶变换;
根据所述傅里叶变换后的信号构建期望信号模型,并根据所述期望信号模型估计出对应的期望信号;
基于所述克罗内克积运算对所述期望信号模型进行变换,得到所述去混响算法;
根据所述去混响算法确定去混响输出信号;
根据所述去混响输出信号确定所述代价函数。
8.一种去混响装置,其特征在于,包括:
获取模块,用于获取麦克风阵列采集的混响信号;其中,所述混响信号为声源信号经过多次反射产生的信号;
第一确定模块,用于根据所述声源信号、第一子滤波器参数的初始值、第二子滤波器参数的初始值以及去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小;其中,所述去混响算法包括第一子滤波器参数以及第二子滤波器参数,所述第一子滤波器参数以及所述第二子滤波器参数之间运用克罗内克积运算;
第二确定模块,用于根据所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,确定所述混响信号对应的期望信号的估计值为去混响后的声音信号。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线;
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1-7任一项所述的去混响方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令被计算机运行时,使所述计算机执行如权利要求1-7任一项所述的去混响方法。
CN202010882329.0A 2020-08-26 2020-08-26 一种去混响方法及装置 Active CN112017680B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010882329.0A CN112017680B (zh) 2020-08-26 2020-08-26 一种去混响方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010882329.0A CN112017680B (zh) 2020-08-26 2020-08-26 一种去混响方法及装置

Publications (2)

Publication Number Publication Date
CN112017680A true CN112017680A (zh) 2020-12-01
CN112017680B CN112017680B (zh) 2024-07-02

Family

ID=73502673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010882329.0A Active CN112017680B (zh) 2020-08-26 2020-08-26 一种去混响方法及装置

Country Status (1)

Country Link
CN (1) CN112017680B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113655441A (zh) * 2021-08-11 2021-11-16 西南科技大学 一种低复杂度折中预白化的鲁棒声源定位方法
CN115588438A (zh) * 2022-12-12 2023-01-10 成都启英泰伦科技有限公司 一种基于双线性分解的wls多通道语音去混响方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102440002A (zh) * 2009-04-09 2012-05-02 挪威科技大学技术转让公司 用于传感器阵列的优化模态波束成型器
CN104115223A (zh) * 2012-02-17 2014-10-22 株式会社日立制作所 混响去除参数估计装置以及方法、混响/回波去除参数估计装置、混响去除装置、混响/回波去除装置、以及混响去除装置在线会议系统
WO2015165539A1 (en) * 2014-04-30 2015-11-05 Huawei Technologies Co., Ltd. Signal processing apparatus, method and computer program for dereverberating a number of input audio signals
CN108172231A (zh) * 2017-12-07 2018-06-15 中国科学院声学研究所 一种基于卡尔曼滤波的去混响方法及系统
EP3460795A1 (en) * 2017-09-21 2019-03-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal processor and method for providing a processed audio signal reducing noise and reverberation

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102440002A (zh) * 2009-04-09 2012-05-02 挪威科技大学技术转让公司 用于传感器阵列的优化模态波束成型器
CN104115223A (zh) * 2012-02-17 2014-10-22 株式会社日立制作所 混响去除参数估计装置以及方法、混响/回波去除参数估计装置、混响去除装置、混响/回波去除装置、以及混响去除装置在线会议系统
WO2015165539A1 (en) * 2014-04-30 2015-11-05 Huawei Technologies Co., Ltd. Signal processing apparatus, method and computer program for dereverberating a number of input audio signals
CN106233382A (zh) * 2014-04-30 2016-12-14 华为技术有限公司 一种对若干个输入音频信号进行去混响的信号处理装置
EP3460795A1 (en) * 2017-09-21 2019-03-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal processor and method for providing a processed audio signal reducing noise and reverberation
CN111512367A (zh) * 2017-09-21 2020-08-07 弗劳恩霍夫应用研究促进协会 提供处理的降噪且混响降低的音频信号的信号处理器和方法
CN108172231A (zh) * 2017-12-07 2018-06-15 中国科学院声学研究所 一种基于卡尔曼滤波的去混响方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
何冲;王冬霞;王旭东;蒋茂松;: "一种基于正交非负矩阵分解的多通道线性预测语音去混响方法", 声学技术, no. 05, 15 October 2018 (2018-10-15) *
夏雪;张明敏;王平波;: "PAMF处理的抗混响应用仿真研究", 武汉理工大学学报(交通科学与工程版), no. 04, 15 August 2013 (2013-08-15) *
梅铁民;: "基于反幂法和卡尔曼滤波的自适应语音去混响方法", 信号处理, no. 07, 25 July 2018 (2018-07-25) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113655441A (zh) * 2021-08-11 2021-11-16 西南科技大学 一种低复杂度折中预白化的鲁棒声源定位方法
CN115588438A (zh) * 2022-12-12 2023-01-10 成都启英泰伦科技有限公司 一种基于双线性分解的wls多通道语音去混响方法

Also Published As

Publication number Publication date
CN112017680B (zh) 2024-07-02

Similar Documents

Publication Publication Date Title
CN108141656B (zh) 用于麦克风的数字信号处理的方法和装置
EP2936830B1 (en) Filter and method for informed spatial filtering using multiple instantaneous direction-of-arrivial estimates
CN110265054B (zh) 语音信号处理方法、装置、计算机可读存储介质和计算机设备
WO2019113253A1 (en) Voice enhancement in audio signals through modified generalized eigenvalue beamformer
CN112017680B (zh) 一种去混响方法及装置
KR20160095008A (ko) 음향 에코 제거를 위한 룸 임펄스 응답을 추정하는 방법
CN110211602B (zh) 智能语音增强通信方法及装置
JP6225245B2 (ja) 信号処理装置、方法及びプログラム
CN112201273B (zh) 一种噪声功率谱密度计算方法、系统、设备及介质
WO2016119388A1 (zh) 一种基于语音信号构造聚焦协方差矩阵的方法及装置
CN112997249B (zh) 语音处理方法、装置、存储介质及电子设备
CN111445916B (zh) 一种会议系统中音频去混响方法、装置及存储介质
CN114220453B (zh) 基于频域卷积传递函数的多通道非负矩阵分解方法及系统
US11640830B2 (en) Multi-microphone signal enhancement
CN115662394A (zh) 语音提取方法、装置、存储介质及电子装置
US11120814B2 (en) Multi-microphone signal enhancement
CN112397080B (zh) 回声消除方法及装置、语音设备及计算机可读存储介质
CN110661510B (zh) 波束形成器形成方法、波束形成方法、装置及电子设备
Brunnström et al. Fast low-rank filtered-x least mean squares for multichannel active noise control
KR101558397B1 (ko) 반향필터 추정방법, 반향제거필터 추정방법 및 이를 이용한 단일채널 반향제거방법
Cornelis et al. A QRD-RLS based frequency domain multichannel wiener filter algorithm for noise reduction in hearing aids
CN116913299A (zh) 多通道回声消除方法、装置、设备和存储介质
TWI517143B (zh) 可消除雜音且增進語音辨識率之方法
CN112260662A (zh) 一种自适应滤波方法、计算机设备和装置
EP4205376A1 (en) Acoustic processing device for mimo acoustic echo cancellation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant