CN107924685B - 信号处理装置和方法 - Google Patents

信号处理装置和方法 Download PDF

Info

Publication number
CN107924685B
CN107924685B CN201580082262.XA CN201580082262A CN107924685B CN 107924685 B CN107924685 B CN 107924685B CN 201580082262 A CN201580082262 A CN 201580082262A CN 107924685 B CN107924685 B CN 107924685B
Authority
CN
China
Prior art keywords
blind source
output signals
signal processing
coefficients
separator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580082262.XA
Other languages
English (en)
Other versions
CN107924685A (zh
Inventor
米洛斯·马尔科维奇
卡里姆·赫尔旺尼
赫伯特·毕希纳
西蒙·高迪斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
University of Cambridge
Original Assignee
Huawei Technologies Co Ltd
University of Cambridge
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd, University of Cambridge filed Critical Huawei Technologies Co Ltd
Publication of CN107924685A publication Critical patent/CN107924685A/zh
Application granted granted Critical
Publication of CN107924685B publication Critical patent/CN107924685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及一种用于分离多个来自MIMO系统的混合信号(201)以迭代地获得多个输出信号(203)的信号处理装置(200)。所述多个混合信号(201)为所述MIMO系统对多个源信号的响应。所述信号处理装置(200)包括:多个盲源分离器(205A–N),包括基于第一盲源分离技术的第一盲源分离器(205A)和基于第二盲源分离技术的第二盲源分离器(205N),其中所述第一盲源分离器(205A)用于根据描述所述MIMO系统的第一系数集合计算第一多个初步输出信号(202A),所述第二盲源分离器(205N)用于根据描述所述MIMO系统的第二系数集合计算第二多个初步输出信号(202N);合路器(207),用于基于合路器系数集合将所述第一多个初步输出信号(202A)与所述第二多个初步输出信号(202N)进行合并,以获得所述多个输出信号(203),其中每个合路器系数与所述多个盲源分离器(205A–N)中的盲源分离器相关联;调节器(209),用于基于所述多个输出信号(203)调整所述第一盲源分离器(205A)的第一系数集合和所述第二盲源分离器(205N)的第二系数集合。

Description

信号处理装置和方法
技术领域
一般来说,本发明涉及信号处理领域。更具体地说,本发明涉及用于盲源分离的音频信号处理装置和方法。
背景技术
在音频或声学信号处理领域,通常将混响环境中的多个声源与多个麦克风之间的传播路径的集合建模为具有有限长单位冲激响应(finite impulse response,简称FIR)的线性多输入/多输出(multiple-input multiple-output,简称MIMO)滤波器。在这种MIMO-FIR系统中,每个麦克风拾取混响即“滤波”的源信号的混合。通常,MIMO混合系统本身不能直接访问,唯有接收麦克风信号。
通常情况下,所述MIMO混合系统包括声学场景的所有可分析信息。一旦获知这个MIMO混合系统,就可以,例如,提取原始源信号,估计房间内源位置,分析该房间的声学结构/反射,并估计该房间的混响时长。
因此,对于声场景分析,一个十分理想的目标是仅通过可用的麦克风信号估计所述MIMO混合系统,其也称为盲MIMO系统识别。精确的盲MIMO系统识别可认作是最优的声场分析。
已经表明,盲MIMO系统识别与卷积混合信号的宽带盲源分离(broadband blindsource separation,简称BSS)之间存在基本关系(参见于2005年3月在美国新泽西州皮斯卡塔韦召开的关于免提语音通信和麦克风阵列(Hands-Free Speech Communication andMicrophone Arrays,简称HSCMA)的联合研讨会上H.Buchner、R.Aichner和W.Kellermann所发表的《盲系统识别与卷积盲源分离之间的关系》)。因此,可利用针对卷积混合信号的宽带盲源分离(broadband blind source separation,简称BSS)来解决所述盲MIMO系统识别问题,从而解决声场景分析问题。
在针对卷积混合信号的宽带盲源分离中,最初的目标旨在通过各种各样的BSS算法中的BSS技术或算法,仅基于可用的麦克风信号确定MIMO-FIR解混系统。图1示出了包括混合系统10和解混系统100的BSS场景的基本设置。所述混合系统10可由混合矩阵H描述,表示从房间中的原始声源即源信号11即s1至sp至拾取混合信号101即x1至xp的传感器P,如麦克风的所有声学传播路径。所述解混系统100可由表示生成输出信号103即y1至yp的数字信号处理系统的解混矩阵W来描述。在理想的解混系统100的情况下,这些输出信号103与解混源信号11相同。通常情况下,由于所述混合系统10的源位置和/或室内声学的潜在时间依赖性,必须连续地调整所述MIMO-FIR解混系统100。
多种可用的BSS技术或算法中,考虑到多个麦克风声道的最基本BSS技术称为独立成分分析(Independent Component Analysis,简称ICA)技术,其最初针对无记忆(即瞬时)混合矩阵这一更简单的情况进行开发(参考2001年由纽约威利父子公司出版
Figure GDA0001570959110000011
J.Karhunen和E.Oja所发表的《独立成分分析》)。用于BSS的ICA基于源信号之间的相互统计独立性的实际合理假设,然后对解混矩阵W进行优化,使得其输出信号再次在统计上独立。对卷积混合信号进行BSS(通过MIMO-FIR解混系统)需要同时利用多个基本统计信号属性,即“非白化性”和“非平稳性”,或“非白化性”和“非高斯性”中的至少一个,这些也是进行盲MIMO系统识别的最低要求。期望通过这三种基本统计信号属性,即非平稳性、非高斯性和非白化性,使多功能性得到改善,收敛速度和准确性更高(参考2003年9月在日本东京召开的回声和噪音控制国际研讨会(IEEE Intl.Workshop on Acoustic Echo and NoiseControl,简称IWAENC)上H.Buchner、R.Aichner和W.Kellermann所发表的《通过非高斯性、非白化性和非平稳性进行卷积混合信号的盲源分离》中第275页至278页中描述的内容)。
已经以TRINICON(Triple-N ICA for convolutive mixture,卷积混合信号的三重–N独立成分分析)的名义开发了一个统一的算法框架,用于将ICA扩展至宽带源、卷积混合信号以及所有三种基本统计信号属性的系统合并(参见H.Buchner和W.Kellermann所发表的、由P.A.Naylor和N.D.Gaubitch(编辑的)且由施普林格出版社于2010年7月在伦敦出版的《消除语音和音频信号混响的TRINICON》中第311页至385页的语音混响消除内容,并进行全面审查)。已经表明,所述TRINICON框架基本上包括所有目前已知的主要类别的自适应MIMO滤波算法,包括所有(卷积和瞬时)ICA算法,作为通用公式的特化/近似。
当前已知的所有自适应声学MIMO系统的实时实现方式也由于计算复杂性限制而表现出此类近似,即其都实现具有RINICON特性的某些子集,例如线性卷积宽带信号处理,并且通常至多仅考虑其中两个基本的统计信号属性(非平稳性、非白化性和非高斯性)。
鉴于上述情况,仍然需要在计算上高效地实现针对卷积混合信号的BSS,这样,可通过所有基本的统计信号属性,即非平稳性、非高斯性和非白化性实现最优的声场景分析。
发明内容
本发明旨在提供一种改进的信号处理装置和方法,尤其旨在从计算上高效地实现针对卷积混合信号的宽带盲源分离,从而允许利用基本统计信号属性:非平稳性、非高斯性和非白化性。
通过独立权利要求的主题实现上述及其它目的。进一步,实施形式显而易见有别于从属权利要求、描述及图。
根据第一方面,本发明涉及一种用于分离多个来自MIMO系统的混合信号以迭代地获得多个输出信号的信号处理装置。所述多个混合信号为所述MIMO系统对多个源信号的响应。所述信号处理装置包括:多个盲源分离器,包括基于第一盲源分离技术或算法的第一盲源分离器和基于第二盲源分离技术或算法的第二盲源分离器,其中,所述第一盲源分离器用于根据描述所述MIMO系统的第一系数集合计算第一多个初步输出信号,所述第二盲源分离器用于根据描述所述MIMO系统的第二系数集合计算第二多个初步输出信号。
此外,所述信号处理装置包括合路器,用于基于合路器系数集合将所述第一多个初步输出信号与所述第二多个初步输出信号进行合并,以迭代地获得所述多个输出信号,其中每个合路器系数关联即权重所述多个盲源分离器中的每个盲源分离器。另外,所述信号处理装置包括调节器,用于基于所述多个输出信号迭代地调整所述第一盲源分离器的第一系数集合和所述第二盲源分离器的第二系数集合。
根据第一方面,所述信号处理装置从计算上高效且迭代地实现了针对卷积混合信号的宽带盲源分离,从而允许例如利用基本统计信号属性:非平稳性、非高斯性和非白化性。
根据第一方面,在所述信号处理装置的第一种可能实现方式中,所述调节器还用于基于所述多个输出信号调整所述合路器系数集合。
根据第一方面的第一种实现方式,在所述信号处理装置的第二种可能实现方式中,所述调节器用于基于所述多个输出信号,通过使用第三盲源分离技术分离所述第一多个初步输出信号和所述第二多个初步输出信号来调整所述合路器系数集合。
因此,在该实现方式中,所述第三盲源分离技术用于基于所述多个输出信号,并以与盲源分离相同的方式调整所述合路器系数集合。在一实现方式中,认为所述第一多个初步输出信号和所述第二多个初步输出信号在统计上独立,并基于所述多个输出信号通过所述第三盲源分离技术调整所述合路器系数集合。通过这样的方式调整所述合路器系数集合,使得所述输出信号在统计上变得独立。
根据第一方面的第二种实现方式,在所述信号处理装置的第三种可能实现方式中,所述调节器用于调整所述合路器系数集合的第三盲源分离技术为一种独立成分分析(independentcomponent analysis,简称ICA)技术。
所述ICA提供了一种用于调整所述合路器系数集合的快速无记忆盲源分离技术。
根据第一方面或第一方面第一至第三种实现方式中的任一实现方式,在所述信号处理装置的第四种可能实现方式中,所述合路器用于基于所述合路器系数集合,将所述第一多个初步输出信号与所述第二多个初步输出信号合并为所述合路器系数集合加权的所述第一多个初步输出信号中的第一初步输出信号与所述第二多个初步输出信号中的第一初步输出信号的线性组合,以获得所述多个输出信号中的第一输出信号,并将其合并为所述合路器系数集合加权的所述第一多个初步输出信号中的第二初步输出信号与所述第二多个初步输出信号中的第二初步输出信号的线性组合,以获得所述多个输出信号中的第二输出信号。
因此,所述输出信号可以为由所述合路器系数集合加权的各个盲源分离器提供的各自多个初步输出信号的总和。
根据第一方面的第四种实现方式,在所述信号处理装置的第五种可能实现方式中,所述合路器用于从所述多个盲源分离器中选择至少一个盲源分离器,并设置与所述多个盲源分离器中的其它盲源分离器相关联的合路器系数等于0。
因此,取决于可随时间变化的MIMO系统,在该实现方式中,允许仅选择所述信号处理装置的盲源分离器的子集来迭代地计算所述输出信号,从而降低计算复杂度。
根据第一方面的第五种实现方式,在所述信号处理装置的第六种可能实现方式中,所述合路器用于基于所述多个盲源分离器性能测量,从所述多个盲源分离器中选择至少一个盲源分离器。
该实现方式中,允许基于所述盲源分离器的性能测量,仅选择所述信号处理装置的盲源分离器的子集如性能最优的盲源分离器,以便降低计算复杂度。
根据第一方面的第六种实现方式,在所述信号处理装置的第七种可能实现方式中,所述性能测量是基于卡亨南-洛维变换的代价函数。
根据第一方面或第一方面的第一至第七种实现方式中的任一实现方式,在所述信号处理装置的第八种可能实现方式中,所述调节器用于基于所述多个输出信号,通过所述多个盲源分离器的性能测量来调整所述第一盲源分离器的第一系数集合和所述第二盲源分离器的第二系数集合。在一实现方式中,该性能测量可以与所述多个输出信号和多个训练源信号之间的误差相关联。
根据第一方面的第八种实现方式,在所述信号处理装置的第九种可能实现方式中,所述性能测量是基于卡亨南-洛维变换的代价函数。
根据第一方面或第一方面的第一至第九种实现方式中的任一实现方式,在所述信号处理装置的第十种可能实现方式中,所述第一盲源分离技术和/或所述第二盲源分离技术满足以下一个或多个统计条件:非高斯性、非白化性和/或非平稳性。
根据第一方面或第一方面的第一至第十种实现方式中的任一实现方式,在所述信号处理装置的第十一种可能实现方式中,所述第一盲源分离器基于第一卷积盲源分离技术,和/或所述第二盲源分离器基于第二卷积盲源分离技术。
根据第一方面或第一方面的第一至第十一种实现方式中的任一实现方式,在所述信号处理装置的第十二种可能实现方式中,所述第一盲源分离器或所述第二盲源分离器基于以下一种或多种盲源分离技术:主成分分析、单一值分解、独立成分分析、依赖成分分析和非负矩阵分解。
根据第二方面,本发明涉及一种分离多个来自MIMO系统的混合信号以迭代地获得多个输出信号的信号处理方法,所述多个混合信号为所述MIMO系统对多个源信号的响应。所述信号处理方法包括以下步骤:通过基于第一盲源分离技术的第一盲源分离器根据描述所述MIMO系统的第一系数集合计算第一多个初步输出信号,通过基于第二盲源分离技术的第二盲源分离器根据描述所述MIMO系统的第二系数集合计算第二多个初步输出信号;基于合路器系数集合将所述第一多个初步输出信号与所述第二多个初步输出信号进行合并,以获得所述多个输出信号;基于所述多个输出信号调整所述第一盲源分离器的第一系数集合和所述第二盲源分离器的第二系数集合。
本发明第一方面提供的所述信号处理装置可执行本发明第二方面提供的所述信号处理方法。进一步,本发明第一方面提供的所述信号处理装置的功能及其不同的实现方式,直接造成本发明第二方面提供的所述信号处理方法的特性,反之亦然。
更具体来说,根据第二方面,在所述信号处理方法的第一种可能实现方式中,所述方法还包括:基于所述多个输出信号调整所述合路器系数集合。
根据第二方面的第一种实现方式,在所述信号处理方法的第二种可能实现方式中,所述基于所述多个输出信号调整所述合路器系数集合包括:通过第三盲源分离技术将所述第一多个初步输出信号与所述第二多个初步输出信号进行分离。
根据第二方面的第二种实现方式,在所述信号处理方法的第三种可能实现方式中,用于调整所述合路器系数集合的第三盲源分离技术为一种独立成分分析技术。
根据第二方面或第二方面第一至第三种实现方式中的任一实现方式,在所述信号处理方法的第四种可能实现方式中,所述将所述第一多个初步输出信号与所述第二多个初步输出信号进行合并包括:基于所述合路器系数集合,将所述第一多个初步输出信号与所述第二多个初步输出信号合并为所述合路器系数集合加权的所述第一多个初步输出信号中的第一初步输出信号与所述第二多个初步输出信号中的第一初步输出信号的线性组合,以获得所述多个输出信号中的第一输出信号,并将其合并为所述合路器系数集合加权的所述第一多个初步输出信号中的第二初步输出信号与所述第二多个初步输出信号中的第二初步输出信号的线性组合,以获得所述多个输出信号中的第二输出信号。
根据第二方面的第四种实现方式,在所述信号处理方法的第五种可能实现方式中,所述将所述第一多个初步输出信号与所述第二多个初步输出信号进行合并包括:从所述多个盲源分离器中选择至少一个盲源分离器,并设置与所述多个盲源分离器中的其它盲源分离器相关联的合路器系数等于0。
根据第二方面的第五种实现方式,在所述信号处理方法的第六种可能实现方式中,所述从所述多个盲源分离器中选择至少一个盲源分离器包括:基于所述多个盲源分离器的性能测量,从所述多个盲源分离器中选择至少一个盲源分离器。
根据第二方面的第六种实现方式,在所述信号处理方法的第七种可能实现方式中,所述性能测量是基于卡亨南-洛维变换的代价函数。
根据第二方面或第二方面第一至第七种实现方式中的任一实现方式,在所述信号处理方法的第八种可能实现方式中,所述调整所述第一盲源分离器的第一系数集合和所述第二盲源分离器的第二系数集合包括:基于所述多个盲源分离器的性能测量调整所述第一盲源分离器的第一系数集合和所述第二盲源分离器的第二系数集合。
根据第二方面的第八种实现方式,在所述信号处理方法的第九种可能实现方式中,所述性能测量是基于卡亨南-洛维变换的代价函数。
根据第二方面或第二方面的第一至第九种实现方式中的任一实现方式,在所述信号处理方法的第十种可能实现方式中,所述第一盲源分离技术和/或所述第二盲源分离技术满足以下一个或多个统计条件:非高斯性、非白化性和/或非平稳性。
根据第二方面或第二方面的第一至第十种实现方式中的任一实现方式,在所述信号处理方法的第十一种可能实现方式中,所述第一盲源分离器基于第一卷积盲源分离技术,和/或所述第二盲源分离器基于第二卷积盲源分离技术。
根据第二方面或第二方面的第一至第十一种实现方式中的任一实现方式,在所述信号处理方法的第十二种可能实现方式中,所述第一盲源分离器或所述第二盲源分离器基于以下一种或多种盲源分离技术:主成分分析、单一值分解、独立成分分析、依赖成分分析和非负矩阵分解。
根据第三方面,本发明涉及一种包括程序代码的计算机程序,所述程序代码用于当在计算机上执行时执行根据本发明的第二方面或其任一种实现方式的信号处理方法。
本发明可以硬件和/或软件的方式来实现。
附图说明
本发明的进一步实施例将结合以下附图进行描述,其中:
图1示出了包括混合系统和解混系统的普通盲源分离场景的示意图;
图2示出了实施例提供的一种信号处理装置的示意图;
图3示出了实施例提供的一种信号处理方法的示意图。
在各附图中,相同的或至少功能等同的特性使用相同的标号。
具体实现方式
以下结合附图进行描述,所述附图是本公开的一部分,并通过图解说明的方式示出可以实施本发明的具体方面。可以理解的是,在不脱离本发明范围的情况下,可以利用其它方面,并做出结构或逻辑上的改变。因此,以下详细的描述并不视为具有限制意义,因为本发明的范围由所附权利要求书界定。
例如,可以理解的是与所描述方法有关的披露对于用于执行所述方法的对应设备或系统也同样适用,反之亦然。例如,如果描述了特定方法步骤,则对应设备可以包括用于执行所描述的方法步骤的单元,即使此类单元没有在图中明确描述或图示。此外,应理解,本文所描述的各种示例性方面的特性可以相互组合,除非另外明确说明。
图2示出了实施例提供的一种信号处理装置200的示意图。所述信号处理装置200用于分离多个来自MIMO系统如图1所示的混合系统10的混合信号201,以迭代地获得多个输出信号203,其中所述多个混合信号201是所述MIMO系统如图1所示的混合系统对多个源信号如图1所示的多个源信号11的响应。
所述信号处理装置200包括多个盲源分离器205A–N,包括基于第一盲源分离技术或算法的第一盲源分离器205A和基于不同于所述第一盲源分离技术或算法的第二盲源分离技术或算法的第二盲源分离器205N。所述第一盲源分离器205A用于根据描述所述MIMO系统如图1中所示的混合系统10的第一系数集合计算第一多个初步输出信号202A,所述第二盲源分离器205N用于根据描述所述MIMO系统如图1中所示的混合系统10的第二系数集合计算第二多个初步输出信号202N。
因此,所述第一盲源分离器205A和所述第二盲源分离器205N(以及其它潜在的盲源分离器)通过不同的盲源分离技术并行地进行盲源分离。在一实施例中,通过解混矩阵的系数定义所述描述MIMO系统的第一系数集合,从而将所述多个混合信号201变换成所述第一多个初步输出信号202A。在一实施例中,通过所述解混矩阵的系数定义所述描述MIMO系统的第二系数集合,从而将所述多个混合信号201变换成所述第二多个初步输出信号202N。
在一实施例中,所述第一盲源分离器205A使用的第一盲源分离技术和/或所述第二盲源分离器205N使用的第二盲源分离技术满足以下一个或多个统计条件:非高斯性、非白化性和/或非平稳性。
在一实施例中,所述第一盲源分离器205A基于第一卷积盲源分离技术,和/或所述第二盲源分离器205N基于第二卷积盲源分离技术。本文通过术语卷积混合信号的盲源分离,即卷积盲源分离技术来描述复杂的混合过程,其中混合信号被加权和延迟,并且各个源构成与传播声信号至麦克风的多个路径相对应的多个延迟之和。
在一实施例中,所述第一盲源分离器205A或所述第二盲源分离器205N基于以下一个或多个盲源分离技术:主成分分析、单一值分解、独立成分分析、依赖成分分析和非负矩阵分解。从图2所示的实施例可以看出,所述信号处理装置200还包括合路器207,用于基于合路器系数a1至aN的集合将所述第一多个初步输出信号202A与所述第二多个初步输出信号202N(以及额外的盲源分离器提供的任意进一步的初步输出信号)进行合并,以迭代地获得所述多个输出信号203。每个合路器系数a1至aN与多个盲源分离器205A–N中的一个盲源分离器相关联。
在图2所示的实施例中,所述合路器207用于基于所述合路器系数a1至aN的集合将所述第一多个初步输出信号202A与所述第二多个初步输出信号202N合并为线性组合,即,所述合路器系数a1至aN的集合加权的所述第一多个初步输出信号202A中的第一初步输出信号与所述第二多个初步输出信号202N中的第一初步输出信号的和,以获得所述多个输出信号203中的第一输出信号,并将其合并为所述合路器系数a1至aN的集合加权的所述第一多个初步输出信号中的第二初步输出信号与所述第二多个初步输出信号中的第二初步输出信号的线性组合,以获得所述多个输出信号203中的第二输出信号。因此,在一实施例中,所述多个输出信号203中的输出信号y1为合路器系数a1加权的所述第一多个初步输出信号202A中的第一初步输出信号y1,1与所述合路器系数aN加权的所述第二多个初步输出信号202N中的第一初步输出信号y1,N(以及任意额外盲源分离器提供的任意进一步的第一初步输出信号yi,1)之和。
此外,图2所示的信号处理装置200包括调节器209,用于基于所述多个输出信号203迭代地调整所述第一盲源分离器205A的第一系数集合和所述第二盲源分离器205N的第二系数集合。这由图2中所示的信号处理装置200的调节器209的框210A和210B来阐述。在一实施例中,以相互独立的方式调整所述第一盲源分离器205A的第一系数集合和所述第二盲源分离器205N的第二系数集合。
在一实施例中,所述调节器209还用于基于所述多个输出信号203调整合路器系数a1至aN的集合,其由图2所示的所述信号处理装置200的调节器209的块211阐述。
在一实施例中,所述调节器209基于所述多个输出信号203,通过使用盲源分离技术分离所述第一多个初步输出信号202A和所述第二多个初步输出信号202N来调整所述合路器系数a1至aN的集合。换句话说,在一实施例中,所述调节器209可以以这样的方式调整所述合路器系数a1至aN,从而使得所述输出信号203在统计上变得独立。在一实施例中,所述调节器209可以通过独立成分分析(independent component analysis,简称ICA),基于所述多个输出信号203调整所述合路器系数a1至aN的集合。
在一实施例中,所述合路器205用于从多个盲源分离器205A–N中选择至少一个盲源分离器,并设置与所述多个盲源分离器中的其它盲源分离器相关联的合路器系数a1至aN等于0。该实施例允许例如从所述多个盲源分离器205A–N中选择或不选择特定的盲源分离器。在一实施例中,可以基于不同盲源分离器205A–N的各自性能测量进行该选择,例如基于卡亨南-洛维变换的代价函数。例如,在H.Buchner和W.Kellermann所发表的、由P.A.Naylor和N.D.Gaubitch(编辑的)且由施普林格出版社于2010年7月在伦敦出版的《消除语音和音频信号混响的TRINICON》中第311页至385页的语音混响消除内容中可以找到KLT代价函数形式的性能测量的使用相关的更多细节,在此通过引用将其全部并入本文。
因此,在一实施例中,在每次调整迭代之后,选择性能最优的盲源分离器的多个初步输出信号,例如,选择第一盲端分离器205A提供的第一多个初步输出信号202A作为最终输出信号203,将表现最优的盲源分离器的当前系数集合替换为其它盲源分离器的当前系数集合,从而执行其它盲源分离器的下一迭代步骤。
在一实施例中,所述调节器209还可用于通过与所述信号处理装置200的多个盲源分离器205A–N中每一个盲源分离器相关联的相应性能测量,基于所述多个输出信号203来调整所述第一盲源分离器205A的第一系数集合和所述第二盲源分离器205N的第二系数集合。在一实施例中,该性能测量为基于卡亨南-洛维变换的代价函数。
在一示例性实施例中,图2中示出的信号处理装置200基于以下盲源分离技术或算法仅包括两个盲源分离器。
在该示例性实施例中,所述第一盲源分离器基于例如于2003年9月在日本东京召开的回声和噪音控制国际研讨会(IEEE Intl.Workshop on Acoustic Echo and NoiseControl,简称IWAENC)上H.Buchner、R.Aichner和W.Kellermann所发表的《通过非高斯性、非白化性和非平稳性进行卷积混合信号的盲源分离》中第275页至278页中描述的第一类高效二阶统计算法,其满足了非白化性和非平稳性的统计条件。
在该示例性实施例中,所述第二盲源分离器基于例如H.Buchner、R.Aichner和W.Kellermann所发表的《进行卷积混合信号的盲源分离》中描述的第二类高效的多元时频算法:于2004年2月在波士顿/多德雷赫特/伦敦由克吕韦尔学术出版社出版由Y.Huang和J.Bensty(Hrsg.)所发表的《下一代多媒体通信系统的音频信号处理》中第255页至293页中进行统一处理的内容,其满足非白化性和非高斯性的统计条件。
在该示例性实施例中,第一类BSS算法可以高效地实现精确的线性卷积和宽带系数自适应,但是其仅可以利用二阶信号统计数据。相比之下,第二类BSS算法可以利用非高斯性所需的高阶统计数据,但是出于效率原因,系数更新规则忽略了其多元时频公式中的某些约束条件,使得循环卷积部分代替了严格线性卷积,这反过来又可能限制了第二类算法的分离性能。由于这些原因,本发明提供的这两类算法的组合是非常有吸引力的。
对于为调整所述合路器207的系数a1至aN而实现的BSS技术,非白化性不是必需的。然而,基于非平稳性、非高斯性和/或非白化性中的任一一个实现该阶段是可能实现的。
图3示出了实施例提供的一种信号处理方法300的示意图。所述信号处理方法300用于分离多个来自MIMO系统的混合信号201,以获得多个输出信号203,其中所述多个混合信号201为所述MIMO系统对多个源信号的响应。
所述信号处理方法300包括第一步骤301:通过基于第一盲源分离技术的第一盲源分离器205A根据描述所述MIMO系统的第一系数集合计算第一多个初步输出信号202A,通过基于第二盲源分离技术的第二盲源分离器205N根据描述所述MIMO系统的第二系数集合计算第二多个初步输出信号202N。
所述信号处理方法300还包括步骤303:基于合路器系数集合将所述第一多个初步输出信号202A与所述第二多个初步输出信号202N进行合并303,以获得所述多个输出信号203。
所述信号处理方法包括最后一个步骤305:基于所述多个输出信号203调整所述第一盲源分离器的第一系数集合和所述第二盲源分离器的第二系数集合。
下文中可以推导出图2所示的信号处理装置和图3所示的信号处理方法300所使用的多个混合信号201即x1至xp和与多个输出信号203即y1至yQ与之间的数学关系。
具有单盲源分离器的常规MIMO解混系统中,可通过以下等式表述混合信号x1至xp和输出信号y1至yQ之间的关系:
Figure GDA0001570959110000091
其中wpq,l表示与所述单个盲源分离器相关联的系数集合,即所述解混矩阵W的滤波器系数,n表示时间索引。可以表明(例如,参考H.Buchner和W.Kellermann所发表的、由P.A.Naylor和N.D.Gaubitch(编辑的)且由施普林格出版社于2010年7月在伦敦出版的《消除语音和音频信号混响的TRINICON》中第311页至385页的语音混响消除内容)能以更紧凑的形式将公式1表述为矩阵–向量公式:
y(n)=WTx(n)(2)
其中根据H.Buchner和W.Kellermann所发表的、由P.A.Naylor和N.D.Gaubitch(编辑的)且由施普林格出版社于2010年7月在伦敦出版的《消除语音和音频信号混响的TRINICON》中第311页至385页的语音混响消除内容准确定义向量y(n)和x(n)以及矩阵W。另外,由于算法原因,所述向量y(n)也包括每个输出信道(q=1,...,P)的信号yq(n)的D个延迟版本,即y(n)的总尺寸为PD
可通过以下等式表述图2所示的信号处理装置200定义的解混系统:
Figure GDA0001570959110000092
其中ai表示合路器系数,即不同盲源分离器205A–N的每个初步输出信号的加权因子。在相应的矩阵–向量公式中,写成:
Figure GDA0001570959110000093
或其它等同公式:
Figure GDA0001570959110000094
和:
y(i)(n)=(W(i))Tx(n) (6)
可将这个表达式解释为包括N个并行盲源分离器205A–N的集合中的第i个子系统。
如上所述,通常情况下,根据公式的调整规则,迭代地更新单独的盲源分离器205A–N:
W←W-μΔW(7)
其中μ表示步长参数,并且,通常基于某个代价函数的梯度更新W(相对于系数矩阵W)(例如,参考H.Buchner和W.Kellermann所发表的、由P.A.Naylor和N.D.Gaubitch(编辑的)且由施普林格出版社于2010年7月在伦敦出版的《消除语音和音频信号混响的TRINICON》中第311页至385页的语音混响消除内容)。
通过将所述合路器207引入至所述信号处理装置200中,可以表明(通过链式规则)将第i个并行盲源分离器的更新/调整规则扩展为:
W(i)←W(i)-μaiΔW(i)(8)
其中,如上所述,ΔW(i)可以基于多个输出信号yq203,这可由图2中从块211至块210A–N的箭头示出。
尽管本发明的特定特性或方面可能已经仅结合几种实现方式或实施例中的一种进行公开,但此类特性或方面可以和其它实现方式或实施例中的一个或多个特性或方面相结合,只要对于任何给定或特定的应用是有需要或有利。而且,在一定程度上,术语“包括”、“有”、“具有”或这些词的其他变形在详细的说明书或权利要求书中使用,这类术语和所述术语“包含”是类似的,都是表示包括的含义。同样,术语“示例性地”,“例如”仅表示为示例,而不是最好或最优的。可以使用术语“耦合”和“连接”及其派生词。应当理解,这些术语可以用于指示两个元件彼此协作或交互,而不管它们是直接物理接触还是电接触,或者它们彼此不直接接触。
尽管本文中已说明和描述特定方面,但所属领域的技术人员应了解,多种替代和/或等效实现方式可在不脱离本发明的范围的情况下所示和描述的特定方面。该申请旨在覆盖本文论述的特定方面的任何修改或变更。
尽管以上权利要求书中的元件是利用对应的标签按照特定顺序列举的,除非对权利要求的阐述另有暗示用于实施部分或所有这些元件的特定顺序,否则这些元件不必限于以所述特定顺序来实施。
通过以上启示,对于本领域技术人员来说,许多替代、修改和变化是显而易见的。当然,本领域普通技术人员容易认识到除本文所述的应用之外,还存在本发明的众多其它应用。虽然已参考一个或多个特定实施例描述了本发明,但本领域普通技术人员将认识到在不偏离本发明的范围的前提下,仍可对本发明作出许多改变。因此,应理解,只要是在所附权利要求书及其等效物的范围内,可以用不同于本文具体描述的方式来实践本发明。

Claims (14)

1.一种用于分离多个来自MIMO系统的混合信号(201)以获得多个输出信号(203)的信号处理装置(200),其特征在于,所述多个来自MIMO系统的混合信号(201)为所述MIMO系统对多个源信号的响应,其中所述信号处理装置(200)包括:
多个盲源分离器(205A–N),包括基于第一盲源分离技术的第一盲源分离器(205A)和基于第二盲源分离技术的第二盲源分离器(205N),其中所述第一盲源分离器(205A)用于根据描述所述MIMO系统的第一系数集合计算第一多个初步输出信号(202A),所述第二盲源分离器(205N)用于根据描述所述MIMO系统的第二系数集合计算第二多个初步输出信号(202N);
合路器(207),用于基于合路器系数集合将所述第一多个初步输出信号(202A)与所述第二多个初步输出信号(202N)进行合并,以获得所述多个输出信号(203),其中每个合路器系数与所述多个盲源分离器(205A–N)中的盲源分离器相关联;
调节器(209),用于基于所述多个输出信号(203)调整所述第一盲源分离器(205A)的第一系数集合和所述第二盲源分离器(205N)的第二系数集合。
2.根据权利要求1所述的信号处理装置(200),其特征在于,所述调节器(209)还用于基于所述多个输出信号(203)调整所述合路器系数集合。
3.根据权利要求2所述的信号处理装置(200),其特征在于,所述调节器(209)用于基于所述多个输出信号,通过使用第三盲源分离技术分离所述第一多个初步输出信号(202A)和所述第二多个初步输出信号(202N)来调整所述合路器系数集合。
4.根据权利要求3所述的信号处理装置(200),其特征在于,所述第三盲源分离技术为一种独立成分分析技术。
5.根据权利要求1-4中任一项所述的信号处理装置(200),其特征在于,所述合路器(207)用于基于所述合路器系数集合,将所述第一多个初步输出信号(202A)与所述第二多个初步输出信号(202N)合并为所述合路器系数集合加权的所述第一多个初步输出信号(202A)中的第一初步输出信号与所述第二多个初步输出信号(202N)中的第一初步输出信号的线性组合,以获得所述多个输出信号(203)中的第一输出信号,并将其合并为所述合路器系数集合加权的所述第一多个初步输出信号(202A)中的第二初步输出信号与所述第二多个初步输出信号(202N)中的第二初步输出信号的线性组合,以获得所述多个输出信号(203)中的第二输出信号。
6.根据权利要求5所述的信号处理装置(200),其特征在于,所述合路器(207)用于从所述多个盲源分离器(205A–N)中选择至少一个盲源分离器,并设置与所述多个盲源分离器(205A–N)中的其它盲源分离器相关联的合路器系数等于0。
7.根据权利要求6所述的信号处理装置(200),其特征在于,所述合路器(207)用于基于所述多个盲源分离器(205A–N)的性能测量,从所述多个盲源分离器(205A–N)中选择至少一个盲源分离器。
8.根据权利要求7所述的信号处理装置(200),其特征在于,所述性能测量是基于卡亨南-洛维变换的代价函数。
9.根据权利要求1-4中任一项所述的信号处理装置(200),其特征在于,所述调节器(209)用于基于所述多个盲源分离器(205A–N)的性能测量调整所述第一盲源分离器(205A)的第一系数集合和所述第二盲源分离器(205N)的第二系数集合。
10.根据权利要求9所述的信号处理装置(200),其特征在于,所述性能测量是基于卡亨南-洛维变换的代价函数。
11.根据权利要求1-4中任一项所述的信号处理装置(200),其特征在于,所述第一盲源分离技术和/或所述第二盲源分离技术满足以下一个或多个统计条件:非高斯性、非白化性和/或非平稳性。
12.根据权利要求1-4中任一项所述的信号处理装置(200),其特征在于,所述第一盲源分离器(205A)基于第一卷积盲源分离技术,和/或所述第二盲源分离器(205N)基于第二卷积盲源分离技术。
13.根据权利要求1-4中任一项所述的信号处理装置(200),其特征在于,所述第一盲源分离器(205A)或所述第二盲源分离器(205N)基于以下一种或多种盲源分离技术:主成分分析、单一值分解、独立成分分析、依赖成分分析和非负矩阵分解。
14.一种用于分离多个来自MIMO系统的混合信号(201)以获得多个输出信号(203)的信号处理方法(300),其特征在于,所述多个来自MIMO系统的混合信号(201)为所述MIMO系统对多个源信号的响应,其中所述信号处理方法(300)包括:
通过基于第一盲源分离技术的第一盲源分离器(205A)根据描述所述MIMO系统的第一系数集合计算(301)第一多个初步输出信号(202A),通过基于第二盲源分离技术的第二盲源分离器(205N)根据描述所述MIMO系统的第二系数集合计算第二多个初步输出信号(202N);
基于合路器系数集合将所述第一多个初步输出信号(202A)与所述第二多个初步输出信号(202N)进行合并(303),以获得所述多个输出信号(203);
基于所述多个输出信号(203)调整(305)所述第一盲源分离器(205A)的第一系数集合和所述第二盲源分离器(205N)的第二系数集合。
CN201580082262.XA 2015-12-21 2015-12-21 信号处理装置和方法 Active CN107924685B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2015/080874 WO2017108085A1 (en) 2015-12-21 2015-12-21 A signal processing apparatus and method

Publications (2)

Publication Number Publication Date
CN107924685A CN107924685A (zh) 2018-04-17
CN107924685B true CN107924685B (zh) 2021-06-29

Family

ID=54979694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580082262.XA Active CN107924685B (zh) 2015-12-21 2015-12-21 信号处理装置和方法

Country Status (4)

Country Link
US (1) US10679642B2 (zh)
EP (1) EP3335217B1 (zh)
CN (1) CN107924685B (zh)
WO (1) WO2017108085A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684723B (zh) * 2018-12-24 2022-05-10 哈尔滨工程大学 一种二维结构内部声学性能分析方法
EP3953726A1 (en) * 2019-04-10 2022-02-16 Huawei Technologies Co., Ltd. Audio processing apparatus and method for localizing an audio source
CN113465850B (zh) * 2021-02-07 2023-09-08 西北工业大学 机械振动信号路径识别的方法、试验装置和试验方法
CN114220454B (zh) * 2022-01-25 2022-12-09 北京荣耀终端有限公司 一种音频降噪方法、介质和电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004053839A1 (en) * 2002-12-11 2004-06-24 Softmax, Inc. System and method for speech processing using independent component analysis under stability constraints
CN1717721A (zh) * 2003-09-02 2006-01-04 日本电信电话株式会社 信号分离方法、信号分离装置、信号分离程序以及记录媒体
EP1748427A1 (en) * 2005-07-26 2007-01-31 Kabushiki Kaisha Kobe Seiko Sho (Kobe Steel, Ltd.) Sound source separation apparatus and sound source separation method
CN101432805A (zh) * 2006-05-02 2009-05-13 高通股份有限公司 用于盲源分离(bss)的增强技术
CN101484938A (zh) * 2006-06-14 2009-07-15 西门子测听技术有限责任公司 信号分离器、基于麦克风信号确定输出信号的方法及计算机程序
CN101667425A (zh) * 2009-09-22 2010-03-10 山东大学 一种对卷积混叠语音信号进行盲源分离的方法
CN102903368A (zh) * 2011-07-29 2013-01-30 杜比实验室特许公司 用于卷积盲源分离的方法和设备
CN103281269A (zh) * 2013-05-09 2013-09-04 合肥工业大学 基于改进的排序算法的频域盲源分离算法
US8855295B1 (en) * 2012-06-25 2014-10-07 Rawles Llc Acoustic echo cancellation using blind source separation
CN104995679A (zh) * 2013-02-13 2015-10-21 美国亚德诺半导体公司 信号源分离

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4121356C2 (de) * 1991-06-28 1995-01-19 Siemens Ag Verfahren und Einrichtung zur Separierung eines Signalgemisches
JP4897519B2 (ja) * 2007-03-05 2012-03-14 株式会社神戸製鋼所 音源分離装置,音源分離プログラム及び音源分離方法
JP5565593B2 (ja) * 2009-10-01 2014-08-06 日本電気株式会社 信号処理方法、信号処理装置、及び信号処理プログラム
JP5706782B2 (ja) * 2010-08-17 2015-04-22 本田技研工業株式会社 音源分離装置及び音源分離方法
BR112012031656A2 (pt) * 2010-08-25 2016-11-08 Asahi Chemical Ind dispositivo, e método de separação de fontes sonoras, e, programa
EP2887233A1 (en) * 2013-12-20 2015-06-24 Thomson Licensing Method and system of audio retrieval and source separation

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004053839A1 (en) * 2002-12-11 2004-06-24 Softmax, Inc. System and method for speech processing using independent component analysis under stability constraints
CN1717721A (zh) * 2003-09-02 2006-01-04 日本电信电话株式会社 信号分离方法、信号分离装置、信号分离程序以及记录媒体
EP1748427A1 (en) * 2005-07-26 2007-01-31 Kabushiki Kaisha Kobe Seiko Sho (Kobe Steel, Ltd.) Sound source separation apparatus and sound source separation method
CN101432805A (zh) * 2006-05-02 2009-05-13 高通股份有限公司 用于盲源分离(bss)的增强技术
CN101484938A (zh) * 2006-06-14 2009-07-15 西门子测听技术有限责任公司 信号分离器、基于麦克风信号确定输出信号的方法及计算机程序
CN101667425A (zh) * 2009-09-22 2010-03-10 山东大学 一种对卷积混叠语音信号进行盲源分离的方法
CN102903368A (zh) * 2011-07-29 2013-01-30 杜比实验室特许公司 用于卷积盲源分离的方法和设备
US8855295B1 (en) * 2012-06-25 2014-10-07 Rawles Llc Acoustic echo cancellation using blind source separation
CN104995679A (zh) * 2013-02-13 2015-10-21 美国亚德诺半导体公司 信号源分离
CN103281269A (zh) * 2013-05-09 2013-09-04 合肥工业大学 基于改进的排序算法的频域盲源分离算法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Competitive algorithm blending for enhanced source separation;Keith D. Gilbert等;《2014 48TH ASILOMAR CONFERENCE ON SIGNALS, SYSTEMS AND COMPUTERS》;20141102;第2章节 *
Trinicon:a versatile framework for multichannel blind signal processing;Herbert Buchner等;《IEEE INTERNATIONAL CONFERENCE ON MONTREAL》;20040519;第2-5、15页 *
卷积混合盲源分离算法研究;王娜娜;《中国优秀硕士学位论文全文数据库信息科技辑》;20150415;全文 *

Also Published As

Publication number Publication date
EP3335217A1 (en) 2018-06-20
CN107924685A (zh) 2018-04-17
EP3335217B1 (en) 2022-05-04
US20180301160A1 (en) 2018-10-18
WO2017108085A1 (en) 2017-06-29
US10679642B2 (en) 2020-06-09

Similar Documents

Publication Publication Date Title
Huang et al. Acoustic MIMO signal processing
Parra et al. Convolutive blind separation of non-stationary sources
US10679642B2 (en) Signal processing apparatus and method
CN102903368B (zh) 用于卷积盲源分离的方法和设备
CN102804747B (zh) 多通道回波对消器
Douglas et al. Convolutive blind separation of speech mixtures using the natural gradient
CN106233382B (zh) 一种对若干个输入音频信号进行去混响的信号处理装置
WO2015065682A1 (en) Selective audio source enhancement
JP2009540378A (ja) 信号分離器、マイクロフォン信号に基づいて出力信号を決定するための方法、及び、コンピュータプログラム
Buchner et al. A generalization of a class of blind source separation algorithms for convolutive mixtures
CN111031448A (zh) 回声消除方法、装置、电子设备和存储介质
Helwani et al. Source-domain adaptive filtering for MIMO systems with application to acoustic echo cancellation
Crocco et al. Room impulse response estimation by iterative weighted l 1-norm
Torres et al. An efficient wavelet-based HRTF model for auralization
EP3765954A1 (en) Spatial characteristics of multi-channel source audio
Uhle et al. Determined source separation for microphone recordings using IIR filters
CN108353241B (zh) 渲染系统
Liao et al. Adaptive channel equalization of room acoustics exploiting sparseness constraint
KR20130125227A (ko) 하모닉 주파수 사이의 종속관계를 이용한 암묵 신호 분리 방법 및 이를 위한 디믹싱 시스템
JP2016052082A (ja) 制御器設計装置、制御器設計方法及びプログラム
Chua et al. A low latency approach for blind source separation
JP5565593B2 (ja) 信号処理方法、信号処理装置、及び信号処理プログラム
Schlecht et al. Reverberation enhancement from a feedback delay network perspective
Douglas et al. Blind separation of acoustical mixtures without time-domain deconvolution or decorrelation
Bachmann et al. Resource allocation for distributed blind source separation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant