CN101484938A - 信号分离器、基于麦克风信号确定输出信号的方法及计算机程序 - Google Patents

信号分离器、基于麦克风信号确定输出信号的方法及计算机程序 Download PDF

Info

Publication number
CN101484938A
CN101484938A CNA200780022297XA CN200780022297A CN101484938A CN 101484938 A CN101484938 A CN 101484938A CN A200780022297X A CNA200780022297X A CN A200780022297XA CN 200780022297 A CN200780022297 A CN 200780022297A CN 101484938 A CN101484938 A CN 101484938A
Authority
CN
China
Prior art keywords
signal
microphone
source
distortion
audio content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200780022297XA
Other languages
English (en)
Other versions
CN101484938B (zh
Inventor
赫伯特·巴克纳
罗伯特·艾克纳
沃尔特·凯勒曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiwantuo Co Ltd
Friedrich Alexander Univeritaet Erlangen Nuernberg FAU
Original Assignee
Friedrich Alexander Univeritaet Erlangen Nuernberg FAU
Siemens Audioligische Technik GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Friedrich Alexander Univeritaet Erlangen Nuernberg FAU, Siemens Audioligische Technik GmbH filed Critical Friedrich Alexander Univeritaet Erlangen Nuernberg FAU
Publication of CN101484938A publication Critical patent/CN101484938A/zh
Application granted granted Critical
Publication of CN101484938B publication Critical patent/CN101484938B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Auxiliary Devices For Music (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stereophonic System (AREA)

Abstract

本发明提供一种信号分离器(100),其用于确定第一麦克风信号中描述有用信号源的音频内容的第一输出信号(a1),并用于确定第二麦克风信号中描述所述有用信号源的音频内容的第二输出(a2)信号,所述信号分离器(100)包括:一个源分离器(130),用于接收两个麦克风信号并用于分离至少两个信号源的音频内容。所述源分离器(130)经设计以获得本质上描述第一信号源的音频内容且代表所述第一输出信号的第一部分信号(y1),且以便获得本质上描述第二信号源的音频内容的第二部分信号(y2)。所述源分离器(130)经设计以用使所述第一部分信号相对于所述第一麦克风信号的失真小于最大失真的方式,调整用于从所述麦克风信号中产生所述第一部分信号的处理规范的参数,且用使所述第二部分信号相对于所述第二麦克风信号的失真小于最大失真的方式,调整用于从所述麦克风信号中产生所述第二部分信号的处理规范的参数。所述信号分离器进一步包括一个信号移除器,用于从所述第二麦克风信号中移除所述第二部分信号,以便获得其中所述第二部分信号减少的第二输出信号。所述信号分离器提供以下优点:可通过使用所述源分离器中的次级条件用特别简单的方式实现所述麦克风信号在干扰信号方面得到校正的多信道表现形式。

Description

信号分离器、基于麦克风信号确定输出信号的方法及计算机程序
技术领域
本发明主要涉及一种信号分离器,其用于确定麦克风信号内的描述有用信号源音频内容的第一输出信号,并用于确定第二麦克风信号内的描述有用信号源音频内容的第二输出信号,本发明也涉及适当的方法和适当的计算机程序。具体来说,本发明涉及一种在盲源分离系统中恢复空间信息的技术和方法。
背景技术
在许多技术应用中,有必要处理输入信号,使得在输出信号中以相对于输入信号本质上未改变的方式包含有用信号部分的音频内容,而另一方面,在输出信号中减少干扰信号部分的音频内容。
已开发出的用于盲源分离(下文中也称为BSS)的技术从点源(例如,房间内的语音信号)中分离出若干信号,假设所述若干信号在统计上是独立的。举例来说,在出版物[1]、[2]、[3]和[4](见参考书目)中,描述了相应技术。
通过若干传感器(例如,麦克风),使用下游多信道自适应滤波来记录和分解点源(或信号源)的卷积混合。此分解是基于多信道自适应滤波的输出信号将在统计上相互再次解除耦合直到特定量级的统计矩。因此,盲源分离的目标是,理想地,仅分别在每一输出信道中施加源信号的一者(即,来自点源或信号源的一个信号)。然而,其缺点在于,由于分解之后输出处的各自单信道表现形式的缘故,关于点源(或信号源)的空间信息丢失(特别是传感器之间的电平差和运行时间差异)。
一般来说,所设想的目标是恢复关于点源或信号源(在源分离的输出处)空间位置的空间信息。已在所提到的领域中进行和公开了若干工作,如下文将描述。
然而,如下文还将阐述,已知的方法仍然具有若干限制。首先,这当在现实应用场景中使用BSS方法时表现出来,在现实应用场景中除了所需的点源(或信号源)之外,在盲信号分离的输出处(即,在BSS输出处)可能仍然存在相应其它源的残余部分(即,例如其它点源或信号源或干扰源的残余部分)。
在一些根据现有技术的当前系统中,空间信息被省去(见,例如[1]、[2]、[3]、[4]),或者借助下游处理来恢复空间信息。
在此问题上,从文献中得知四种方法:
1.借助BSS输出信号的下游滤波来产生空间信息,BSS输出信号具有人工空间特性或独立于BSS(或传输函数)而预先确定的空间特性(见[6]、[7]、[8])。举例来说,WO2004/006624A1(也称为[8])展示了如何从与头部相关的传输函数(HRTF)的数据库中选择传输函数或空间脉冲响应。
2.在特定的BSS方法中,有可能执行盲系统识别(见[9]、[10]),以便可从BSS系统的分解滤波器中得出空间信息。进而可借助使用所识别的空间特性对BSS输出信号进行下游滤波来产生空间信息。
3.此外,通过不执行盲系统识别的方法,有可能从BSS系统的分解滤波器中得出空间信息。在[19]中展示了一种技术,其中在下游滤波的部分上使用此信息,且因此产生包括空间特性的输出信号。
4.在另一概念中,在后处理区块内连同多信道噪声减少的输出信号一起处理原始传感器信号(见[5])。
正如盲源分离(BSS)那样,多信道噪声减少也是一种改进特定所需信号(点源或信号源)的方法,然而,相比于BSS,所述方法基于相应干扰源的稳态假定(见,例如[11])。
举例来说,如[5]中所展示的,所提到的方法包含将多信道噪声减少系统yp(n)的输出信道连接到相应的单信道自适应滤波器,所述滤波器包含延迟的麦克风信号作为参考信号dp(n)(见,[5]中的图1)。自适应时间离散滤波器代表一种在数字信号处理中广泛使用的技术(见,[12])。已知的原理在于确定滤波器系数,以便在给定已知的输入信号时,将系统的输出信号估计为参考信号(比较[12])。在根据[5]的概念中,通过根据特定标准(例如,根据均方误差)来最小化误差信号eP(n)=dP(n)-yP(n)来实现此目的。
使用上述四种方法,正确地再生了所需点源(或信号源)的空间位置。然而,所描述的四种方法均具有以下缺点:除了所需的点源之外,还将可能仍然存在的相应其它源的残余部分(即,其它信号源或干扰源的残余部分)映射到相同的空间位置。
[13]中提出了另一种方法,其既考虑到了所需点源的空间信息,又避免了映射到相同位置的问题。根据[13]的方法是基于对两个或两个以上耦合的BSS标准的联合优化。这导致两个或两个以上自适应等式,所述等式以非线性的方式彼此耦合,从而不可能确保可找到全局最佳值。还展示了根据[13]的方法的一种实施方案,借此,所需的点源和仍然存在的受抑制源的残余部分(其它信号源或干扰源的残余部分)也映射到相同位置上。
此外,[15]展示了一种通过使用基于维纳滤波(Wiener filtering)的噪声减少而在双耳助听器的两个信道之间维持时间延迟的方法。根据[15],将若干麦克风信号馈送到两个分立的多信道维纳滤波器中。从第一麦克风信号中减去第一维纳滤波器的输出信号(其代表噪声的估计值)。从第二麦克风信号中减去第二维纳滤波器的输出信号(其代表噪声的另一估计值)。因此,借助于减法而获得输出信号。
发明内容
考虑到所描述的现有技术,本发明的目的是提供一种信号分离概念,根据所述概念基于复数个输入信号来形成复数个输出信号,使得输出信号再生出具有充分准确度级别的有用信号源的空间位置,在输出信号中减少来自干扰信号源的干扰信号,且不将来自干扰信号源的残余干扰信号映射到有用信号源的位置。
通过根据权利要求1或12所述的信号分离器、通过根据权利要求23或24所述的方法、且通过根据权利要求25所述的计算机程序来实现此目的。
本发明根据权利要求1提供一种信号分离器,其用于确定第一麦克风信号内描述有用信号源的音频内容的第一输出信号,并用于确定第二麦克风信号内描述有用信号源的音频内容的第二输出信号。
本发明的核心思想是,有利地配置一种源分离器,使得源分离器提供的第一部分信号本质上表现(或描述)第一信号源(有用信号源)的音频内容,还确保第一部分信号相对于源分离器的第一输入信号(例如,相对于第一麦克风信号)体现出尽可能少的失真。由于以上提到的源分离器的实施方案的缘故,第一部分信号因此本质上对应于由源分离器(即,例如在第一麦克风信号中)的第一输入信号中的第一信号源(有用信号源)提供的信号部分。并且,已发现,有利地以此种方式实施源分离器:使得源分离器提供的第二部分信号本质上代表第二信号源(干扰信号源)的音频内容,且第二部分信号相对于源分离器的第二输入信号(例如,相对于第二麦克风信号)也体现出尽可能少的失真。因此,第二部分信号本质上对应于第二信号源(干扰信号源)对于信号分离器的第二输入信号(例如,第二麦克风信号)的贡献。
因此,在源分离器的输出处有两个部分信号可用,第一部分信号本质上包含第一信号源(有用信号源)的音频内容,且相对于第一麦克风信号失真了至多最大失真度(或失真到尽可能小的程度),此外,第二部分信号本质上包含第二信号源(干扰信号源)的音频信号内容,且相对于第二麦克风信号失真了至多最大失真度(或失真到尽可能小的程度)。
因此,第一部分信号可直接用作第一输出信号。第二部分信号也可直接用于从第二麦克风信号中移除第二部分信号的音频内容,第二输出信号之所以引起,是因为从第二麦克风信号中移除了第二部分信号。
以本发明的方式,实现了第一部分信号相对于第一麦克风信号体现出尽可能少的失真。因此,第一部分信号中的第一信号源的音频内容的相位信息与第一麦克风信号中的第一信号源的音频内容的相位信息匹配。可能仍包含在第一部分信号内的第二信号源的音频内容的残余部分的相位信息附带地包括与第一麦克风信号内的第二信号源的音频内容相同的相位信息,原因在于第一麦克风信号与第一部分信号之间的失真的限制。借助于在形成部分信号时失真的限制,因此实现将第一部分信号或第一输出信号内的第二信号源的音频内容映射到与第一信号源的音频内容不同的位置(通常映射到第二信号源的位置)。
第二部分信号内的第二信号源的音频内容相对于第二麦克风信号的失真也以相同方式受到限制。因而,第二部分信号非常适合例如通过简单的差异形成而从第二麦克风信号中移除第二信号源的音频内容。具体来说,由于第二部分信号本质上以未失真方式对应于第二麦克风信号内的第二信号源的部分,所以第二麦克风信号与第二部分信号之间的差异本质上代表第二麦克风信号内的源于第一信号源的音频内容。
此外,由于第二部分信号相对于第二麦克风信号仅失真或相位变化到有限程度,所以第二部分信号代表处于其正确的空间位置处的第二信号源。因此,通过信号移除器用空间上正确的方式移除第二信号源的音频内容,因此使第二输出信号内的第二信号源的音频内容的残余部分最小化。
此外,在第二部分信号中用关于第二输入信号(例如,第二麦克风信号)在空间上正确的方式来代表第一信号源的残余信号部分。以此方式,避免了当(例如通过形成差异)从第二麦克风信号中移除第二部分信号时,因第一信号源的残余信号部分而引入在空间方面不正确地定位的第一信号源的一部分音频内容。
此外,考虑到本发明的源分离器的实施方案,可用特别简单的方式来实施信号移除器,因为第二麦克风信号与第二部分信号之间的失真受到源分离器的限制。
本发明的信号分离器因此提供本质优点,即,由于源分离器内的信号失真的限制,源分离器的输出信号(以直接的方式,且无需任何进一步的后处理)描述第一信号源及第二信号源的空间位置。虽然第一部分信号直接描述第一麦克风信号中起源于信号源的那部分,但通过简单地从第二麦克风信号中移除第二部分信号即可获得第二麦克风信号中的第一信号源的部分。因此,第一和第二输出信号正确地描述在声传感器的位置处可感知的第一信号源的空间位置,干扰在很大程度上受到输出信号中的第二信号源的抑制。
并且,所使用的源分离器可以是常规的源分离器,其在其输出处提供多种信号源的音频内容的单信道表现形式,常规源分离器只需要针对以下目的实施:限制或最小化其第一输入(用于第一麦克风信号)与其第一输出(用于第一部分信号)之间的失真,以及限制或最小化其第二输入(用于第二麦克风信号)与其第二输出(用于第二部分信号)之间的失真。
此外,本发明的信号分离器提供以下优点:干扰信号源的残余部分相对于输入信号或麦克风信号关于它们的空间位置并未改变,即,来自干扰信号源的残余信号被映射到干扰信号源的原始或实际位置。
在优选实施例中,实施源分离器以考虑到信号源在房间内的空间位置或考虑到它们的统计属性而分离至少两个信号源的音频内容(即,有用信号源及干扰信号源的音频内容)。考虑到信号源的相关属性而分离信号源特别有利,因为在此情况下,以盲方式、或者先前完全不知道信号源的空间位置、或在房间中的任何声音传播的情况下执行信号分离。因此,源分离器仅需要最少量的先前信息,即关于由信号源产生的信号的相关属性或信号统计的信息。
在另一实施例中,源分离器适合于确定产生第一部分信号的处理规范的参数(作为第一部分信号相对于第一麦克风信号的失真的量度的函数),并对第一部分信号相对于第一麦克风信号的失真设置上限。换句话说,将用于确定第一部分信号和第二部分信号的处理规范的参数确定成使得失真具有上限。这可例如通过预定义一用于处理规范参数的预定义值空间来执行,将值空间选择成使得失真小于最大失真。举例来说,预定义可规定,根据预定义的范数(例如以均方形式),第一部分信号与第一麦克风信号的差异小于预定义的最大偏差。
在一个实施例中,实施源分离器以在确定第一麦克风信号与第一部分信号之间的失真大于预定义的阈值时将以减小所述失真的方式改变处理规范的参数。作为替代或另外的方案,可进一步实施源分离器以在设置或优化处理规范的参数时考虑到第一部分信号相对于第一麦克风信号(或第二部分信号相对于第二麦克风信号)的失真的量度(见,例如[14])。
通过以上提到的措施,实现了(总而言之)第一麦克风信号与第一部分信号之间(或第二麦克风信号与第二部分信号之间)的失真具备上限或者被最小化。
在另一优选实施例中,实施源分离器以通过使用代价函数进行优化来确定用于产生第一部分信号和第二部分信号的一种处理规范(或复数种处理规范)的参数。通过以上提到的优化,可实现尽可能最佳的结果,所述结果包括信号源的分离(部分信号之间的统计独立性)与失真之间的平衡。
根据另一替代实施例,本发明包括根据权利要求12所述的信号分离器。
根据权利要求10所述的信号分离器是基于以下核心思想:有利地用源分离器从至少两个麦克风信号中提取来自干扰信号源的干扰信号,以便用可调滤波器以不同方式使所得的部分信号失真至少两次,以从第一麦克风信号中移除第一失真的部分信号,并从第二麦克风信号中移除第二失真的部分信号。这导致第一校正后的麦克风信号形成第一输出信号,且第二校正后的麦克风信号形成第二输出信号。进一步实施参数调整器,以用相互独立的方式调整在产生第一失真的部分信号时的滤波器参数和在产生第二失真的信号时的滤波器参数,以便从第一麦克风信号和第二麦克风信号中移除用各种方式失真的干扰信号源的干扰信号的版本。因此实施参数调整器,以用相互独立的方式调整用于产生第一和第二失真的部分信号的参数,以便在两个麦克风信号中均对干扰信号源的音频内容进行独立的最小化或减少。这是有利的,因为第一麦克风信号中的干扰信号源的贡献不同于第二麦克风信号中的干扰信号源的贡献,这是由于正如已知的,在干扰信号源与用于产生麦克风信号的声传感器之间存在不同的传播路径。
此外,优选地对部分信号执行自适应失真,使得例如在第一校正后的麦克风信号中,在信号移除器的输出处减少干扰信号源的音频内容,此自适应失真确保了在第一失真的部分信号中,将干扰信号源映射到与第一麦克风信号所描述的相同的空间位置。因此,第一失真的部分信号与第一麦克风信号的组合导致将干扰信号源的音频内容的残余部分映射到干扰信号源的实际空间位置。
以此类推,基于提到的方法,在第二输出信号中,将干扰信号源的残余部分映射到干扰信号源的实际位置。因此,只要输出信号中存在干扰信号源的残余部分,就会正确地表示两个输出信号中的干扰信号源的位置。
此外,应注意,两个输出信号本质上直接基于两个输入信号或麦克风信号,仅从输入信号或麦克风信号中移除干扰信号源的信号部分。因此,两个输出信号还正确地再生了有用信号源的空间位置。
本发明的信号分离器的另一优点在于,源分离器只需要能够从两个麦克风信号中提取干扰信号源的信号。因此,源分离器只需要提供再生干扰信号源的音频内容的单信道输出信号。可能在源分离器中发生的部分信号相对于麦克风信号的失真通过可调滤波器来平衡,所述可调滤波器用两种可彼此独立地调整的方式使部分信号失真,以便公平对待需要从两个麦克风信号中移除以各种方式失真的干扰源的干扰信号的版本的事实。
在另一优选实施例中,实施参数调整器,以确定第一校正后的麦克风信号中的功率和第二校正后的麦克风信号中的功率,以便改变第一可调滤波器的滤波器参数,使得减小第一校正后的麦克风信号中的功率,并改变第二可调滤波器的滤波器参数,使得减小第二校正后的麦克风信号中的功率。实际上已证明,第一校正后的麦克风信号中的功率和第二校正后的麦克风信号中的功率是关于在产生第一和第二失真的部分信号时是否通过可调滤波器正确地调整了部分信号的失真的容易使用的标准。由于本质上在第一和第二失真的部分信号中仅包含来自干扰信号源的一个信号部分,所以(例如)如果将可调滤波器调整成使得第一校正后的麦克风信号中的干扰信号源的音频内容最小化,那么第一校正后的麦克风信号的功率将变得最小。也可用特别有效的方式在有用信号源的信号非常微弱的时间间隔期间利用以上提到的事实,因为那时来自干扰信号源的信号将在麦克风信号中占优势。类似的规定也适用于对用于产生第二失真的部分信号的滤波器参数的最佳调整。
此处应指出的是,所预期的信号也(例如)是区块或时间部分,其可具有例如能量或与其相关联的(平均)功率。
在另一优选实施例中,参数调整器包括一个有用信号辨别器,其经实施以辨别何时在第一和/或第二麦克风信号中存在来自有用信号源的包括至少为最小有用信号强度的有用信号。进一步实施参数调整器,以便仅在不存在包括至少为最小有用信号强度的有用信号的情况下改变滤波器参数。具体来说,已发现可接着通过使所校正的麦克风信号的功率最小化以最佳方式来执行滤波器参数的调整。具体来说,如果没有或仅有非常小的有用信号,那么在可调滤波器的滤波器参数经调整使得校正后的麦克风信号中存在干扰信号源的音频内容的最佳减少时,所校正的麦克风信号的功率将变成零或至少非常小。
附图说明
下文中将参看附图更详细地解释本发明的优选实施例,附图中:
图1是根据本发明的第一实施例使用具有次级条件的源分离器的本发明信号分离器的框图;
图2是根据本发明的第二实施例使用具有次级条件的源分离器的本发明信号分离器的框图;
图3是根据本发明的第三实施例使用对由源分离器提供的部分信号进行滤波的可调滤波器的本发明信号分离器的框图;
图4是根据本发明的第四实施例经重新配置的本发明信号分离器的框图;
图5是用于在本发明的信号分离器中利用的源分离器的框图;
图6是使用频域中的信号的本发明的信号分离器的信号流程图;
图7是根据本发明的第五实施例用于从至少两个麦克风信号中移除两个或两个以上干扰信号的本发明的信号分离器的框图;
图8是根据本发明的第六实施例第一本发明的方法的流程图;以及
图9是根据本发明的第七实施例第二本发明的方法的流程图。
具体实施方式
图1展示根据本发明第一实施例使用具有次级条件的源分离器的本发明信号分离器的框图。根据图1的布置整体上用100标示。信号分离器100从两个麦克风或声传感器110、112接收两个麦克风信号x1、x2。麦克风或声传感器110、112记录来自至少两个信号源120、122的声信号,第一信号源120在下文中称为有用信号源,而第二信号源122在下文中称为干扰信号源。通常,第一声传感器110和第二声传感器112均可感知到有用信号源120。并且,通常第一声传感器110和第二声传感器112均可感知到干扰信号源。因此,第一麦克风信号x1通常包括来自有用信号源120和干扰信号源122两者的信号部分。同样,第二麦克风信号x2通常也包括来自有用信号源120和干扰信号源122两者的信号部分。
此处应注意,麦克风信号x1和x2无需由麦克风或声传感器110、112直接产生,而是也可(例如)通过音频信号的传输(例如,经由模拟或数字数据链路)来形成麦克风信号x1和x2。此外,麦克风信号x1、x2也可起源于音频再生设备或计算机。
一盲源分离器130接收两个麦克风信号x1、x2,并基于麦克风信号x1、x2产生两个部分信号y1、y2。在此情况下,第一部分信号y1本质上包括有用信号源120的音频内容,而第二部分信号y2本质上包括干扰信号源122的音频内容。第一部分信号y1形成第一输出信号a1。可选的延迟构件136延迟第二麦克风信号x2,并因而提供延迟的麦克风信号x2’。一差异形成器140接收延迟的第二麦克风信号x2’,并经实施而从延迟的第二麦克风信号x2’中减去第二部分信号y2。差异形成器140因此将第二输出信号a2形成为延迟的第二麦克风信号x2’与第二部分信号y2之间的差异。
在省去延迟构件136的情况下,延迟的第二麦克风信号x2’与第二麦克风信号x2完全相同。
在本发明的信号分离器100的结构描述的基础上,下文将解释其功能。
盲源分离器130经实施以在使用次级条件的同时执行盲源分离。盲源分离器提供第一部分信号y1,其本质上包含第一信号源或有用信号源120的音频内容,且其中第二信号源或干扰信号源122的音频内容比第一信号源或有用信号源120的音频内容弱至少3dB,优选6dB(但更好的是至少10dB或至少20dB)。此外,盲源分离器130经实施以用以下方式产生第二部分信号y2:使得第二部分信号本质上包含第二信号源或干扰信号源122的音频内容,即,例如,第二部分信号y2中的第一信号源的音频内容比干扰信号源的音频内容弱至少3dB,优选至少6dB(但更好的是至少10dB或至少20dB)。因此,盲源分离器130提供(作为两个部分信号y1、y2)两个含有第一信号源120和第二信号源122的音频内容的信号,作为本质上彼此分立的单信道信号。
盲源分离器130进一步经实施以确保第一部分信号y1与第一麦克风信号x1之间的失真小于最大失真,所述最大失真通常被预定义。举例来说,可通过第一部分信号y1与第一麦克风信号x1之间的均方偏差来定义最大失真。第一部分信号y1与第一麦克风信号x1之间的偏差的量度也可例如与第一麦克风信号x1中的功率和/或第一部分信号y1中的功率有关。
视情况而定,盲源分离器130可进一步经实施以确保第二部分信号y2与第二麦克风信号x2之间的失真小于最大失真,所述最大失真通常是预定义的。第二部分信号y2相对于第二麦克风信号x2的最大失真可例如与第一部分信号y1相对于第一麦克风信号的最大失真完全相同,或者可与之不同。在优选实施例中,盲源分离器130经实施以向第一部分信号y1相对于第一麦克风信号x1的失真以及第二部分信号y2相对于第二麦克风信号x2的失真两者提供上限。
盲源分离器130可进一步经实施以最小化第一部分信号y1相对于第一麦克风信号x1的失真(且视情况而定,另外最小化第二部分信号y2相对于第二麦克风信号x2的失真),或者在调整参数时考虑描述失真的量值(magnitude)的至少一个标准。例如在K.Matsuoka和S.Nakashima的出版物[14]中描述了关于包括次级条件且实现对失真的优化或最小化的盲源分离器的实施方案的细节。
因此,包括以上提到的次级条件的引起对失真的限制(或优化或最小化)的盲源分离器130确保了第一部分信号y1本质上包括第一信号源120的音频内容,且进而并不相对于第一麦克风信号x1过高地失真。
因此,盲源分离器130经实施使得第一部分信号y1本质上包含第一麦克风信号x1中起源于第一信号源120的那部分。另一方面,在第一部分信号y1中减少或抑制第二信号源122的信号部分。因此,本质上与第一部分信号y1完全相同的输出信号a1代表第一信号源的包含在麦克风信号x1中的那部分,且进而仅相对于第一麦克风信号x1略微失真(在盲信号分离器130的次级条件指定的框架以内)。换句话说,第一输出信号a1与第一麦克风信号x1之间的相位偏移本质上与盲源分离器130的调整无关。换句话说,第一输出信号a1与第一麦克风信号x1之间的相位偏移本质上是预定的,和/或第一输出信号a1与第一麦克风信号x1之间的相位偏移优选在盲源分离器130的调整改变时不会浮动超过+/-20°(但更好的是不超过+/-10°或+/-5°)。类似地,包括次级条件的盲源分离器130经实施使得第二部分信号y2与第二麦克风信号x2之间的相位偏移优选在盲源分离器130的调整改变时改变少于+/-20°(但更好的是不超过+/-10°或+/-5°)。
盲源分离器130(基于次级条件)的相应实施方案确保了在基于第一部分信号y1的、或与第一部分信号y1完全相同的第一输出信号a1中,在位置方面以正确的方式表示第一信号源120。并且,确保了在第二部分信号y2中,以相对于第二麦克风信号x2本质上未失真的方式包含第二信号源122的音频内容,使得可通过差异形成器140从第二麦克风信号x2或从延迟的第二麦克风信号x2’中移除第二信号源122的音频内容。由于第二输出信号a2本质上是基于第二麦克风信号x2的且相对于第二麦克风信号仅改变了延迟和第二部分信号y2的移除,所以第一信号源120在第二输出信号a2中的空间位置被正确地表示。此外,通过布置100,实现了在输出信号a1、a2中,第二信号源122的空间位置或由第二信号源122引起的残余部分的空间位置也被正确地表示。
还应指出,布置100包括一个可选的选择器150。然而,在所示的实施例中,选择器150的任务只是将第一部分信号y1作为第一输出信号a1馈送到第一输出,并将第二部分信号y2馈送到差异形成器140。然而,图2中展示了选择器150的不同切换状态。
图2展示了根据本发明第二实施例本发明的信号分离器的框图。根据图2的信号分离器整体上由200标示。由于根据图2的信号分离器200非常类似于根据图1的信号分离器100,所以图1和图2中的完全相同的特征和/或信号用完全相同的方式标示且在此处将不再解释。
根据图2的布置200与根据图1的布置100的区别本质上在于,关于布置200,假设第二信号源122提供有用信号,而第一信号源120提供干扰信号。此外,假设第二部分信号y2本质上包括第二信号源122的音频内容,而第一部分信号y1本质上包括第一信号源120的音频内容。出于此原因,第二部分信号y2代表在第二麦克风信号x2中描述由第二信号源122提供的信号部分的输出信号。出于此原因,布置200中的选择器150经配置以在第二信号输出处提供第二部分信号y2作为第二输出信号a2。然而,差异形成器140接收第一部分信号y1,其本质上包括来自干扰信号源120的干扰信号。并且,差异形成器140接收第一麦克风信号x1或通过可选的延迟构件136延迟的第一麦克风信号x1’。因此,差异形成器140的输出信号形成第一输出信号a1并被转发给第一输出(例如,经由另一选择器)。
总而言之,可确定在盲源分离的框架内,未提前指定源分离器的存在有用信号的输出和源分离器的存在干扰信号的输出。因此,优选通过选择器来选择源分离器的哪个输出载运有用信号且因此直接耦合到信号分离器的输出,以及选择源分离器的哪个输出载运干扰信号且因此耦合到干扰信号移除构件。
举例来说(但不必要)基于关于源位置的空间信息来执行选择器作出的选择,如例如在[10]中描述的。
在根据图1的第一实施例中,源分离器(或源分离器核心)的第一输出信号y1载运有用信号,而源分离器(或源分离器核心)的第二输出信号y2载运干扰信号。因此,在此情况下,第一输出信号y1形成第一部分信号z1,而第二输出信号y2形成第二部分信号z2
在根据图2的第二实施例中,源分离器(或源分离器核心)的第一输出信号y1载运干扰信号,而源分离器(或源分离器核心)的第二输出信号y2载运有用信号。因此,在此情况下,第一输出信号y1形成第二部分信号z2,而第二输出信号y2形成第一部分信号z1
因此,可大体上确定第二部分信号(或干扰信号)相对于从其中移除干扰信号的麦克风信号的失真优选受到限制(例如,由次级条件限制)。然而,第一部分信号(或有用信号)相对于被第一部分信号取代的麦克风信号的失真优选受到限制。
图3展示根据本发明第三实施例使用可调滤波器的本发明的源分离器的框图。根据图3的布置整体上通过300标示。布置300包括两个麦克风或声传感器310、312,第一声传感器310提供第一麦克风信号x1,第二声传感器312提供第二麦克风信号x2。然而,正如上文已经说明的,麦克风信号也可起源于其它来源,例如起源于信号传输构件、音频信号再生构件或计算机。
图3进一步展示第一信号源320以及第二信号源322,所述两者均发射反映在麦克风信号x1、x2中的声信号。参看图3,在下文中将假设信号源320形成有用信号源,且第二信号源322形成干扰信号源。布置300进一步包含盲源分离器(BSS)330。盲源分离器330接收第一麦克风信号x1和第二麦克风信号x2,且进一步经实施以从第一和第二麦克风信号x1、x2中提取部分信号y2。布置300进一步包括两个可调滤波器340、350,所述两者均接收部分信号y2作为待滤波的输入信号。第一可调滤波器340基于部分信号y2产生第一失真的部分信号y2’。第二可调滤波器350基于部分信号y2产生第二失真的部分信号y2”。布置300进一步包括一个第一差异形成器360以及一个第二差异形成器370。第一差异形成器360接收第一麦克风信号x1或基于第一麦克风信号x1的信号x1’。基于第一麦克风信号的信号x1’例如通过滤波器380中可选的全通滤波而从第一麦克风信号中出现。或者,然而,信号x1’也可与第一麦克风信号x1完全相同。差异形成器360因此从信号x1’中减去第一失真的部分信号y2’,以便获得第一输出信号e1(也称为a1)。此外,第二差异形成器370接收基于第二麦克风信号x2的信号x2’,信号x2’例如是通过滤波器382中的(可选的)全通滤波从第二麦克风信号x2中得出的。然而,信号x2’也可与第二麦克风信号x2完全相同。
第二差异形成器370从信号x2’(或从第二麦克风信号x2)中减去第二失真的部分信号y2”,以便因此获得第二输出信号e2(也称为a2)。
与第一可调滤波器340相关联的参数调整器386(也称为调适控制器)接收第一输出信号e1,且经实施以作为第一输出信号e1的函数而调整正发生的滤波的参数。换句话说,第一输出信号e1形成第一可调滤波器340的误差信号。类似地,与第二可调滤波器350相关联的参数调整器388(也称为调适控制器)接收用于调整滤波器参数的第二输出信号e2。第二输出信号e2因此充当第二可调滤波器350的误差信号。可调滤波器340、350优选是自适应滤波器,其滤波器参数基于相关联的误差信号通过相关联的参数调整器或调适控制器386、388来调整。
此处应指出的是,第一可调滤波器340和第二可调滤波器350也可实现为一个单个滤波器,其用相互独立的方式从部分信号y2产生第一失真的部分信号y2’和第二失真的部分信号y2”。同样在此情况下,第一输出信号e1用以调整在从部分信号y2产生第一失真的部分信号y2’时使用的滤波器参数。第二输出信号e2用以调整在从部分信号y2产生第二失真的部分信号y2”时使用的滤波器参数。
因此,滤波器340、350是自适应滤波器,通过参数调整器或调适控制器386、388作为相关联的输出信号e1、e2的函数而调整其滤波器特性,第一输出信号e1代表第一麦克风信号x1(或基于第一麦克风信号x1的延迟的和/或全通滤波信号x1’)与第一失真的部分信号y2’之间的差异,且第二输出信号e2代表第二麦克风信号x2(或通过延迟和/或全通滤波从第二麦克风信号x2得出的信号x2’)与第二失真的部分信号y2”之间的差异。
一般来说,第一滤波器340因此也可结合参数调整器386而被视为自适应滤波器,其经实施以调整滤波器参数,使得第一失真的部分信号y2’与第一麦克风信号x1或从第一麦克风信号x1得出的信号x1’(尽可能地)匹配。换句话说,第一麦克风信号x1或从第一麦克风信号x1得出的信号x1’用作用于调整第一可调滤波器340滤波器参数的参考信号。类似地,第二麦克风信号x2或从第二麦克风信号x2得出的信号x2’用作用于调整第二可调滤波器350滤波器参数的参考信号,以便优选地调整第二滤波器,使得第二失真的部分信号与第二麦克风信号x2或从第二麦克风信号x2得出的信号x2’(尽可能地)匹配。
应注意,优选在麦克风信号x1、x2或从麦克风信号x1、x2得出的信号x1’、x2’中本质上仅包含干扰信号源322的一部分时,执行对可调滤波器340或350的滤波器系数的调整。在此情况下,可基于输出信号e1、e2来调整滤波器340、350的参数,使得第一失真的部分信号y2’本质上对应于麦克风信号x1或信号x1’中的由干扰信号源322引起的那部分,且使得第二失真的部分信号y2”本质上对应于干扰信号源322的包含于第二麦克风信号x2或信号x2’中的那部分。在以上提到的条件的框架内,有效地减少或甚至可能最小化(例如在功率或能量方面)第一输出信号e1和第二输出信号e2中的由干扰信号源322引起的部分。
因此,优选在麦克风信号x1、x2中本质上仅包含干扰信号源322的一部分时,即当麦克风信号x1、x2中仅包含有用信号源320的可忽略的部分时,才调整或调适第一可调滤波器340和第二可调滤波器350的滤波器参数。为此目的,布置300视情况而包括一个有用信号检测器390,其例如经实施以识别何时来自有用信号源320的有用信号低于预定义的或可变的阈值水平。例如,为此目的,有用信号检测器390接收第一麦克风信号x1和第二麦克风信号x2(或者,替代地,仅这些麦克风信号之一)。有用信号检测器390可例如是识别何时存在语音信号(如果,例如,仅将语音信号视为有用信号)的语音检测器。因此,有用信号检测器390可充当用于调适控制器386、388的控制构件,且可(可选地)控制与可调滤波器340、350相关联的调适控制器386、388,使得仅在麦克风信号x1、x2中的有用信号的音频内容比预定义的或可变的阈值弱时才改变或调适其滤波器参数。
不论是否采用有用信号检测器390(但优选结合采用有用信号检测器390),与可调滤波器340、350相关联的调适控制器386、388均可经实施以用以下方式调整相应滤波器参数:使得例如第一输出信号e1或第二输出信号e2的功率或能量因滤波器参数的变化而减小,或者以上提到的功率或能量因滤波器参数的变化而最小化。换句话说,在调整滤波器参数时,例如只有以减小第一输出信号e1中包含的功率或能量、和/或第二输出信号e2中包含的功率或能量的方式,才可允许滤波器参数变化。第一输出信号e1或第二输出信号e2中的功率或能量因此也可解释为平方误差,其描述例如信号x1’与第一失真的部分信号y2’或信号x2’与第二失真的部分信号y2”之间的偏差。
换句话说,优选以使得信号x1’与第一失真的部分信号y2’之间的偏差相对于距离的量度减小或最小化的方式,改变(例如)第一可调滤波器340的滤波器参数(借助相关联的调适控制器386)。距离的量度可例如是差异信号或误差信号e1的任何数学范数。第二可调滤波器350的滤波器参数可用类似方式来调整(通过相关联的调适控制器388)。
关于对所监视的滤波器的调适控制的更多细节可参阅例如公开案[16]和[17]。在本发明的概念的优选实施方案中,使用遵循公开案[17]的等式2的调适控制器。在本发明的上下文中使用的调适控制器在计算两个功率密度频谱的方式方面不同于[17]所示的调适控制器。在本发明的上下文中,优选地估计盲源分离(BSS)的输出信号的功率密度频谱。此外,优选估计麦克风信号与盲源分离的输出信号之间的差异信号(例如,信号e1、e2)的功率密度频率。
图4展示根据本发明第四实施例本发明的信号分离器的框图。根据图4的信号分离器整体上由400标示。根据图4的信号分离器400非常类似于根据图3的信号分离器300,因而用相同的附图标记来标示图3和图4中完全相同的特征或信号。
根据图4的信号分离器400与根据图3的信号分离器300的区别本质上在于,信号分离器400可使用第二选择器410、420来重新配置。此外,盲源分离器330可视情况而在具有或不具有根据图4的信号分离器400内的次级条件的情况下操作。换句话说,第一麦克风信号x1与第一部分信号y2之间或第二麦克风信号x2与第二部分信号y2之间的失真可受到限制或能够自由地采用任何值。
假设在第一配置状态下,盲源分离器330以次级条件操作,且盲源分离器330输出一信号作为第一部分信号y1,所述信号相对于第一麦克风信号x1的失真受到限制或减小或最小化。在此情况下,第一选择器410将第一部分信号y1作为信号z1转发给第二选择器420。第二选择器420随后将信号z1作为第一输出信号a1转发给第一输出。此外,第一选择器410将第二部分信号y2作为信号z2转发给第一可调滤波器340且转发给第二可调滤波器350。并且,选择器2将信号e2作为信号a2转发给第二输出。可选的全通或延迟器382在此状态下是活动的,正如第二差异形成器370那样。在所描述的操作状态下,第二可调滤波器350将信号z2不加改变地作为信号y2”转发给第二差异形成器370。在所提到的状态下,第一差异形成器360、第一可调滤波器340和第一全通或延迟器380可视情况而被停用,因为未使用信号e1。并且,第二可调滤波器350也可被停用或绕过。
在第二操作状态下,盲源分离器330以次级条件操作,第二部分信号y2代表基于第二麦克风信号x2的有用信号。在此情况下,第一选择器410将第二部分信号y2作为信号z1转发给第二选择器420。在第二操作状态下,第二选择器420将信号z1作为第二输出信号a2转发给第二输出。此外,第一选择器将第一部分信号y1作为信号z2转发给第一可调滤波器340且转发给第二可调滤波器350,所述第一部分信号y1在提到的操作状态下本质上包含干扰信号的音频内容。第一可调滤波器340优选将信号z2不加改变地转发,以便获得信号y2’。此外,第二选择器420将信号e1作为第一输出信号a1转发给第一输出。可选的第一全通或延迟器380和第一差异形成器360在所提到的操作状态下是活动的。视情况而定,第二全通或延迟器382、第二差异形成器370和/或第二可调滤波器350可在第二操作状态下被停用。并且,第一可调滤波器340也可被停用或绕过。
在第三操作状态下,盲源分离器330在没有次级条件的情况下操作,第一部分信号y1本质上载运干扰信号的音频内容。在此情况下,第一选择器410将第一部分信号y1作为信号z2转发给第一可调滤波器340且转发给第二可调滤波器350。第二选择器也将信号e1作为第一输出信号a2转发给第一输出。此外,第二选择器420将信号e2作为第二输出信号a2转发给第二输出。
在第四操作状态下,盲源分离器330在没有次级条件的情况下操作,第二部分信号y2本质上描述干扰信号的音频内容。在此情况下,第一选择器410将第二部分信号y2转发给第一可调滤波器340且转发给第二可调滤波器350。并且,第二选择器将信号e1作为第一输出信号a1转发给第一输出,且将信号e2作为第二输出信号a2转发给第二输出。
信号分离器400可因此依据要求而调适。电路400可进一步经实施以能够采用所提到的那些操作状态中的仅一者或所提到的那些操作状态的子集。
图5展示用于在本发明的电路中利用的盲源分离器的框图。根据图5的盲源分离器整体上由500标示。盲源分离器500接收例如第一麦克风信号x1作为第一输入信号510,并接收例如第二麦克风信号x2作为第二输入信号512。盲源分离器500进一步经配置以产生第一部分信号y1作为第一输出信号520,并产生第二部分信号y2作为第二输出信号522。
源分离器500包含例如两个滤波器/组合器530、532。举例来说,第一滤波器/组合器530接收第一输入信号510和第二输入信号512,并提供第一输出信号520。第二滤波器/组合器532也接收第一输入信号510和第二输入信号512,并提供第二输出信号522。并且,应注意,也可在一个单元中配置所述两个滤波器/组合器530、532。
参数调整器540经实施以调整第一滤波器/组合器530和第二滤波器/组合器532的滤波器参数。为此目的,参数调整器540接收例如输入信号510、512两者,且作为替代或另外,接收两个输出信号520、522。在此上下文中,参数调整器540经实施以评估例如输入信号510、512和/或输出信号520、522的信号统计,并调整滤波器参数,以便改进或优化或最大化两个输出信号520、522之间的统计独立性。换句话说,参数调整器540经实施以(例如)用改进(增加)或至少不降级输出信号520、522的统计独立性的方向或方式来改变滤波器参数。视情况而定,参数调整器540另外还可考虑到第一输入信号510与第一输出信号520之间和/或第二输入信号512与第二输出信号522之间的信号失真,以便调整或设置或优化滤波器参数,使得信号失真将不超过预定义的最大可准许的信号失真。因此,参数调整器540可经实施以实现输出信号520、522的统计独立性和输出信号520、522相对于输入信号510、512的失真之间的折衷,所述折衷由代价函数来指定。
关于与执行盲源分离有关的细节,请参看相关文献,特别是公开案[14]。
在[18]中还给出了关于盲源分离的更多细节。作为输出信号的统计独立性的量度,例如可使用库尔贝克-莱伯勒(Kullback-Leibler)距离。或者,也可使用最大熵、最小相互转移信息或负熵作为统计独立性的量度。例如在[1]中描述了统计独立性的以上提到的量度。
图6展示根据图1的本发明的信号分离器100的信号流程图。根据图6的信号流程图整体上由600标示,且描述了一个系统,其中使用一频域内的信号来执行从第二麦克风信号中盲源分离和移除干扰源的音频内容两者。例如,借助于时间开窗610将麦克风信号x1(t)细分为各个信号段。如果时间信号x1(t)是以例如特定取样速率的样本的形式存在,那么区段x1(t1...t2)可包含例如时间t1与t2之间的若干个(N个)样本(N优选在16与4,096之间变动)。随后,对区段x1(t1...t2)应用从信号区段产生一组频谱系数的变换。举例来说,可采用离散傅里叶变换(DFT)620,以便从时域中的信号区段x1(t1...t2)产生一组频谱系数x11)t1...t2到x1I)t1...t2(I标示不同频带的数目,且ω1到ωI标示例如离散傅里叶变换的多种频带)。也可对第二麦克风信号x2(t)(其起初作为时间信号存在)执行类似处理,以便针对第二麦克风信号的时间段获得一组频谱系数x21)t1...t2到x2I)t1...t2
盲信号分离器630接收代表一时间段内第一麦克风信号x1(t)的第一组频谱系数,以及代表一时间段内第二麦克风信号x2(t)的第二组频谱系数。盲源分离器630因此处理所述两组频谱系数,并进而将部分信号y1、y2提供为两组频谱系数(y11)t1...t2到y1I)t1...t2以及y21)t1...t2到y2I)t1...t2)。通过变换将描述第一部分信号y1所述组频谱系数转换回时间信号。例如可采用离散傅里叶逆变换(DFT-1)640。因此,在时域(例如在时间t1与t2之间,或在不同的时域中)获得第一部分信号y1或输出信号a1
此外,例如可将信号e1形成为第二麦克风信号x2与第二部分信号y2之间的差异。如图6所示,可针对不同的频谱范围分别执行差异形成。接着例如使用离散傅里叶逆变换660将已用此方式获得的特定时间间隔内的信号e2的频谱系数(称为e21)t1...t2到e2I)t1...t2)转换回时间信号。
应指出,也可完全或部分地在一频谱范围内执行布置200、300和400中的处理。举例来说,频谱范围中的可调滤波器340的配置特别有利,因为例如第一可调滤波器340中的滤波器操作仅包括描述信号z2的那些频谱系数与相关联的滤波器系数的乘法。因此,将整个滤波器处理分成各个频域,这使得能以相互独立的方式来调整滤波器系数。因此,与时域实施方案相比实质上简化了实施方案。因此可例如用相互独立的方式来调整可调滤波器340、350的各个滤波器系数。
关于频域内的处理的细节可参阅例如[2]和[3]。
除了执行频域内的处理之外,还可能可进行时域内的处理或部分地在时域内且部分地在频域内的混合处理(见,例如[4])。
图7展示根据本发明另一实施例本发明的信号分离器的框图。根据图7的信号分离器整体上由700标示。关于信号分离器700,假设有P个麦克风710A-710P的P个麦克风信号可用。所述麦克风信号由x1到xp标示。一个源分离器(或盲源分离器)730接收P个麦克风信号x1到xp,并产生Q个部分信号y1到yQ,部分信号y1到yQ描述Q个不同源的音频内容。
在下文中,将假设需要将Q-I信号源的信号转发给输出。此外,假设需要从输出信号中屏蔽出来自I个干扰源的信号。为此目的,选择器740经实施以将部分信号y1到yQ的I个部分信号转发给滤波器746A-746P的P个区块。区块746A-746P中的每一者包含具有相关联的调适控制器747A-747P的I个可调滤波器。举例来说,第一区块746A包括I个可调滤波器750A-750I,一个区块内的第i个可调滤波器接收第i个干扰信号(来自信号zQ-i +1到zQ)作为待滤波的输入信号。第p个滤波器区块的I个各个可调滤波器的输出作用于第p个麦克风信号xp。P个滤波器区块中的至少一个区块746A-746P经实施以从第p个麦克风信号中移除I个干扰信号,以便获得信号ep。滤波器区块746A-746P中的每一者经实施以用可各别调整的方式来使I个干扰信号失真,并随后(借助于差异形成)从相应的第p个麦克风信号中移除失真的信号。基于差异信号来(通过相关联的调适控制器747A-747P)调整用于I个干扰信号的各个滤波器的参数或系数,所述差异信号是通过从相应的(例如,第p个)麦克风信号中移除或减去I个失真的干扰信号而产生的。
也可例如经由可选的有用信号检测器748来控制调适控制器747A-747P,有用信号748在其功能方面对应于根据图3的有用信号检测器390。
此外,输出选择器780经实施以将免除了干扰信号的麦克风信号(例如,信号e1-ep)转发给输出。或者,输出选择器780也可经配置以将有用信号z1到zQ-1转发给(例如)输出。如果源分离器包括次级条件,那么有用信号z1到zQ-1通常(但未必)可直接使用。
图8展示根据本发明实施例第一本发明的方法的流程图。根据图8的方法整体上由800标示。所述方法适合于确定第一麦克风信号中描述有用信号源音频内容的第一输出信号,并进一步确定第二麦克风信号中描述有用信号源音频内容的第二输出信号。在第一步骤810中,所述方法包含接收两个麦克风信号,并分离至少两个信号源的音频内容,以便获得本质上描述第一信号源音频内容且代表第一输出信号的第一部分信号,并获得本质上描述第二信号源音频内容的第二部分信号。在第二步骤820中,所述方法包括调整用于产生第一部分信号的处理规范的参数,使得第一部分信号相对于第一麦克风信号的失真小于最大失真。此外,在第三步骤830中,方法800包括调整用于产生第二部分信号的处理规范的参数,使得第二部分信号相对于第二麦克风信号的失真小于最大失真。在第四步骤840中,所述方法进一步包括从第二麦克风信号中移除第二部分信号,以便获得其中第二部分信号减少的第二输出信号。根据图8的方法800也可用已相对于本发明的装置而说明的所有那些步骤来补充。
图9展示根据本发明实施例第二本发明的方法的流程图。根据图9的方法整体上由900标示,且用以确定第一麦克风信号中描述有用信号源音频内容的第一输出信号,并确定第二麦克风信号中描述有用信号源音频内容的第二输出信号。在第一步骤910中,方法900包括接收两个麦克风信号,并分离至少两个信号源的音频内容,以便获得本质上描述干扰信号源音频内容的部分信号。在第二步骤920中,方法900包括使部分信号失真以获得第一失真的部分信号,且在第三步骤930中,使部分信号失真以获得第二失真的部分信号。在第四步骤940中,方法900进一步包括从第一麦克风信号中移除第一失真的部分信号,且在第五步骤950中从第二麦克风信号中移除第二失真的部分信号。在第六步骤中,方法900进一步包括调整第一可调滤波器的滤波器参数,以便减少第一麦克风信号中干扰信号源的音频内容,且在第七步骤970中,调整第二可调滤波器的滤波器参数,以便减少第二麦克风信号中干扰信号源的音频内容。
根据图9的方法900可用参看本发明的装置描述的所有那些步骤来补充。
并且,本发明的方法依据情况可在硬件或软件中实施。实施方案可实现于数字存储媒体上,例如磁盘、CD、DVD、ROM、PROM、EPROM、EEPROM或快闪存储介质,其包括电子可读控制信号,所述电子可读控制信号可用执行相应方法的方式与可编程的计算机系统交互。一般来说,本发明因此还存在于一种包括程序代码的计算机程序产品中,所述程序代码存储在机器可读载体上,用于当计算机程序产品在计算机上运行时执行本发明的方法。换句话说,本发明因此可实现为包括程序代码的计算机程序,所述程序代码用于在计算机程序在计算机上运行时执行所述方法。
在下文中,将简要概述本发明的核心思想。为了进一步理解,下文中将首先针对P=2个传感器和Q=2个源信号的情况来解释本发明。在图4中描绘了P=Q=2的装置或方法的框图。如上文所描述,盲源分离系统(BSS系统)330形成第一级,所述第一级在P=2个传感器x1、x2之上、之处或从其获得Q=2个统计上独立的源信号的叠加。盲源分离系统(BSS系统)330理想地分别在两个输出或BSS输出y1、y2处提供点源的两个信号之一。在现实应用场景中,除了每一情况下所需的点源信号之外,还可在其中(在信号y1、y2中)包含其它源信号的残余部分。此外,盲源分离系统(BSS系统)330可通常确定源信号仅达任何滤波水平的准确度。然而,通过包含次级条件(次级条件通过距离的量度,使BSS系统的输入x1、x2与输出y1、y2耦合,见例如[14]),可实现BSS系统不执行对分离的点源的任意滤波。在此情况下,分离的源信号y1、y2理想地对应于传感器信号x1或x2中的起源于第一源320(源1)或起源于第二源322(源2)的相应部分(见[14])。
依据是选择了包括还是不包括以上描述的次级条件的BSS系统330,后处理的类型将不同。借助于根据图4的第二选择器420(选择器2),可借助对输出信号的适合选择而在两个后处理技术(下文中称为技术A和技术B)之间实现切换。技术A需要包括次级条件的BSS系统,而技术B并不绝对必需次级条件。
通过两种技术,首先在第一选择器410(选择器1)中作出关于信号y1或信号y2是否含有所需的点源的决定。接着将所需的点源信号馈送到信道z1,并将干扰源信号馈送到信号z2。应注意,在现实应用场景中,其它源信号的残余部分仍将分别存在。下文中将解释技术A和B:
技术A:
在所需的点源位于信道y1(即,信道y1本质上代表所需点源的音频内容)的情况下,第一选择器410(选择器1)将连接信号y1到z1。考虑到(盲信号分离器330的)次级条件,z1已经含有描述从第一源320(源1)到第一传感器或声传感器或麦克风(传感器1)的传播的正确传输函数。因此,z1可因而从第二选择器420(选择器2)一直切换到第一输出(输出1)(并因此形成第一输出信号a1)。
如果所需的点源位于信道y2中,那么第一选择器410(选择器1)将连接信道y2到z1。考虑到次级条件,z1在此情况下将含有从第二源322(源2)到第二传感器或声传感器或麦克风(传感器2)的传输函数。这就是为什么在此情况下第二选择器420(选择器2)把信道z1一直切换到第二输出(输出2)(以获得第二输出信号a2)。
在第一情况下从第一源320(源1)到第二传感器或声传感器或麦克风(传感器2)的传输函数在信号e2内恢复。在此情况下,通过第二选择器420(选择器2)将信号e2一直切换到第二输出(输出2)(以形成第二输出信号a2)。
在第二情况下,需要从第二源322(源2)到第一传感器或声传感器或麦克风(传感器1)的传输函数。所述传输函数在信号e1内恢复。随后,通过第二选择器420(选择器2)将信号e1一直切换到第一输出(输出1)(以形成第一输出信号a1)。
产生信号e1和e2,因为信号z2(其含有干扰信号)连接到自适应滤波器340(也称为h1)和350(也称为h2),且随后从参考信号中减去。借助参考信号,分别也并入传感器信号x1和x2,其分别由全通380(也称为全通a1)和382(也称为全通a2)来处理。作为特殊情况,也可将全通380(全通a1)和382(全通a2)选择为纯延迟单元。
上文已描述的根据[12]的自适应滤波技术用于调适滤波器340(h1)、350(h2)。换句话说,多信道源分离系统的输出信道在每一情况下连接到单信道自适应滤波器,所述单信道自适应滤波器并入有延迟的麦克风信号作为参考信号。自适应的部分离散滤波器代表数字信号处理中的一种普遍技术[12]。自适应滤波器的原理是用在给定已知输入信号的情况下,将系统或自适应滤波器的输出信号近似成参考信号的方式确定滤波器系数(见,例如[12])。这可实现,(例如)因为误差信号ep(n)根据特定标准(通常,根据均方误差)而最小化。举例来说,以下可适用于误差信号:
e1(n)=x1'(n)-y2'(n),
其中n描述(例如)样本或时间间隔的矩,且其中可能应例如通过在时间和/或频率上求平均值来确定均方误差(即,误差信号ep或e1的平均功率或能量)。
在信号e1、e2中,因此抑制了不需要的点源。由于将传感器信号(或通过全通380、382从传感器信号得出的信号)用作参考信号(x1’,x2’)的事实,所以每一情况下所需的点源和被抑制的点源均用空间上正确的方式在信号e1、e2中表示。并且,由于每一情况下的一个参考信号由传感器信号产生的事实,所以用于所监视的自适应滤波的高效算法可用于调适滤波器340(h1)、350(h2)。
与下文将描述的技术B形成对比,在技术A中可由常数因子1来替代(即,可省去)自适应滤波器340(h1)和350(h2)。此对于实际应用有关的特殊情况导致系统简化。连同全通380(全通a1)和382(全通a2)作为纯延迟单元的可能简化,因此产生两个新的框图。
图1描绘在所需的源信号位于y2中的情况下,即在第一选择器410(选择器1)连接BBS输出y2到z1的情况下的简化系统。换句话说,源信号或有用源信号将在BSS输出y2处出现,而干扰源信号将在BSS输出y1处出现。
图2描绘在所需的源信号位于y1中的情况下,即在第一选择器410(选择器1)连接BBS输出y1到z1的情况下的简化系统。换句话说,源信号或有用源信号将在BSS输出y1处出现。然而,干扰源信号将在BSS输出y2处出现。
技术B:
通过技术B,关于BSS系统或关于盲信道估计器的次级条件不是强制性的,而是可选的。因此,无法假设信号y1和y2含有两个源320、322(源1、源2)到传感器或声传感器或麦克风(传感器1、传感器2)的传输函数。出于此原因,通过技术B,第二选择器420(选择器2)将信号e1一直切换到第一输出(输出a1)作为第一输出信号a1,并进一步将信号e2一直切换到第二输出(输出2)作为第二输出信号a2(见图4)。
在图7中描绘本发明扩展为具有P个传感器和Q个点源的BSS系统(或用于盲源分离的系统)。干扰源的数目由I来标示。这导致所需的Q-1点源。BSS系统700提供Q个分离的源,Q-I个所需的点源通过第一选择器740(选择器1)与信道Z1到ZQ-I相关联。干扰源通过第一选择器740(选择器1)与信道ZQ-I+1到ZQ相关联。信道ZQ-I+1到ZQ连接到自适应滤波器hi,1到hi,I(i=1,...,P),且从参考信号中减去。换句话说,信道ZQ-I+1到ZQ通过自适应滤波器hi,1到hi,I失真,且失真的信号从参考信号中减去,即,例如从全通滤波的麦克风信号x1到xp中减去。借助参考信号,因此分别并入借助全通(全通a1,...,全通ap)修改的传感器信号x1,...,xp。作为特殊情况,全通(全通a1,...,全通ap)可再次被选择为纯延迟单元。以此方式,产生信号e1,...,ep,其中抑制了所有Q-1个所需的点源。由于将传感器信号(或全通滤波的传感器信号)用作参考信号的事实,所以需要所述两个点源,且分别以空间上正确的方式在信号e1,...,ep中表示被抑制的点源。
同样,通过技术A,优选选择包括次级条件的BSS。基于含有信号z1,...,ZQ-I中的所需点源的传输函数,接着将通过第二选择器780(选择器2)将信号z1,...,ZQ-I一直切换到相应的输出信道。这意味着被第一选择器740(选择器1)考虑到的BSS输出信号的潜在排列也必须被第二选择器780(选择器2)考虑到。由选择器2执行的对信道z1,...,ZQ-I到输出1,...,P的连接的选择在上文中针对P=Q=2的情况详细论述,且在此处用类似方式进行。其余的P-Q+I个输出信号从信号e1,...,ep确定。
通过技术B,BSS系统(即,例如在盲源分离器730中)中的次级条件不是强制性的。这就是为什么此处将信号e1,...,ep一直连接到输出1,...,P。
在下文中,将关于本发明的实际实施方案来说明若干观察结果。此处描述的本发明是借助模拟而对声信号检验。为此目的,借助于两个麦克风在混响室中记录两个点源的信号(语音信号)。此处,信号之一代表所需的点源,另一信号代表干扰源。麦克风信号通过BSS算法来处理,BSS算法将在短暂的收敛时间之后在两个BSS输出信道之一处提供所需的语音信号连同干扰信号的较小残余部分。其它BSS输出将提供干扰信号连同所需的点源的较小残余部分。第一选择器(选择器1)将包含干扰源的BSS输出信号传递到自适应滤波器h1,1和h2,1。因此,在后处理区块的输出e1和e2处实现所需的点源以及干扰源的残余部分的空间上正确的表现形式。
借助于模拟来测试技术A和技术B两者。通过两种技术,可能实现所需的点源和干扰源的空间上正确的表现形式。可通过立体声再生系统(即耳机)来收听所述两个信道。
总而言之,因此可确定本发明提供一种用于在盲源分离系统中恢复空间信息的系统。常规的盲源分离系统在每一输出信道中从传感器(或声传感器或麦克风)处的信号混合来确定每一情况下所需的点源连同可能存在的干扰源的残余部分的一个信道估计。本发明提供后处理区块以从所需的点源和可能仍存在的干扰源两者中恢复空间信息。为了确定后处理区块的输出信号,连同盲源分离的输出信号(例如,信号y1,y2,...,yQ)一起利用传感器信号(或麦克风信号)。根据文献已知的大多数类似概念只实现所需的源的空间表现形式,使得也将可能仍存在的任何干扰源映射到此点。
因此,本发明的本质思想或动机是在输出处恢复空间信息(即,关于点源的空间位置的信息),因为在新的后处理区块中连同BSS的输出信号一起处理原始传感器信号。
总而言之,因此可确定本发明提供一种信号分离器,其实现了从多信道音频信号中有效地移除干扰源,干扰源的任何剩余残余部分映射到其原始空间位置。本发明也实现了以相对低的花费来实现。
参考书目
[1]A.Hyvarinen(A.赫拉里曼)、J.Harhunen(J.哈赫纳)及E.Oja(E.奥加):Independent Component Analysis(独立分量分析),2001年,纽约Wiley & Sons(威利出版社)。
[2]L.Parra(L.帕拉)及C.Spence(C.斯帕斯):Convolutive BlindSource Separation of Non-stationary Sources(非固定源的卷积盲源分离),IEEE Trans.Speech an Audio Processing(IEEE学报,语音与音频处理),2000年5月,第320到327页。
[3]欧洲专利EP 1070390B1,L.Parra(L.帕拉)及(C.斯帕斯):Convolutive Blind Source Separation Usinga Multiple DecorrelationMethod(使用多解相关方法的卷积盲源分离),欧洲专利说明书1070390B1,申请日:1999年4月8日,主张1998年4月8日的优先权,于2005年6月22日公开,专利类别(IPC)H03H21/00。
[4]H.Buchner(H.巴切纳),R.Aichner(R.艾切纳)及W.Kellermann(W.凯勒曼),Blind Source Sepaaration for Convolutive Mixtures:AUnified Treatment(用于卷积混合的盲源分离:统一处理),收录于Y.Huang,J.Benesty(J.贝纳斯迪)(编者)Audio Signal Processing(音频信号处理)中,波士顿Kluwer Academic Publishers(克劳威学术出版社),2004年。
[5]T.Hoya、T.Tanaka、A.Cichicki、T.Murakami、G.Hori及J.Chambers(J.钱伯斯):Stereophonic Noise Reduction Usinga CombinedSliding Subspace Projection an Adaptive Signal Enhancement(使用组合滑动子空间投射与自适应信号增强的立体声噪声减少)IEEE Trans.Speech an Audio Processing(IEEE学报,语音与音频处理),2005年5月,第13卷,第3期,第309320页。
[6]J.Allen(J.艾伦)及D.Berkley(D.伯克利),Image Method forEfficiently Simulating Small-Room Acoustics(高效模拟小房间声学的图像方法),J.Acoust.Soc.Am.,1979年,第943 950页。
[7]J.Garas(J.加拉斯),Adaptive 3D Sound Systems(自适应3D声音系统),Kluwer Academic Publishers(克劳威学术出版社),2000。
[8]专利WO 2004/006624 AI,E.Schaeffer(E.斯切非尔):Sound SourceSpatialization System(声源空间化系统),申请日:2003年6月27日,主张2002年7月2日的优先权,2004年1月15日公开,专利类别(IPC)H04S1/00。
[9]Herbert Buchner(赫伯特·巴切纳)、Robert Aichner(罗伯特·艾切纳)及Walter Kellermann(沃尔特·凯勒曼),Relation between BlindSystem Identification and Convolutive Blind Source Separation(盲系统识别与卷积盲源分离之间的关系),Hands-free Speech Communicationand Microphone Arrays Workshop(免提语音通信与麦克风阵列工作室),美国新泽西州皮斯卡塔韦(Pi scataway,NJ,USA),2005年。
[10]Herbert Buchner(赫伯特·巴切纳),Robert Aichner(罗伯特·艾切纳),Jochen Stenglein,Heinz Teutsch und Walter Kellermann(沃尔特·凯勒曼),Simultaneous Localization of Multiple Sound Sourcesusing Blind Adaptive MIMO Filtering(使用盲自适应MIMO滤波对复数个声源的同时定位),Proc.IEEE Int.Conf.on Acoustics,Speech,andSignal Processing(ICASSP)(IEEE国际声学、语音和信号处理会议(ICASSP)会议记录),美国费城(Philadelphia,USA),2005年3月。
[11]R.Martin(R.马丁),Noise Power Spectral Density EstimationBased on Optimal Smoothing and Minimum Statistics(基于优化平滑和最小统计的噪声功率频谱密度估计),IEEE Trans.Speech and AudioProcessing(IEEE学报,语音与音频处理),2001年7月,第9卷,第5期,第504-512页。
[12]S.Haykin(S.哈金),Adaptive Filter Theory(自适应滤波器理论),第4版,Prentice-Hall(普伦蒂斯霍尔出版社),2002.
[13]T.Takatani、T.Nishikawa、H.Saruwatari及K.Shikano,High-Fidelity Blind Separation of Acoustic Signals usingSIMO-Model-Based ICA with Information-Geometric Learning(使用利用信息几何学习的基于SIMO模型的ICA对声信号的高保真盲分离),Proc.Int.Workshop on Acoustic Echo and Noise Control(IWAENC)(声学回声与噪声控制国际工作室会议记录),2003年9月,日本京都(Kyoto,Japan)。
[14]K.Matsuoka及S.Nakshima,Minimal Distortion Principle forBlind Source Separation(盲源分离的最小失真原理),Proc.Int.Conf.on Independent Component Analysis and Blind Signal Separation(国际独立分量分析及盲信号分离会议会议记录),2001年12月,美国加州圣地亚哥(San Diego,CA,USA)。
[15]T.J.Klasen(T.J.克拉森)、M.Moonen(M.莫勒)、T.Van denBogaert(T.凡德波加特)及J.Wouters(J.沃特斯),“Preservation ofinteraural time delay for binaural hearing aids through multi-channelWiener filtering based noise reduction”(用于通过基于多信道维纳滤波的噪声减少进行双耳听觉辅助的耳间时间延迟的保留),Proc.IEEE Int.Conf.on Acoustics,Speech,and Signal Processing(ICASSP)(IEEE国际声学、语音及信号处理会议会议记录),美国费城(Philadelphia,USA),2005年3月。
[16]W.Herbordt(W.赫伯特)、F.Nakamura、W.Kellermann(W.凯勒曼):“Multi-channel estimation of power spectral density of noisefor mixtures of non-stationary signals”(用于非固定信号的混合的对噪声的功率频谱密度的多信道估计),IPSJ SIG Technical Reports(IPSJ SIG技术报告),日本京都(Kyoto,Japan),2004年12月,第2004卷,第131期,第211到216页。
[17]W.Herbordt(W.赫伯特)、T.Trini(T.崔尼)、W.Kellermann(W.凯勒曼)、“Robust spatial estimation of the signal-to-interferenceratio for non-stationary mixtures”(用于非固定混合的信噪比的稳健空间估计),Proc.Int.Workshop on Acoustic Echo and Noise Control(国际声学回声与噪声控制工作室会议记录),第247到250页,日本京都(Kyoto,Japan),2003年9月。
[18]Herbert Buchner(赫伯特·巴切纳)、Robert Aichner(罗伯特·艾切纳)、Walter Kellermann(沃尔特·凯勒曼):“TRINICON:A VersatileFramework for Multichannel Blind Signal Processing”(托利尼康:用于多信道盲信号处理的通用框架),Proc.IEEE Int.Conf.On Acoustics,Speech and Signal Processing(ICASSP)(IEEE国际声学、语音及信号处理会议会议记录),第3卷,第889-892页,2004年5月,加拿大蒙特利尔(Montreal,Canada)。
[19]S.Ikeda、N.Murata:“A method of ICA in time-frequency domain”(时间-频率域中的ICA方法),收录于Proc.Int.Symposium on IndependentComponent Analysis and Blind Signal Separation(国际独立分量分析与盲信号分离论坛会议记录)中,第365-371页,法国奥索斯(Aussois,France),1999年1月。

Claims (25)

1.一种信号分离器(100;200;400;700),其用于确定第一麦克风信号(x1)中描述有用信号源(120;320)的音频内容的第一输出信号(a1),并用于确定第二麦克风信号(x2)中描述所述有用信号源的音频内容的第二输出信号(a2),所述信号分离器包括:
一个源分离器(130;330),其用于从位于房间中的两个声传感器接收所述两个麦克风信号,以便从位于所述房间中的信号源接收音频信号,且用于分离至少两个信号源的音频内容,所述源分离器经设计以获得本质上描述第一信号源的音频内容且代表所述第一输出信号的第一部分信号(y1),且以便获得本质上描述第二信号源的音频内容的第二部分信号(y2),
所述源分离器经设计以用使所述第一部分信号相对于所述第一麦克风信号的失真小于最大失真的方式,调整用于从麦克风信号中产生所述第一部分信号的处理规范的参数,且用使所述第二部分信号相对于所述第二麦克风信号的失真小于最大失真的方式,调整用于从麦克风信号中产生所述第二部分信号的处理规范的参数;以及
一个信号移除器(140;370),其用于从所述第二麦克风信号中移除所述第二部分信号,以便获得其中所述第二部分信号减少的所述第二输出信号。
2.根据权利要求1所述的信号分离器(100;200;400;700),其中所述源分离器(130;330)经设计以基于所述至少两个信号源在所述房间中的空间位置、或基于所述至少两个信号源的统计属性,来分离所述至少两个信号源的所述音频内容。
3.根据权利要求1或2所述的信号分离器(100;200;400;700),其中所述源分离器(130;330;500)经设计以确定用于产生所述第一部分信号(y1)的所述处理规范的参数,以便对所述第一部分信号相对于所述第一麦克风信号的失真设置上限,其中所述参数作为所述第一部分信号相对于所述第一麦克风信号(x1)的失真的量度的函数;且
其中,所述源分离器经设计以确定用于产生所述第二部分信号(y2)的所述处理规范的所述参数,以便对所述第二部分信号相对于所述第二麦克风信号的失真设置上限,其中所述参数作为所述第二部分信号相对于所述第二麦克风信号(x2)的失真的量度的函数。
4.根据权利要求1到3中任一权利要求所述的信号分离器(100;200;400;700),其中所述源分离器(130;330)经设计以借助在使用代价函数的同时进行优化来确定用于产生所述第一部分信号(y1)和所述第二部分信号(y2)的所述处理规范的参数,所述代价函数包括所述部分信号之间的统计独立性的量度、所述第一麦克风信号(x1)与所述第一部分信号之间的失真的量度,以及所述第二麦克风信号(x2)与所述第二部分信号(y2)之间的失真的量度,
所述优化经设计以实现以下各项之间的折衷:所述部分信号的统计独立性尽可能大、所述第一麦克风信号与所述第一部分信号之间的失真尽可能小、以及所述第二麦克风信号与所述第二部分信号之间的失真尽可能小,所述折衷是通过所述代价函数来确定的。
5.根据权利要求4所述的信号分离器(100;200;400;700),其中所述第一部分信号与所述第二部分信号之间的所述统计独立性的量度是基于对库尔贝克-莱伯勒距离、最大熵、最小转移信息和/或负熵的确定。
6.根据权利要求4或5所述的信号分离器(100;200;400;700),其中所述代价函数考虑到所述部分信号(y1,y2)的可能性密度函数的非高斯条件、非白性和/或非稳态条件。
7.根据权利要求3到6中任一权利要求所述的信号分离器(100;200;400;700),其中所述第一麦克风信号(x1)与所述第一部分信号(y1)之间的所述失真的量度是所述第一麦克风信号(x1)与所述第一部分信号(y1)的值之间的差异的量值或范数;且
其中所述第二麦克风信号(x2)与所述第二部分信号(y2)之间的所述失真的量度是所述第二麦克风信号(x2)与所述第二部分信号(y2)的值之间的差异的量值或范数。
8.根据权利要求1到7中任一权利要求所述的信号分离器(100;200;400;700),其中所述信号移除器包括:一个延迟构件(136;382),用于延迟所述第二麦克风信号(x2),以便抵消在确定所述第二部分信号(y2)时的处理持续时间,并获得延迟的第二麦克风信号(x2’);以及一个差异形成器(140;370),用于将所述第二输出信号(a2)确定为所述延迟的第二麦克风信号与所述第二部分信号之间的差异。
9.根据权利要求1到8中任一权利要求所述的信号分离器(100;200;400;700),其中所述信号分离器经设计以通过复数个音频频域中的复数个信号部分来代表所述第一麦克风信号(x1)、所述第二麦克风信号(x2)、所述第一部分信号(y1)和/或所述第二部分信号(y2),以便基于一频谱范围中的分析来分离所述至少两个信号源的音频内容,并通过形成复数个音频频域中复数个信号部分的差异来从所述第二麦克风信号中移除所述第二部分信号。
10.根据权利要求1到9中任一权利要求所述的信号分离器(100;200;400;700),其中所述第一信号源形成所述有用信号源。
11.根据权利要求1到10中任一权利要求所述的信号分离器(100;200;400;700),其中所述源分离器经设计以分离两个信号源的信号部分,以便辨别所述两个信号源中的哪一个是有用信号源以及所述两个信号源中的哪一个是干扰信号源,并输出所述有用信号源的音频内容作为所述第一部分信号,输出所述干扰信号源的音频内容作为所述第二部分信号。
12.一种信号分离器(300;400;700),其用于确定第一麦克风信号中描述有用信号源(320)的音频内容的第一输出信号(a1),并用于确定第二麦克风信号(x2)中描述所述有用信号源的音频内容的第二输出信号(a2),所述信号分离器包括:
一个源分离器(330;740),其用于从布置在房间中的两个声传感器接收所述两个麦克风信号,以便从位于所述房间中的信号源接收音频信号,且用于分离至少两个信号源的音频内容,所述源分离器经设计以获得本质上描述一干扰信号源322的音频内容的部分信号(y2);
一个可调滤波器(340,350;746A,746P),其用于使所述部分信号失真以获得第一失真的部分信号(y2’),并用于使所述部分信号失真以获得第二失真的部分信号(y2”);
一个信号移除器(360;370),其用于从所述第一麦克风信号中移除所述第一失真的部分信号,以便获得形成所述第一输出信号(a1)的第一校正的麦克风信号(e1),且用于从所述第二麦克风信号中移除所述第二失真的部分信号,以便获得形成所述第二输出信号(a1)的第二校正的麦克风信号(e2);以及
一个参数调整器,其用以调整所述可调滤波器的滤波器参数,以便减少所述第一输出信号中的所述干扰信号源的音频内容,以及用以调整所述可调滤波器的滤波器参数,以便减少所述第二输出信号中的所述干扰信号源的音频内容。
13.根据权利要求12所述的信号分离器(300;400;700),其中所述源分离器(130;330)经设计以基于所述至少两个信号源在所述房间中的空间位置或基于所述至少两个信号源的统计属性,来分离所述至少两个信号源的所述音频内容。
14.根据权利要求12或13所述的信号分离器(300;400;700),其中所述源分离器(130;330)经设计以借助在使用代价函数的同时进行优化,来确定用于产生所述第一部分信号(y1)和所述第二部分信号(y2)的所述处理规范的参数,所述代价函数包括所述部分信号之间的统计独立性的量度,且
所述源分离器经设计以与所述优化之前的状态相比借助优化来增加所述部分信号的统计独立性。
15.根据权利要求14所述的信号分离器(300;400;700),其中所述第一部分信号与所述第二部分信号之间的所述统计独立性的量度是基于对库尔贝克-莱伯勒距离、最大熵、最小转移信息和/或负熵的确定。
16.根据权利要求12或13所述的信号分离器(300;400;700),其中所述代价函数考虑到所述部分信号(y1,y2)的可能性密度函数的非高斯条件、非白性和/或非稳态条件。
17.根据权利要求12到16中任一权利要求所述的信号分离器(300;400;700),其中所述参数调整器经设计以确定所述第一校正的麦克风信号中的功率和所述第二校正的麦克风信号中的功率,并改变所述可调滤波器(340,350;746A,746P)的滤波器参数,使得所述第一校正的麦克风信号(e1)中的功率减小,且改变所述可调滤波器的滤波器参数,使得所述第二校正的麦克风信号(e2)中的功率减小。
18.根据权利要求12到17中任一权利要求所述的信号分离器(300;400;700),其中所述参数调整器经设计以用使所述第一校正的麦克风信号(e1)中的功率相对于优化之前的状态减小的方式,借助优化来调整所述可调滤波器(340,350;746A,746P)的滤波器参数,并用使所述第二校正的麦克风信号(e2)中的功率相对于优化之前的状态减小的方式,来调整所述可调滤波器的滤波器参数。
19.根据权利要求12到18中任一权利要求所述的信号分离器(300;400;700),其中所述参数调整器包括一个有用信号检测器(390),其经设计以辨别何时在所述第一麦克风信号(x1)或所述第二麦克风信号(x2)中存在具有至少最小有用信号强度的来自所述有用信号源(320)的有用信号,并且仅在不存在包括至少所述最小有用信号强度的有用信号时才改变或优化所述可调滤波器(340,350;746A,746P)的滤波器参数。
20.根据权利要求12到19中任一权利要求所述的信号分离器(300;400;700),所述信号分离器经设计以通过复数个音频频域中的复数个信号部分来代表所述第一麦克风信号(x1)、所述第二麦克风信号(x2)、所述第一部分信号(y1)和/或所述第二部分信号(y2),并基于一频谱范围中的分析来分离所述至少两个信号源(320;322)的音频内容,并且所述可调滤波器(340,350;746A,746P)经设计以分别使所述部分信号的多种频谱分量失真;且
所述信号移除器(360;370)经设计以通过分别处理多种频谱分量来减少所述第一校正的麦克风信号(e1)中的所述干扰信号源的音频内容,并通过分别处理多种频谱分量来减少所述第二校正的麦克风信号(e2)中的所述干扰信号源的音频内容。
21.根据权利要求12到20中任一权利要求所述的信号分离器(300;400;700),其中所述第一校正的麦克风信号(e1)代表所述信号移除器的输出信号。
22.根据权利要求12到21中任一权利要求所述的信号分离器(300;400;700),其中所述信号移除器包括一个差异形成器,其经设计以从所述第一麦克风信号(x1)或从所述第一麦克风信号的全通滤波版本(x1’)中减去所述第一失真的部分信号(y2’),由所述差异形成器形成的差异信号代表所述第一校正的麦克风信号(e1),且从所述第二麦克风信号(x2)或从所述第二麦克风信号的全通滤波版本(x2’)中减去所述第二失真的部分信号(y2”),由所述差异形成器形成的差异信号代表所述第二校正的麦克风信号(e2)。
23.一种确定第一麦克风信号(x1)中描述有用信号源的音频内容的第一输出信号(a1)并确定第二麦克风信号(x2)中描述所述有用信号源的音频内容的第二输出信号(a2)的方法,其包括:
从位于房间中的两个声传感器接收(810)所述两个麦克风信号,以便从位于所述房间中的信号源接收音频信号;
分离(810)至少两个信号源的音频内容,以便获得本质上描述所述第一信号源的音频内容、且代表所述第一输出信号的第一部分信号(y1),并获得本质上描述第二信号源的音频内容的第二部分信号(y2);
用使所述第一部分信号相对于所述第一麦克风信号的失真小于最大失真的方式,调整(820)用于从所述麦克风信号中产生所述第一部分信号的处理规范的参数;
用使所述第二部分信号相对于所述第二麦克风信号的失真小于最大失真的方式,调整(830)用于从所述麦克风信号中产生所述第二部分信号的处理规范的参数;以及
从所述第二麦克风信号中移除(840)所述第二部分信号,以便获得其中所述第二部分信号减少的所述第二输出信号。
24.一种确定第一麦克风信号(x1)中描述有用信号源的音频内容的第一输出信号(a1)并确定第二麦克风信号(x2)中描述所述有用信号源的音频内容的第二输出信号(a2)的方法,其包括:
从位于房间中的两个声传感器接收(910)描述信号的所述两个麦克风信号,以便从位于所述房间中的信号源接收音频信号,
分离至少两个信号源的音频内容,以便获得本质上描述干扰信号源的音频内容的部分信号(y2),
在可调滤波器中使所述部分信号失真(930),以获得第一失真的部分信号(y2’);
在可调滤波器中使所述部分信号失真(940),以获得第二失真的部分信号(y2”);
从所述第一麦克风信号中移除(940)所述第一失真的部分信号,以便获得形成所述第一输出信号的第一校正的麦克风信号;
从所述第二麦克风信号中移除(950)所述第二失真的部分信号,以获得形成所述第二输出信号的第二校正的麦克风信号;
调整(960)所述可调滤波器的滤波器参数,以便减少所述第一校正的麦克风信号中的所述干扰信号源的音频内容;以及
调整(970)所述可调滤波器的滤波器参数,以便减少所述第二校正的麦克风信号中的所述干扰信号源的音频内容。
25.一种计算机程序,当所述计算机程序在计算机上运行时用于执行根据权利要求23或24所述的方法。
CN200780022297XA 2006-06-14 2007-06-12 信号分离器、基于麦克风信号确定输出信号的方法 Expired - Fee Related CN101484938B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102006027673A DE102006027673A1 (de) 2006-06-14 2006-06-14 Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm
DE102006027673.6 2006-06-14
PCT/EP2007/005182 WO2007144147A1 (en) 2006-06-14 2007-06-12 Signal separator, method for determining output signals on the basis of microphone signals, and computer program

Publications (2)

Publication Number Publication Date
CN101484938A true CN101484938A (zh) 2009-07-15
CN101484938B CN101484938B (zh) 2012-02-15

Family

ID=38353840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780022297XA Expired - Fee Related CN101484938B (zh) 2006-06-14 2007-06-12 信号分离器、基于麦克风信号确定输出信号的方法

Country Status (9)

Country Link
US (1) US8090111B2 (zh)
EP (1) EP2027581B1 (zh)
JP (1) JP2009540378A (zh)
CN (1) CN101484938B (zh)
AT (1) ATE547788T1 (zh)
AU (1) AU2007260233B2 (zh)
DE (1) DE102006027673A1 (zh)
DK (1) DK2027581T3 (zh)
WO (1) WO2007144147A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102687535A (zh) * 2009-11-12 2012-09-19 无线电技术研究学院有限公司 用于混合利用多个麦克风录音的麦克风信号的方法
CN103236264A (zh) * 2013-05-03 2013-08-07 湖北文理学院 一种用于声源分离的编解码方法
CN103455269A (zh) * 2012-05-30 2013-12-18 纬创资通股份有限公司 电子装置和输入指令方法
CN105723452A (zh) * 2013-10-18 2016-06-29 弗劳恩霍夫应用研究促进协会 音频信号的频谱的频谱系数的编码
CN107369458A (zh) * 2017-07-07 2017-11-21 西南交通大学 一种基于熵吸引的最大熵子带回声消除方法
CN107527622A (zh) * 2017-07-07 2017-12-29 西南交通大学 一种基于最大熵的变步长符号子带回声消除方法
CN107578782A (zh) * 2017-07-07 2018-01-12 西南交通大学 一种变核宽度的最大熵子带回声消除方法
CN107818793A (zh) * 2017-11-07 2018-03-20 北京云知声信息技术有限公司 一种可减少无用语音识别的语音采集处理方法及装置
CN107871510A (zh) * 2017-07-07 2018-04-03 西南交通大学 一种零吸引变核宽度的最大熵回声消除方法
CN107924685A (zh) * 2015-12-21 2018-04-17 华为技术有限公司 信号处理装置和方法
CN108198569A (zh) * 2017-12-28 2018-06-22 北京搜狗科技发展有限公司 一种音频处理方法、装置、设备及可读存储介质
CN108597531A (zh) * 2018-03-28 2018-09-28 南京大学 一种通过多声源活动检测来改进双通道盲信号分离的方法
CN113348508A (zh) * 2019-01-23 2021-09-03 索尼集团公司 电子设备、方法和计算机程序

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8892432B2 (en) * 2007-10-19 2014-11-18 Nec Corporation Signal processing system, apparatus and method used on the system, and program thereof
US8812309B2 (en) 2008-03-18 2014-08-19 Qualcomm Incorporated Methods and apparatus for suppressing ambient noise using multiple audio signals
JP5605575B2 (ja) * 2009-02-13 2014-10-15 日本電気株式会社 多チャンネル音響信号処理方法、そのシステム及びプログラム
WO2010092913A1 (ja) * 2009-02-13 2010-08-19 日本電気株式会社 多チャンネル音響信号処理方法、そのシステム及びプログラム
EP2234415B1 (en) * 2009-03-24 2011-10-12 Siemens Medical Instruments Pte. Ltd. Method and acoustic signal processing system for binaural noise reduction
US8787591B2 (en) * 2009-09-11 2014-07-22 Texas Instruments Incorporated Method and system for interference suppression using blind source separation
JP5939161B2 (ja) * 2011-01-13 2016-06-22 日本電気株式会社 音声処理装置及びその制御方法とその制御プログラム、情報処理システム
KR101737270B1 (ko) 2016-04-25 2017-05-19 울산대학교 산학협력단 능동 방향성 이득 조정 가능한 양이 보청기 시스템
CN108053834B (zh) * 2017-12-05 2020-02-21 北京声智科技有限公司 音频数据处理方法、装置、终端及系统
CN110310683B (zh) * 2019-07-01 2021-07-06 科大讯飞股份有限公司 录音处理方法及装置
CN114586098A (zh) * 2019-10-04 2022-06-03 弗劳恩霍夫应用研究促进协会 源分离

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL101556A (en) * 1992-04-10 1996-08-04 Univ Ramot Multi-channel signal separation using cross-polyspectra
US6130949A (en) * 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
US6167417A (en) 1998-04-08 2000-12-26 Sarnoff Corporation Convolutive blind source separation using a multiple decorrelation method
JP3831220B2 (ja) * 2001-09-25 2006-10-11 日本電信電話株式会社 雑音抑圧方法及びその装置、雑音抑圧プログラム並びにそのプログラム記録媒体
FR2842064B1 (fr) 2002-07-02 2004-12-03 Thales Sa Systeme de spatialisation de sources sonores a performances ameliorees
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
JP2006100869A (ja) * 2004-09-28 2006-04-13 Sony Corp 音声信号処理装置および音声信号処理方法
US8873768B2 (en) * 2004-12-23 2014-10-28 Motorola Mobility Llc Method and apparatus for audio signal enhancement
JP2007279517A (ja) * 2006-04-10 2007-10-25 Kobe Steel Ltd 音源分離装置、音源分離装置用のプログラム及び音源分離方法
KR101178801B1 (ko) * 2008-12-09 2012-08-31 한국전자통신연구원 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9049531B2 (en) 2009-11-12 2015-06-02 Institut Fur Rundfunktechnik Gmbh Method for dubbing microphone signals of a sound recording having a plurality of microphones
CN102687535B (zh) * 2009-11-12 2015-09-23 无线电技术研究学院有限公司 用于混合利用多个麦克风录音的麦克风信号的方法
CN102687535A (zh) * 2009-11-12 2012-09-19 无线电技术研究学院有限公司 用于混合利用多个麦克风录音的麦克风信号的方法
CN103455269A (zh) * 2012-05-30 2013-12-18 纬创资通股份有限公司 电子装置和输入指令方法
CN103236264A (zh) * 2013-05-03 2013-08-07 湖北文理学院 一种用于声源分离的编解码方法
CN103236264B (zh) * 2013-05-03 2015-07-29 湖北文理学院 一种用于声源分离的编解码方法
CN105723452A (zh) * 2013-10-18 2016-06-29 弗劳恩霍夫应用研究促进协会 音频信号的频谱的频谱系数的编码
US10847166B2 (en) 2013-10-18 2020-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Coding of spectral coefficients of a spectrum of an audio signal
CN105723452B (zh) * 2013-10-18 2020-01-31 弗劳恩霍夫应用研究促进协会 音频信号的频谱的频谱系数的解码方法及解码器
CN107924685A (zh) * 2015-12-21 2018-04-17 华为技术有限公司 信号处理装置和方法
CN107924685B (zh) * 2015-12-21 2021-06-29 华为技术有限公司 信号处理装置和方法
US10679642B2 (en) 2015-12-21 2020-06-09 Huawei Technologies Co., Ltd. Signal processing apparatus and method
CN107527622B (zh) * 2017-07-07 2019-09-24 西南交通大学 一种基于最大熵的变步长符号子带回声消除方法
CN107871510A (zh) * 2017-07-07 2018-04-03 西南交通大学 一种零吸引变核宽度的最大熵回声消除方法
CN107578782B (zh) * 2017-07-07 2019-09-24 西南交通大学 一种变核宽度的最大熵子带回声消除方法
CN107578782A (zh) * 2017-07-07 2018-01-12 西南交通大学 一种变核宽度的最大熵子带回声消除方法
CN107527622A (zh) * 2017-07-07 2017-12-29 西南交通大学 一种基于最大熵的变步长符号子带回声消除方法
CN107369458A (zh) * 2017-07-07 2017-11-21 西南交通大学 一种基于熵吸引的最大熵子带回声消除方法
CN107818793A (zh) * 2017-11-07 2018-03-20 北京云知声信息技术有限公司 一种可减少无用语音识别的语音采集处理方法及装置
CN108198569A (zh) * 2017-12-28 2018-06-22 北京搜狗科技发展有限公司 一种音频处理方法、装置、设备及可读存储介质
CN108597531A (zh) * 2018-03-28 2018-09-28 南京大学 一种通过多声源活动检测来改进双通道盲信号分离的方法
CN113348508A (zh) * 2019-01-23 2021-09-03 索尼集团公司 电子设备、方法和计算机程序

Also Published As

Publication number Publication date
ATE547788T1 (de) 2012-03-15
AU2007260233A1 (en) 2007-12-21
DE102006027673A1 (de) 2007-12-20
CN101484938B (zh) 2012-02-15
EP2027581A1 (en) 2009-02-25
DK2027581T3 (da) 2012-06-18
US8090111B2 (en) 2012-01-03
AU2007260233B2 (en) 2011-09-15
US20100232621A1 (en) 2010-09-16
WO2007144147A1 (en) 2007-12-21
EP2027581B1 (en) 2012-02-29
JP2009540378A (ja) 2009-11-19

Similar Documents

Publication Publication Date Title
CN101484938B (zh) 信号分离器、基于麦克风信号确定输出信号的方法
EP1848243B1 (en) Multi-channel echo compensation system and method
US9343056B1 (en) Wind noise detection and suppression
EP1406397B1 (en) MULTI−CHANNEL ECHO CANCEL METHOD, MULTI−CHANNEL SOUND TRANSFER METHOD, STEREO ECHO CANCELLER, STEREO SOUND TRANSFER APPARATUS, AND TRANSFER FUNCTION CALCULATION APPARATUS
US8842861B2 (en) Method of signal processing in a hearing aid system and a hearing aid system
US9343073B1 (en) Robust noise suppression system in adverse echo conditions
JP5231139B2 (ja) 音源抽出装置
US8761410B1 (en) Systems and methods for multi-channel dereverberation
AU2011200494A1 (en) A speech intelligibility predictor and applications thereof
WO2003028006A2 (en) Selective sound enhancement
CN101828335A (zh) 稳健双麦克风噪声抑制系统
US10339951B2 (en) Audio signal processing in a vehicle
EP4044181A1 (en) Deep learning speech extraction and noise reduction method fusing signals of bone vibration sensor and microphone
EP2986026B2 (en) Hearing assistance device with beamformer optimized using a priori spatial information
JP2004349806A (ja) 多チャネル音響エコー消去方法、その装置、そのプログラム及びその記録媒体
US11647344B2 (en) Hearing device with end-to-end neural network
Uhle et al. Determined source separation for microphone recordings using IIR filters
KR100455968B1 (ko) 상관된신호들을위한전송시스템
Cornelis et al. Comparison of frequency domain noise reduction strategies based on multichannel wiener filtering and spatial prediction
CN112562711A (zh) 多路音源信号分类系统及方法
Azarpour et al. Distortionless-response vs. matched-filter-array processing for adaptive binaural noise reduction
Reiss et al. Determined source separation for microphone recordings using IIR filters
CN117479063A (zh) 基于多领麦自适应降噪会议系统
Ruiz et al. Centralized Cascade Multi-Channel Noise Reduction and Acoustic Feedback Cancellation in a Wireless Acoustic Sensor And Actuator Network
CN117376753A (zh) 多领麦会议系统麦克风自适应选择方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: Erlangen

Co-patentee after: Friedrich Alexander Universitaet Erlangen

Patentee after: Xiwantuo Co., Ltd.

Address before: Erlangen

Co-patentee before: Friedrich Alexander Universitaet Erlangen

Patentee before: Siemens Audiologische Technik GmbH

CP01 Change in the name or title of a patent holder
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120215

Termination date: 20200612

CF01 Termination of patent right due to non-payment of annual fee