CN1947171A - 自适应波束形成器、旁瓣抑制器、自动语音通信设备 - Google Patents

自适应波束形成器、旁瓣抑制器、自动语音通信设备 Download PDF

Info

Publication number
CN1947171A
CN1947171A CNA200580013338XA CN200580013338A CN1947171A CN 1947171 A CN1947171 A CN 1947171A CN A200580013338X A CNA200580013338X A CN A200580013338XA CN 200580013338 A CN200580013338 A CN 200580013338A CN 1947171 A CN1947171 A CN 1947171A
Authority
CN
China
Prior art keywords
noise
sound
signal
wave filter
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200580013338XA
Other languages
English (en)
Other versions
CN1947171B (zh
Inventor
B·E·萨罗克哈
C·P·詹塞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
MediaTek Inc
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1947171A publication Critical patent/CN1947171A/zh
Application granted granted Critical
Publication of CN1947171B publication Critical patent/CN1947171B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • G10K11/26Sound-focusing or directing, e.g. scanning
    • G10K11/34Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
    • G10K11/341Circuits therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • G10K11/26Sound-focusing or directing, e.g. scanning
    • G10K11/34Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

自适应波束形成器单元(191)包括:滤波求和波束形成器(107),被设置为处理来自各自麦克风(101,103)阵列的输入音频信号(u1,u2),并且,还被设置为通过对输入音频信号的第一个(u1)使用第一自适应滤波器(f1(-t))滤波,对输入音频信号的第二个(u2)使用第二自适应滤波器(f2(-t))滤波,生成占主导地位的对应于来自期望音频源(160)的声音的第一音频信号(z)作为输出,分别使用第一步长(a1)和第二步长(x2)自适应调节第一滤波器(f1(-t))和第二滤波器(f2(-t))的系数;噪声测度导出装置(111),被设置为从输入音频信号(u1,u2)导出第一噪声测度(x1)和第二噪声测度(x2);和更新单元(192),被设置为利用等式确定第一和第二步长(a1,(x2),该等式对于第一步长(a1),其分母中包含第一噪声测度(x1),对于第二步长(a2),其分母中包含第二噪声测度(x2)。这使得该波束形成器对于相关的音频干扰的影响具有相对的鲁棒性。该波束形成器也可以结合到一个旁瓣抑制拓扑中,生成清除了更多噪声的期望声音的估计,它可以被用于相关的、更加先进的自适应滤波器(f1(-t),f2(-t))的更新。这样的波束形成器应用在自动语音通信系统中通常是有益的。

Description

自适应波束形成器、旁瓣抑制器、自动语音通信设备
技术领域
本发明涉及一种自适应波束形成器单元和包括该自适应波束形成器的旁瓣抑制器。
本发明还涉及包括该自适应波束形成器或者旁瓣抑制器的自动语音通信系统、便携的语音通信设备、声音控制单元和用以跟踪音频产生物体的跟踪设备。
本发明还涉及一种包括该声音控制单元的消费装置。
本发明还涉及一种自适应波束形成或者旁瓣抑制的方法和包含该方法的代码的计算机程序产品。
背景技术
如在第一段中所述的旁瓣抑制器和包含的波束形成器的一个实施例,可以从出版物“C.Fancourt and L.Parra:The generalized sidelobe decorrelator.Proceedings of the IEEE Workshop on applications of signal processing to audio andacoustics 2001.”中得知。设计波束形成器和旁瓣抑制器用来锁定一个期望的声音源,即,产生占主导地位的对应于来自期望源的声音的输出音频信号,同时尽可能多地避免来自其它源的声音(称为噪声)。旁瓣抑制器包括自适应波束形成器,它被设置为处理来自麦克风阵列的信号,该旁瓣抑制器的波束形成器滤波器可以被最优化,使得这些滤波器表示期望的音频从期望的音频源到每一个麦克风的路径的反向(即期望的音频通过例如在不同的表面反射出来最终从不同的方向进入到特定的麦克风而被改变)。通过合并滤波后的信号,波束形成器有效地实现一个对方向敏感的模式,该模式在期望声音源的方向上具有一个高灵敏度的波瓣。例如对于纯粹延时的滤波器,波束形成器实现一个具有一个主瓣和多个旁瓣的sin(x)/x模式。然而,该灵敏性模式带来的问题在于来自其它源的声音也可以被采集到。例如,噪声源可能位于其中一个旁瓣的方向上。为了解决这个问题,旁瓣抑制器还包括自适应噪声消除步骤。通过麦克风测量,通过从噪声参考信号中阻止期望的声音成分来计算噪声参考信号,即,例如确定旁瓣中的噪声。通过自适应滤波器的方法,从这些噪声测量中估计有多少噪声源从该波瓣模式中朝着期望的声音泄漏。最后,从由主瓣采集的信号中减去该噪声,剩下的作为最后的音频信号主要仅仅为期望的声音。如果方向模式是对应于该最优的旁瓣抑制器计算出来的,那么这个模式包括一个朝着期望的声音源的主瓣,和在噪声源方向上的零值。
使用现有技术的旁瓣抑制器和波束形成器存在着许多问题,导致这一事实:实际上它们经常不像它们理想应该的那样工作。特别地,优良的旁瓣抑制器或者波束形成器,对于在期望的声音源和/或噪声源的方向是变化的环境下,是特别难以设计的,因此,对于这种情况,在一个相对短的时间间隔,滤波器可能必须重新调整。然而这种情况是非常普遍的,例如在试图跟踪在房间内到处移动的说话人的电话会议系统中,或者在对着整合在移动电话中的旁瓣抑制器说话的人连同移动电话在变化的环境中到处移动的系统中,例如遇到的自动车载电话套件。
没有预先出版的欧洲申请03104334.2描述了一种波束形成器/旁瓣抑制器滤波器优化技术来消除这两种问题。第一,大量的不相关噪声(理论上对应于无限源)的存在,例如在车载应用中的风。该申请解决的第二问题是阻止引入相当多的“语音泄漏”到噪声的测量中,这发生在如果例如波束形成器主瓣从它的最优的方向朝着期望的声音源和干扰声音源之间的方向移动时。由于干扰声音源在每一个麦克风中引入相关的信号成分(例如相互之间纯粹的延时成分),因此以下也将其称作相关噪声。
03104334.2中单独为了处理不相关噪声和语音泄漏而设计的波束形成器傍瓣抑制器,不能够在相关噪声即干扰声音源存在时准确地工作,该干扰声音源例如风扇或者从旁经过的摩托车。
由于在来自期望声音源的声音(例如接近终端的说话者)和形成相关噪声源的干扰声音之间不必然存在物理差异,因此,该系统可能会偏离到噪声源上,而不能锁定到说话者或者保持锁定说话者,例如,如果在一个时间段内噪声源具有比期望的声音源更大的幅度时就会这样,而该现象发生在例如当靠近终端的说话人的说话声音比较轻且有声音较大的卡车从旁经过时。特别地,使用经过许多处理步骤后得到的纯净信号来自适应调节其滤波器的旁瓣抑制器,尽管能够得到一个最优滤波器的优良的估计,但是它容易脱离其最优状态,然后难以使系统回到最优状态,特别是在大幅度相关噪声存在时。
发明内容
本发明的首要目标在于提供一种自适应波束形成器单元,该单元对于相关噪声的影响,即,一个非期望的第二声音源,具有一定的鲁棒性。
该首要目标的实现在于按照本发明的一种自适应波束形成器单元包括:
-滤波求和波束形成器,被设置为处理来自各自的麦克风阵列的输入音频信号,并且,还被设置为通过对输入音频信号的第一个使用第一自适应滤波器滤波,对输入音频信号的第二个使用第二自适应滤波器,生成占主导地位的对应于来自期望音频源的声音的第一音频信号作为输出,分别使用第一步长和第二步长自适应调节第一滤波器和第二滤波器的系数;
-噪声测度导出装置,被设置为从输入音频信号导出第一噪声测度和第二噪声测度;
-更新单元,被设置为利用等式确定第一和第二步长,该等式对于第一步长,其分母中包含第一噪声测度,对于第二步长,其分母中包含第二噪声测度。
该波束形成器和噪声测度可通过03104334.2获得,而本波束形成器使用新的更新策略,用以增加抗来自干扰声音源的相关噪声的鲁棒性。
噪声导出装置对麦克风信号优选地应用自适应滤波,例如,阻止矩阵(ablocking matrix)可以用来消除对期望音频(例如,语音)的估计,由此生成好的噪声测度,该期望音频估计是在特定的滤波器路径采集到的,也就是通过特定的麦克风从总的采集到的信号中选出来的。
通过为每一个滤波器的更新单元部分提供它自己的噪声测度,并导出瞬间的与噪声量成反比的更新步长,使得该滤波器对于噪声特别不敏感。如果存在占主导地位的期望音频,则最好设置较大的步长,使得滤波器可以跟踪移动的期望源。如果存在大量的噪声,则分母变大,产生较小的更新步长,所以滤波器有效地冻结,几乎不对有害的噪声的影响产生反应。特别地,如果滤波器对于期望源、空间特性、麦克风位置等被最优化,则滤波器使用小的更新步长就可以在很大程度上保持在最优的设置。
在自适应波束形成器单元的优选实施例中,噪声测度导出装置被设置为,通过从第一麦克风采集到的期望音频源中减去期望的声音测度,从而从第一输入音频信号中导出第一噪声测度;通过从第二麦克风采集到的期望音频源中减去第二期望的声音测度,从而从第二输入音频信号中导出第二噪声测度。
理想地,由对应于特定的波束形成器滤波器的麦克风实际采集到的噪声被应用在自适应步长等式中。如果存在例如两个噪声源——风扇和摩托车——则每个麦克风都将采集到一个总的噪声信号,它们是来自两个源的声音的组合,由于这里麦克风信号是相关的,因此由每一个噪声源引入的子信号的相关可以确定。由于滤波器更新等式一般包含期望音频测度和整个噪声干扰测度的内积,后者可以使滤波器远离它们的最优设置,特别是当它比较大时。因此,应该完全正确地计算出该总噪声。
该自适应波束形成器单元实施例的一个特殊的实现形式使用等式来获得步长,该步长等于:
α m [ f , t ] = βP zz [ f , t ] / ( P zz [ f , t ] + γP x m x m [ f , t ] ) ,
其中m是索引,指示使用得到的步长αm来自适应调节哪个滤波器(f1(-t),f2(-t)),f表示频率,t表示时刻,z表示第一音频信号,xm分别是第一和第二噪声测度,在本实施例中,即由对应的第m个麦克风采集到的噪声测度,该噪声测度是由从麦克风输入音频信号um中减去期望的音频得到的,P..表示用来得到信号(.表示同它的下标指示的)功率的等式,β和γ是预先确定的常数。本领域技术人员可以认识到,有一些功率测度可供选择,典型的一个是,例如,在一段时间内信号平方的积分。
但是,在另一个实施例中,第一噪声测度和第二噪声测度由输入音频信号的各自的线性组合来确定。
相关噪声的有害的行为可以通过,例如,使步长等式的分母依赖于所有噪声源的和来克服。或者,期望音频(一般是语音)的线性组合一被消除的麦克风信号,可以从自适应噪声估计器得到,该估计器具有作为输出的每一个噪声源单独的测度(一个是风扇噪声的测度,另一个是摩托车噪声的测度,等)。然后,这些噪声测度可以用作分母,或者加到已经出现在更新步长等式的分母上的噪声测度上。在许多情况下,这会比当如上所述使用在特定滤波器信道中的整个噪声的测度时具有某种程度的更小的鲁棒性更新行为。
自适应波束形成器也可以包含在旁瓣抑制器拓扑中,该拓扑进一步包括:
-自适应噪声估计器,被设置为利用第二组自适应滤波器,对从输入音频信号导出的第一和第二噪声测度进行滤波,产生估计的噪声信号;
-减法器,被设置为从第一音频信号中减去估计的噪声信号,得到无噪声的第二音频信号;
-可选的更新单元,被设置为利用等式确定第一和第二步长,该等式包括第二音频信号的幅度测度,并且,该等式对于第一步长,其分母中包含第一噪声测度,对于第二步长,其分母中包含第二噪声测度。
旁瓣抑制器允许产生更加纯净的期望音频信号—第二音频信号—和对噪声的更加纯净的测度(即,信号更大程度上仅仅对应于实际采集到的噪声,和尽可能少的仍然保留其中的期望音频的残余)。该拓扑产生比使用上面的波束形成器单元更好的优化结果,但是,一般来说不仅具有优化的波束形成器滤波器,而且还有语音阻止矩阵和噪声估计器的滤波器的旁瓣抑制器,对于噪声更加敏感,使得该新的更新策略非常重要。本领域技术人员可以由非预先公布的欧洲申请号为03104334.2的专利申请中得知,如何优化阻止矩阵和与波束形成器的滤波器相关的噪声估计器滤波器。
旁瓣抑制器的实例性实施例通过使用等式得到步长,可基于第二音频信号来实现更新,该步长等于:
α m [ f , t ] = βP rr [ f , t ] / ( P rr [ f , t ] + γP v m v m [ f , t ] ) ,
其中m是索引,指示使用得到的步长大小αm来自适应调节哪个滤波器(f1(-t),f2(-t)),f表示频率,t表示时刻,r是第二音频信号,Vm是由对应的第m个麦克风采集到的噪声测度,无噪的第二音频信号(r)作为期望音频的测度被减去了,P表示用来得到信号功率的等式,β和γ是预先确定的常数。
这又是一个优化等式,该优化等式对于每一个单独的滤波信道使用噪声测度Vm(对于这个旁瓣抑制器更新拓扑,噪声测度一对一地对应于波束形成器单元更新的测度Xm)。
自适应波束形成器或者旁瓣抑制器的实施例包括一个缩放因子确定单元,被设置为确定单独的缩放因子来缩放波束形成器的第一滤波器和第二滤波器的步长,缩放因子基于语音泄漏和/或不相关的噪声的量来确定。
将对于相关噪声具有鲁棒性的本更新方案与对于其他非理想类型具有鲁棒性的方案结合起来是有益的,其中,对于其他非理想类型的鲁棒的方案例如在03104334.2所披露的方案。如果波束形成器/旁瓣抑制器是接近最优的,则本自适应步长确定方案可确定正确的步长。但是,如果滤波器对于最优有稍许偏离(或者至少趋向于偏离最优),则目前的方案不会工作得很好,但是03104334.2中步长的确定方法可以用来使滤波器回到它们最优的设置。
将自适应波束形成器或者旁瓣抑制器设置为从基于音频的说话者跟踪器和/或基于视频的说话者跟踪器接收位置数据也是有益的。其中,基于音频的说话者跟踪器被配置为基于说话者的声音确定说话者在空间中的位置,基于视频的说话者跟踪器被配置为基于拍摄的图像确定说话者在空间中的位置。其中,第一滤波器和第二滤波器的系数基于位置来确定,该位置由基于音频的说话者跟踪器和/或基于视频的说话者跟踪器来确定。
如果存在许多大功率的声音源,即使结合上面两种更新方案,使滤波器收敛于它们的最优点也可能是困难。可以使用别的设备来帮助该系统,例如,基于视频的说话者跟踪器可以在拍摄的图像中使用图像处理软件来检测对应于说话者的脸谱,基于此,滤波器的系数重新初始化,使得主瓣至少稍许地更加指向说话者的脸谱的空间位置。
自适应波束形成器和旁瓣抑制器一般被应用在各种类型的(例如,一般是自动的)语音通信系统中,例如包含安排在一个桌子上的小的群体实现远程电信会议,或者汽车套件(分布在汽车里面的麦克风)。波束形成器单元或者旁瓣抑制器也可以包含在一个便携式的语音通信设备中,例如移动电话、个人数字助手、口述装置或者其他具有类似通信能力的设备。该自适应波束形成器/旁瓣抑制器优点还在于声音控制装置,例如,电视机的遥控器,或者个人电脑上的语音转文本系统,为了提高这些装置的语音识别能力,对于这些设备,噪声是一个重要的问题。其他设备可以是各种消费设备、电梯或者智能房间的组成部分、安全系统(例如依赖于声音识别的系统)、消费交互终端等。
该系统也用于跟踪设备中,一般用于安全应用,或者为了某些目的而监控用户的行为的应用。例如,一个例子可以是基于夜贼的特征噪音而对其进行放大的照相机。
自适应波束形成的相应的方法包括:
a)使用第一自适应滤波器(f1(-t))对来自第一麦克风的第一输入音频信号进行滤波,使用第二自适应滤波器(f2(-t))对来自第二麦克风的第二输入音频信号进行滤波,对滤波后的输入音频信号求和,产生占主导地位的对应于来自期望音频源的的声音的第一音频信号;
b)从输入音频信号导出第一噪声测度和第二噪声测度;
c)使用第一步长(α1)和第二步长(α2)分别自适应调节第一滤波器(f1(-t))和第二滤波器(f2(-t)的系数,该步长来自一个等式,该等式对于第一步长(α1),其分母中包括第一噪声测度(x1),对于第二步长(α2),其分母中包括第二噪声测度(x2),这些也被揭示。
附图说明
根据本发明,参照下文描述的执行方式、实施例以及附图,波束形成器和旁瓣抑制器的这些和其他的方面将是明显的,该附图只不过作为不受限制的特殊的图来举例说明更加一般的概念。
附图中:
图1示意性地示出了基于第一音频信号,对应比例等式的旁瓣抑制器的实施例;
图2示意性地示出了基于第二音频信号,对应比例等式的旁瓣抑制器的实施例;
图3示意性地示出了一种视频会议的应用。
具体实施方式
在图1中,来自期望声音源160和可能同样来自一个或者多个非期望的噪声源161(噪声不应该理解为只有随机信号例如电子热噪声,而是任何非期望/干扰的音频信号)的声音,其传播到至少有两个麦克风101、103的阵列。由这些麦克风输出的信号u1,u2被第一组各自的波束形成器107的滤波器f1(-t),f2(-t)滤波,该滤波器的系数—一般是每一个频率带一个系数—能够随着空间变化的条件自适应调整,例如移动的期望声音源160。各自的滤波器输出的结果信号被加法器110相加,生成第一音频信号z。理想地,滤波器表示朝向特定麦克风的期望信号的逆路径,因此用第一滤波器f1(-t)对第一麦克风信号u1滤波,理想准确地获得期望声音。因此,如果滤波器能够很好地自适应,则第一音频信号z就是对期望信号的良好的近似。但是,由于麦克风也采集噪声,第一音频信号z不可避免地也包含噪声。麦克风信号u1,u2也用来产生噪声测度x1,x2。为了获得仅仅代表噪声的信号(数学上称正交于期望音频信号),通过各自的减法器115,121从麦克风信号u1,u2减去期望信号。所说的阻止矩阵111对第一音频信号z再应用声音传播路径滤波器f1,f2,来获得由麦克风采集的期望声音的估计。因此波束形成器107和阻止矩阵的滤波器除了时间反转以外完全相同。自适应噪声估计器150基于被看作从每一个麦克风获得的噪声测度x1,x2,...,来估计有多少噪声被波束形成器的指向期望源的主瓣或者波瓣模式的指向期望声音的另一部分(例如该模式的旁瓣)采集,从而估计第一音频信号z中的噪声的贡献度。另外噪声估计器150必须使用第二组自适应滤波器g1,其也与波束形成器滤波器f1(-t),f2(-t)相关。由于在使用第二滤波器g1之前对噪声测度x1,x2之一的数学上的依赖(存在仅仅两个麦克风测度,导致期望音频信号为第一音频信号z和两个噪声测度x1,x2),因此,如在03104334.2中揭露的,可以应用维数降低。
最后,减法器142被包括进来,用来从第一音频信号z中减去估计的噪声信号y,减法器142和噪声估计器150共同组成噪声抑制器,产生相对无噪的第二音频信号r。优选地,使用延时单元141来产生对应于噪声信号y的时间抽样的正确的时间抽样(或者相似的等同物)。
上面描述的系统是现有技术已知的旁瓣抑制器。
波束形成器滤波器(以及优选地,所有的相关的滤波器,例如,阻止矩阵滤波器和噪声估计滤波器)使用更新单元117,123朝着它们瞬时的最佳更新。
对于现有技术的波束形成器的一个典型的更新规则是,采用第一音频信号z和各自的噪声测度作为输入,为一个特定的频率范围或者频带附近的频率f计算新的滤波器系数的值:
F ( f , t + 1 ) = F ( f , t ) + α P zz [ f , t ] z * [ f , t ] x [ f , t ] - - - [ Eq . 1 ]
在这个等式中,F是对于特定的频率范围分别在离散时间t、t+1上的特定的滤波器系数,α是一个常数,Pzz[f,t]是第一音频信号功率的测量值,x为各自的噪声测度(例如,x1对应于第一滤波器f1(-t),是由第一麦克风101采集到的噪声的测度,在第一波束形成器信道中被进一步处理,一般地,通过对由第一麦克风101实际采集到的第一输入音频信号减去也是由第一麦克风采集的期望音频信号的估计来获得),星花代表复数的共轭。因此,如果噪声近似正交于期望的第一音频信号z,正如在旁瓣抑制器是最优时所应该的那样,则滤波器系数几乎不被更新,如果存在临时的无噪声,则会出现相同的情况。结果由更新单元获得的新的系数被复制到各自的滤波器,例如,波束形成器滤波器f1(-t),f2(-t)。
用来更新第二组滤波器g1的噪声抑制器更新单元159,现有技术的一个典型的更新规则是:
G ( f , t + 1 ) = F ( f , t ) + α P yy [ f , t ] r * [ f , t ] x [ f , t ] - - - [ Eq . 2 ]
其中,r是第二音频信号,Pyy[f,t]是噪声信号y的功率测度。
根据本发明,对于波束形成器滤波器的每一个更新等式[Eq.1]使用最优的步长代替固定步长α,根据在特定信道中采集的相关噪声的量确定最优步长。
理论上,当滤波器被最优化时,可以导出波束形成器的特定的第m个滤波器的性能测度为:
Q m [ f , t ] ≈ 2 α P zz [ f , t ] γ P x m x m [ f , t ] - - - [ Eq . 3 ]
其中α是更新步长,γ是常数,例如近似等于麦克风的数目。步长的减小导致性能的提高,另一方面,如果采集的噪声的功率增加,性能就会降低。
此外,更新等式1可以在概念上/近似地理解为包含以下贡献:
可以假定,在最优的条件下,第一个采集到的相关噪声项nc与期望音频λs(λ是比例常数,由于期望音频测度z是不精确的,而是仍然包含其他的因素)相比是可以忽略的。μ是另一个常数,表示噪声测度中的语音泄漏。由于阻止矩阵滤波器是最优的,因此假定在最优的条件下语音泄漏也是可以忽略的。因此通过近似分析,可以看出滤波器具有随相关噪声的量线性发散的倾向。
提出的解决方法是用相关噪声的幅度测度除步长α,特别是功率测度。在后者的情况下,第二功率超过了在分子上的线性相关噪声值,即,噪声的幅度越大,更新越不敏感。但是精确的相关噪声是不知道的,所以需要使用噪声的测度或者相关性。在噪声估计器150之前的噪声测度xi是良好的测度,它是通过减去期望音频的测度得到的,例如,从每一个各自的输入音频信号ui减去第一音频信号z。
优选地,鲁棒的更新步长由以下式子决定:
α m [ f , t ] = βP zz [ f , t ] / ( P zz [ f , t ] + γ P x m x m [ f , t ] ) - - - [ Eq . 5 ] ,
其中m是索引,指示使用得到的步长αm自适应调节哪一个滤波器(f1(-t),f2(-t),f表示频率,t表示时刻,z是第一音频信号,xm是由对应的第m个麦克风采集到的噪声的测度,期望音频被从麦克风输入音频信号um中减去,P表示用来得到信号功率的等式,β和γ是预先确定的常数。
当滤波器接近最优时,即使存在很强的干扰噪声源,使用上述更新规则的波束形成器仍然能够很好地工作。但是,可以通过增加帮助朝着最优点收敛的部件进行改进该系统。因此,波束形成器可以与基于视频的说话者跟踪器274合作,该跟踪器被设置为从由照相机272拍摄的图像中确定期望声音源的位置。在期望音频是语音的情况下,人脸检测可以用来识别一个或者更多的说话者,该人脸识别可以通过图像处理(例如肤色检测、眼睛检测、人脸几何确认等)的现有技术得到。嘴唇跟踪(例如使用蛇行技术—一种数学曲线跟踪技术)也可以用来检测是否这个人真的在说话,或者来自例如无线电的语音是否检测到。
通过图像处理,可以获得粗略的或者更加准确的位置估计,该位置估计被传输给波束形成器。波束形成器基于位置估计重新确定它的系数。例如,可以包括一个查找表,对于多个位置对应更加优化的起始系数。空间的预先知识可能被使用。粗略的定位算法简单地确定说话者在图像中间的哪一边,然后重新初始化波束形成器的主瓣分别朝着右边或者左边。更复杂的图像分析可以更加准确地确定说话者的位置,例如当使用两个照相机得到的图像时,在3维空间中确定位置。通过绘制人脸模型,说话者头部的位置也可以被确定(存在基于关键点例如眼睛的几何性的简单算法)。最后,如果存在空间信息,可以利用对特定空间的传输函数有关的头部的更加准确的系数来重新确定滤波器。
附加地或任选地,基于音频的说话者跟踪器270可以被连接到或者包含在含有根据本发明的波束形成器的装置之中。该跟踪器270可以例如使用对采集到的输入音频信号(u1,u2,...)的相关分析来确定对应于出现在周围的音频源的候选方向,如在WO 00/28740中所述的。高级版本可以基于语音分析(例如女声的共振峰与男声的共振峰是不同频率的)进一步确定说话者是谁,重新定位主瓣到对应于确认的特定说话者的方向上。
一般地,这个方向确定仅仅是“最初”完成的,然后波束形成器/旁瓣抑制器使用上面的自适应算法独立地进行微调。如果微调的方向仍然移出了预先确定的准确的可靠角度,该跟踪器将重新初始化滤波器。
两个估计都可以按照预先确定的结合算法结合起来。
图2显示了旁瓣抑制器200的拓扑,用来作为第二音频信号r的函数,完成波束形成器/阻止滤波器(在这个例子中,三个滤波器f1(-t),f2(-t),f3(-t),f1,f2,f3)的更新。所以,第二波束形成器更新单元219,215,211被示意性的示于前面描述的现有技术的旁瓣抑制器部分的上方。第二波束形成器更新单元219,215,211具有近似构造的一组第二噪声测度v1、v2、v3作为第二输入,该噪声测度是由各自的减法器产生的,例如减法器227使用第一阻止滤波器f1从第一麦克风信号u1减去对第二音频信号r滤波后的信号,等等。
可以在数学上证明,与eq.1相似,基本的更新规则可以被聪明地选择为:
F ( f , t + 1 ) = F ( f , t ) + α P rr [ f , t ] r * [ f , t ] v [ f , t ] - - - [ Eq . 6 ] ,
其中,r是第二音频信号,v是与特定的要更新的波束形成器滤波器相对应的第二噪声测度v1,v2,v3的其中之一,,Prr[f]是第二音频信号r的功率的测度。
对于第二更新拓扑,相关噪声鲁棒的更新步长等式可以与Eq.5相类似地得到:
α m [ f , t ] = βP rr [ f , t ] / ( P rr [ f , t ] + γP v m v m [ f , t ] ) - - - [ Eq . 7 ]
在该情况下,除了根据本发明在步长等式的分母上使用对应的噪声测度vm,还使用第二音频信号r(其中的噪声被清除得更加彻底,即,对真实语音更好的估计)。可以通过对该拓扑去掉近似等式4省略法之间的第一项中的nc这一项(只保留λs)来看出这样做的原因。
旁瓣抑制器也可以与缩放因子确定单元250相结合,例如,在03104334.2中所披露的(虽然没有示出,但是近似地,波束形成器的滤波器也可以独自地使用可由03104334.2获知的缩放因子确定单元250来调节)。该缩放因子确定单元250为波束形成器(如果需要应用,阻止矩阵和噪声抑制器的)所有的滤波器导出一个单一的缩放因子。由于存在大量的不相关噪声或者语音泄漏,波束形成器或者旁瓣抑制器收敛困难,所以,对于这些情况设置小的步长,即使当所有的滤波器接近最优点时。这两个更新策略共同产生一个更加鲁棒的系统。
在图3中,显示了一种视频会议应用,例如对于家庭的或者专业的应用。在该情况下,自动语音通信设备301是一个具有电话功能的外壳,还具有例如两个用来采集声音的麦克风303,305(例如对于桌子周围的四个说话者,四个麦克风可以设置在十字拓扑中)。接近终端的说话者106与远离终端的说话者360通信。理想地,即使是在存在噪声源的情况下,说话者160希望可以在自由地走动时使波束形成器/旁瓣抑制器始终保持锁定他。他也可以在声音控制单元中使用波束形成器/旁瓣抑制器,例如去控制消费装置350的行为,例如个人电脑、电视机、家庭应用例如中央暖气系统等,那么该设施特别包含多个麦克风和本发明。更加便宜的设备可以从包含声音控制单元的家庭中心计算机得到命令。
使用者160也具有可携带的语音通信设备370,该设备具有集成了波束形成器单元或者旁瓣抑制器的麦克风371和372。将来,会议系统可以从一体化的系统方案向无线系统过渡,在无线系统中,参与者具有他个人的例如安置在他的衣服上或者悬挂在他的脖子上的移动设备。
公开的算法组件实际上可以(全部或者部分)用硬件(例如,专用集成电路的部分)来实现,或者作为可运行在专用数字信号处理器、普通的处理器等上的软件来实现。
在计算机程序产品可以被理解的条件下,任何命令启动处理器集合的物理实现—普通的或者特殊的目的—在经过一系列载入步骤使命令进入处理器之后,都可以使处理器执行发明的任意特征功能。特别地,计算机程序产品可以作为包括例如盘或者磁带的载体中的数据、存储器中的数据、通过网络连接—有线的或无线的—传播的数据、或者纸上的程序代码来实现。除了程序代码外,程序需要的特征数据也可以具体体现为计算机编程产品。
应该注意到上面提到的实施例的解释没有限制本发明。除了如权利要求中结合的本发明元件的结合外,其他的元件的结合也是可能的。任意的元件结合可以在一个单独的专一的元件中实现。
权利要求圆括号内的任何标记都不能限制该权利要求。单词“包括”不排除没有列在权利要求中的元素或者方面。在元素前的单词“一个”不排除多个此类元素的出现。

Claims (15)

1、一种自适应波束形成器单元(191),包括:
滤波求和波束形成器(107),被设置为处理来自各个麦克风(101,103)阵列的输入音频信号(u1,u2),并且,还被设置为通过对输入音频信号的第一个(u1)使用第一自适应滤波器(f1(-t))滤波,对输入音频信号的第二个(u2)使用第二自适应滤波器(f2(-t))滤波,生成占主导地位的对应于来自期望音频源(160)的声音的第—音频信号(z)作为输出,分别使用第一步长(α1)和第二步长(α2)自适应调节第一滤波器(f1(-t))和第二滤波器(f2(-t))的系数;
噪声测度导出装置(111),被设置为从输入音频信号(u1,u2)导出第一噪声测度(x1)和第二噪声测度(x2);以及
更新单元(192),被设置为利用等式确定第一和第二步长(α1,α2),该等式对于第一步长(α1),其分母中包含第一噪声测度(x1),对于第二步长(α2),其分母中包含第二噪声测度(x2)。
2、如权利要求1所述的自适应波束形成器单元(191),其中,噪声测度导出装置(111)被设置为通过从第一麦克风(101)采集到的期望音频源中减去期望的声音测度(m1),从而从第一输入音频信号(u1)中导出第一噪声测度(x1);通过从第二麦克风(103)采集到的期望音频源中减去声音的第二期望的声音测度(m2),从而从第二输入音频信号(u2)中导出第二噪声测度(x2)。
3、如权利要求2所述的自适应波束形成器单元(191),其中用来获得第一和第二步长(α1和α2)的等式等于:
α m [ f , t ] = βP zz [ f , t ] / ( P zz [ f , t ] + γP x m x m [ f , t ] ) ,
其中m是索引,指示使用得到的步长αm来自适应调节哪个滤波器(f1(-t),f2(-t)),f表示频率,t表示时刻,z表示第一音频信号,xm分别是第一和第二噪声测度,Pss表示用来得到由它的下标s表示的信号的功率的等式,β和γ是预先确定的常数。
4、如权利要求1所述的自适应波束形成器单元(191),其中第一噪声测度(x1)和第二噪声测度(x2)由输入音频信号(u1,u2)的各自的线性组合来确定。
5、一种旁瓣抑制器(200),包括:
如权利要求1所述的滤波求和波束形成器(107);
自适应噪声估计器(150),被设置为利用第二组自适应滤波器(g1,g2),对从输入音频信号(u1,u2)导出的第一和第二噪声测度(x1,x2)进行滤波,从而导出估计的噪声信号(y);
减法器(142),被设置为从第—音频信号(z)中减去估计的噪声信号(y),得到无噪的第二音频信号(r);以及
可选的更新单元(292),被设置为利用等式确定第一和第二步长(α1,α2),该等式包括第二音频信号(r)的幅度测度,并且,该等式对于第一步长(α1),其分母中包含第一噪声测度(x1),对于第二步长(α2),其分母中包含第二噪声测度(x2)。
6、如权利要求5所述的旁瓣抑制器(200),其中获得步长的等式等于:
α m = βP rr [ f , t ] / ( P rr [ f , t ] + γP v m v m [ f , t ] ) ,
其中m是索引,指示使用得到的步长大小αm来自适应调节哪个滤波器(f1(-t),f2(-t)),f表示频率,t表示时刻,r是第二音频信号,vm是由对应的第m个麦克风采集到的噪声测度,无噪的第二音频信号(r)作为从期望的音频源获得的声音的测度被从各自输入信号(u1,u2)中减去以得到噪声测度vm,P表示用来得到信号功率的等式,β和γ是预先确定的常数。
7、如权利要求1所述的自适应波束形成器单元(191),其包括缩放因子确定单元(250),被设置为确定单一的缩放因子(S)用来缩放波束形成器(107)的第一滤波器(f1(-t))和第二滤波器(f2(-t))的步长(α1和α2),缩放因子(S)基于语音泄漏和/或不相关噪声的量被确定。
8、如权利要求5所述的旁瓣抑制器(200),其包括缩放因子确定单元(250),被设置为确定单一的缩放因子(S)用来缩放波束形成器(107)的第一滤波器(f1(-t))和第二滤波器(f2(-t))的步长(α1和α2),缩放因子(S)基于语音泄漏和/或不相关噪声的量被确定。
9、如权利要求1所述的自适应波束形成器单元(191),其被设置为从基于音频的说话者跟踪器(270)和/或基于视频的说话者跟踪(274)接收位置数据,其中基于音频的说话者跟踪器被配置为基于说话者的声音确定说话者在空间中的位置,基于视频的说话者跟踪器被配置为基于拍摄的图像确定说话者在空间中的位置,其中第一滤波器(f1(-t))和第二滤波器(f2(-t))的系数初始基于位置被确定,该位置由基于音频的说话者跟踪器(270)和/或基于视频的说话者跟踪器(274)来确定。
10、一种自动语音通信系统(301,303,305),其包括如权利要求1所述的自适应波束形成器单元(191)或者如权利要求5所述的旁瓣抑制器(200)。
11、一种可便携的语音通信设备(370),包括至少两个麦克风(371,372),用来生成输入音频信号(u1,u2),并且还包括如权利要求1所述的自适应波束形成单元(191)或者如权利要求5中所述的旁瓣抑制器(200),用来处理输入音频信号(u1,u2)。
12、一种声音控制单元,其包括如权利要求1所述的自适应波束形成器单元(191),或者如权利要求5中所述的旁瓣抑制器(200),并且还包括语音分析装置,用来识别语音命令。
13、一种消费装置(350),包括如权利要求12所述的声音控制单元。
14、一种自适应波束形成的方法,包括:
a)使用第一自适应滤波器(f1(-t))对来自第一麦克风(101)的第一输入音频信号(u1)进行滤波,使用第二自适应滤波器(f2(-t))对来自第二麦克风(103)的第二输入音频信号(u2)进行滤波,对滤波后的输入音频信号求和,产生占主导地位的对应于来自期望音频源(160)的声音的第一音频信号(z);
b)从输入音频信号(u1,u2)导出第一噪声测度(x1)和第二噪声测度(x2);并且
c)使用第一步长(α1)和第二步长(α2)分别自适应调节第一滤波器(f1(-t))和第二滤波器(f2(-t))的系数,该步长从一个等式得到,该等式对于第一步长(α1),其分母中包括第一噪声测度(x1),对于第二步长(α2),其分母中包括第二噪声测度(x2)。
15、一种包括能使处理器执行权利要求14所述方法的代码的计算机程序产品。
CN200580013338XA 2004-04-28 2005-04-20 自适应波束形成器、旁瓣抑制器、自动语音通信设备 Active CN1947171B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04101796 2004-04-28
EP04101796.3 2004-04-28
PCT/IB2005/051291 WO2005106841A1 (en) 2004-04-28 2005-04-20 Adaptive beamformer, sidelobe canceller, handsfree speech communication device

Publications (2)

Publication Number Publication Date
CN1947171A true CN1947171A (zh) 2007-04-11
CN1947171B CN1947171B (zh) 2011-05-04

Family

ID=34965422

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200580013338XA Active CN1947171B (zh) 2004-04-28 2005-04-20 自适应波束形成器、旁瓣抑制器、自动语音通信设备

Country Status (7)

Country Link
US (1) US7957542B2 (zh)
EP (1) EP1743323B1 (zh)
JP (1) JP5313496B2 (zh)
KR (1) KR101149571B1 (zh)
CN (1) CN1947171B (zh)
TW (1) TW200615902A (zh)
WO (1) WO2005106841A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101383651B (zh) * 2008-10-24 2012-02-15 西北工业大学 一种适用于宽带信号的近场时域波束形成方法
CN101369427B (zh) * 2007-08-13 2012-07-04 纽昂斯通讯公司 用于音频信号处理的方法和装置
CN102779524A (zh) * 2008-10-10 2012-11-14 三星电子株式会社 噪声估计的设备和方法以及使用该设备和方法的降噪设备
CN104106267A (zh) * 2011-06-21 2014-10-15 若威尔士有限公司 在增强现实环境中的信号增强波束成形
CN105427860A (zh) * 2015-11-11 2016-03-23 百度在线网络技术(北京)有限公司 远场语音识别方法和装置
CN108109617A (zh) * 2018-01-08 2018-06-01 深圳市声菲特科技技术有限公司 一种远距离拾音方法
CN110268470A (zh) * 2017-01-28 2019-09-20 伯斯有限公司 音频设备滤波器修改

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602006019872D1 (zh) * 2005-07-06 2011-03-10 Koninkl Philips Electronics Nv
CN101197798B (zh) 2006-12-07 2011-11-02 华为技术有限公司 信号处理系统、芯片、外接卡、滤波、收发装置及方法
CN101197592B (zh) 2006-12-07 2011-09-14 华为技术有限公司 远端串扰抵消方法、装置及信号发送装置和信号处理系统
CN101202552B (zh) 2006-12-15 2012-01-25 华为技术有限公司 串扰抵消装置、信号处理系统及串扰抵消方法
US8005238B2 (en) 2007-03-22 2011-08-23 Microsoft Corporation Robust adaptive beamforming with enhanced noise suppression
US8005237B2 (en) * 2007-05-17 2011-08-23 Microsoft Corp. Sensor array beamformer post-processor
CN101689371B (zh) 2007-06-21 2013-02-06 皇家飞利浦电子股份有限公司 处理音频信号的设备和方法
KR101409169B1 (ko) * 2007-09-05 2014-06-19 삼성전자주식회사 억제 폭 조절을 통한 사운드 줌 방법 및 장치
TWI463859B (zh) * 2008-01-18 2014-12-01 Chi Mei Comm Systems Inc 攜帶式電子裝置
KR20100003530A (ko) * 2008-07-01 2010-01-11 삼성전자주식회사 전자기기에서 음성 신호의 잡음 제거 장치 및 방법
KR101547344B1 (ko) * 2008-10-31 2015-08-27 삼성전자 주식회사 음성복원장치 및 그 방법
WO2010073193A1 (en) 2008-12-23 2010-07-01 Koninklijke Philips Electronics N.V. Speech capturing and speech rendering
TW201026009A (en) * 2008-12-30 2010-07-01 Ind Tech Res Inst An electrical apparatus, circuit for receiving audio and method for filtering noise
US9049503B2 (en) * 2009-03-17 2015-06-02 The Hong Kong Polytechnic University Method and system for beamforming using a microphone array
US8249862B1 (en) * 2009-04-15 2012-08-21 Mediatek Inc. Audio processing apparatuses
WO2011129725A1 (en) * 2010-04-12 2011-10-20 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for noise cancellation in a speech encoder
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8958572B1 (en) * 2010-04-19 2015-02-17 Audience, Inc. Adaptive noise cancellation for multi-microphone systems
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
US8639499B2 (en) * 2010-07-28 2014-01-28 Motorola Solutions, Inc. Formant aided noise cancellation using multiple microphones
US9171551B2 (en) * 2011-01-14 2015-10-27 GM Global Technology Operations LLC Unified microphone pre-processing system and method
US8929564B2 (en) 2011-03-03 2015-01-06 Microsoft Corporation Noise adaptive beamforming for microphone arrays
JP5821237B2 (ja) * 2011-03-31 2015-11-24 ソニー株式会社 信号処理装置および信号処理方法
US9288331B2 (en) * 2011-08-16 2016-03-15 Cisco Technology, Inc. System and method for muting audio associated with a source
KR101254989B1 (ko) * 2011-10-14 2013-04-16 한양대학교 산학협력단 2채널 디지털 보청기 및 2채널 디지털 보청기의 빔포밍 방법
EP2798633B1 (en) * 2011-12-29 2018-05-16 Intel Corporation Acoustic signal modification
US9881616B2 (en) * 2012-06-06 2018-01-30 Qualcomm Incorporated Method and systems having improved speech recognition
CN102831898B (zh) * 2012-08-31 2013-11-13 厦门大学 带声源方向跟踪功能的麦克风阵列语音增强装置及其方法
US9922646B1 (en) 2012-09-21 2018-03-20 Amazon Technologies, Inc. Identifying a location of a voice-input device
US20180317019A1 (en) 2013-05-23 2018-11-01 Knowles Electronics, Llc Acoustic activity detecting microphone
US9269350B2 (en) * 2013-05-24 2016-02-23 Google Technology Holdings LLC Voice controlled audio recording or transmission apparatus with keyword filtering
US9984675B2 (en) 2013-05-24 2018-05-29 Google Technology Holdings LLC Voice controlled audio recording system with adjustable beamforming
US9747917B2 (en) * 2013-06-14 2017-08-29 GM Global Technology Operations LLC Position directed acoustic array and beamforming methods
US10045140B2 (en) 2015-01-07 2018-08-07 Knowles Electronics, Llc Utilizing digital microphones for low power keyword detection and noise suppression
US10152476B2 (en) * 2015-03-19 2018-12-11 Panasonic Intellectual Property Management Co., Ltd. Wearable device and translation system
US9607603B1 (en) * 2015-09-30 2017-03-28 Cirrus Logic, Inc. Adaptive block matrix using pre-whitening for adaptive beam forming
KR20170097519A (ko) * 2016-02-18 2017-08-28 삼성전자주식회사 음성 처리 방법 및 장치
WO2018175959A1 (en) 2017-03-23 2018-09-27 Joyson Safety Systems Acquisition Llc System and method of correlating mouth images to input commands
US10418048B1 (en) * 2018-04-30 2019-09-17 Cirrus Logic, Inc. Noise reference estimation for noise reduction
DE102018212902A1 (de) * 2018-08-02 2020-02-06 Bayerische Motoren Werke Aktiengesellschaft Verfahren zum Bestimmen eines digitalen Assistenten zum Ausführen einer Fahrzeugfunktion aus einer Vielzahl von digitalen Assistenten in einem Fahrzeug, computerlesbares Medium, System, und Fahrzeug
US10861457B2 (en) * 2018-10-26 2020-12-08 Ford Global Technologies, Llc Vehicle digital assistant authentication
CN110196914B (zh) * 2019-07-29 2019-12-27 上海肇观电子科技有限公司 一种将人脸信息录入数据库的方法和装置
KR20210112726A (ko) * 2020-03-06 2021-09-15 엘지전자 주식회사 차량의 좌석별로 대화형 비서를 제공하는 방법
KR20220059629A (ko) * 2020-11-03 2022-05-10 현대자동차주식회사 차량 및 그의 제어방법
EP4260013A2 (en) * 2020-12-09 2023-10-18 Cerence Operating Company Automotive infotainment system with spatially-cognizant applications that interact with a speech interface

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6192134B1 (en) * 1997-11-20 2001-02-20 Conexant Systems, Inc. System and method for a monolithic directional microphone array
US6549627B1 (en) * 1998-01-30 2003-04-15 Telefonaktiebolaget Lm Ericsson Generating calibration signals for an adaptive beamformer
ES2367099T3 (es) 1998-11-11 2011-10-28 Koninklijke Philips Electronics N.V. Disposición de localización de señal mejorada.
US7054662B2 (en) * 2001-01-24 2006-05-30 Qualcomm, Inc. Method and system for forward link beam forming in wireless communications
GB0120450D0 (en) 2001-08-22 2001-10-17 Mitel Knowledge Corp Robust talker localization in reverberant environment
US7613310B2 (en) * 2003-08-27 2009-11-03 Sony Computer Entertainment Inc. Audio input system
CA2399159A1 (en) * 2002-08-16 2004-02-16 Dspfactory Ltd. Convergence improvement for oversampled subband adaptive filters
KR100480789B1 (ko) * 2003-01-17 2005-04-06 삼성전자주식회사 피드백 구조를 이용한 적응적 빔 형성방법 및 장치
US7054437B2 (en) * 2003-06-27 2006-05-30 Nokia Corporation Statistical adaptive-filter controller
CN101189656A (zh) 2003-11-24 2008-05-28 皇家飞利浦电子股份有限公司 具有相对于不相关噪声的稳健性的自适应波束生成器

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101369427B (zh) * 2007-08-13 2012-07-04 纽昂斯通讯公司 用于音频信号处理的方法和装置
US9159335B2 (en) 2008-10-10 2015-10-13 Samsung Electronics Co., Ltd. Apparatus and method for noise estimation, and noise reduction apparatus employing the same
CN102779524A (zh) * 2008-10-10 2012-11-14 三星电子株式会社 噪声估计的设备和方法以及使用该设备和方法的降噪设备
CN102779524B (zh) * 2008-10-10 2015-01-07 三星电子株式会社 噪声估计的设备和方法以及使用该设备和方法的降噪设备
CN101383651B (zh) * 2008-10-24 2012-02-15 西北工业大学 一种适用于宽带信号的近场时域波束形成方法
CN104106267B (zh) * 2011-06-21 2018-07-06 亚马逊技术股份有限公司 在增强现实环境中的信号增强波束成形
US9973848B2 (en) 2011-06-21 2018-05-15 Amazon Technologies, Inc. Signal-enhancing beamforming in an augmented reality environment
CN104106267A (zh) * 2011-06-21 2014-10-15 若威尔士有限公司 在增强现实环境中的信号增强波束成形
CN105427860A (zh) * 2015-11-11 2016-03-23 百度在线网络技术(北京)有限公司 远场语音识别方法和装置
CN110268470A (zh) * 2017-01-28 2019-09-20 伯斯有限公司 音频设备滤波器修改
CN110268470B (zh) * 2017-01-28 2023-11-14 伯斯有限公司 音频设备滤波器修改
CN108109617A (zh) * 2018-01-08 2018-06-01 深圳市声菲特科技技术有限公司 一种远距离拾音方法
CN108109617B (zh) * 2018-01-08 2020-12-15 深圳市声菲特科技技术有限公司 一种远距离拾音方法

Also Published As

Publication number Publication date
CN1947171B (zh) 2011-05-04
KR20070004893A (ko) 2007-01-09
JP2007535853A (ja) 2007-12-06
US7957542B2 (en) 2011-06-07
US20070273585A1 (en) 2007-11-29
EP1743323B1 (en) 2013-07-10
KR101149571B1 (ko) 2012-05-29
EP1743323A1 (en) 2007-01-17
JP5313496B2 (ja) 2013-10-09
WO2005106841A1 (en) 2005-11-10
TW200615902A (en) 2006-05-16

Similar Documents

Publication Publication Date Title
CN1947171A (zh) 自适应波束形成器、旁瓣抑制器、自动语音通信设备
KR101238362B1 (ko) 음원 거리에 따라 음원 신호를 여과하는 방법 및 장치
US8107642B2 (en) Spatial noise suppression for a microphone array
KR101456866B1 (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
McCowan et al. Microphone array shape calibration in diffuse noise fields
CN110770827B (zh) 基于相关性的近场检测器
US9521486B1 (en) Frequency based beamforming
CN106887239A (zh) 用于高度相关的混合物的增强型盲源分离算法
CN101278337A (zh) 噪声环境中语音信号的健壮分离
CN106716526A (zh) 用于增强声源的方法和装置
JP2007523514A (ja) 適応ビームフォーマ、サイドローブキャンセラー、方法、装置、及びコンピュータープログラム
CN110610718B (zh) 一种提取期望声源语音信号的方法及装置
CN1251194A (zh) 识别系统
CN110706717B (zh) 一种基于麦克风阵列板的人声检测定向方法
WO2016160821A1 (en) Adaptive mixing of sub-band signals
CN108449687B (zh) 一种多麦克风阵列降噪的会议系统
US9589572B2 (en) Stepsize determination of adaptive filter for cancelling voice portion by combining open-loop and closed-loop approaches
CN110140359A (zh) 使用波束形成的音频捕获
TW202147862A (zh) 強烈雜訊干擾存在下穩健的揚聲器定位系統與方法
US20150318000A1 (en) Single MIC Detection in Beamformer and Noise Canceller for Speech Enhancement
US20130148814A1 (en) Audio acquisition systems and methods
US20150317999A1 (en) Simplified Beamformer and Noise Canceller for Speech Enhancement
JP5235725B2 (ja) 発話向き推定装置、方法及びプログラム
CN116343808A (zh) 柔性麦克风阵列语音增强方法及装置、电子设备、介质
US20070076899A1 (en) Audio collecting device by audio input matrix

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address

Address after: No. 5, 5656 Hi-tech Park, Einhofen, Netherlands

Patentee after: KONINKLIJKE PHILIPS N.V.

Address before: Holland Ian Deho Finn

Patentee before: Koninklijke Philips Electronics N.V.

CP03 Change of name, title or address
TR01 Transfer of patent right

Effective date of registration: 20190505

Address after: China Taiwan Hsinchu Science Park Hsinchu city Dusing a road No.

Patentee after: MEDIATEK Inc.

Address before: No. 5, 5656 Hi-tech Park, Einhofen, Netherlands

Patentee before: KONINKLIJKE PHILIPS N.V.

TR01 Transfer of patent right