用于降低在开放式环境中通信设备所传输的噪声的声学周界
相关申请的交叉引用
本发明申请是一个分案申请,其母案申请的国际申请日为2015年6月12日、申请号为201580032012.5,并且母案申请的发明创造名称为“用于降低在开放式环境中通信设备所传输的噪声的声学周界”。这个申请的主题涉及由Kwan K. Truong等人于2012年11月12日提交的题为“FAR FIELD NOISE SUPPRESSION FOR TELEPHONY DEVICES”且通过引用而全部并入在此的共同未决美国专利申请序列号13/684,526的主题。
背景技术
1、技术领域
本发明一般涉及通信系统,并且更特别地涉及用于改善降噪的系统、方法和设备。
2、相关技术的描述
开放式办公室布局由于促进合作与互动的工作环境的可能性而是受欢迎的。另外,开放式办公室由于例如与封闭式办公室所需的相比而言总的办公室面积的减少而可以允许节省开销以及通过使用小隔间(cubicle)和隔断(partition)代替隔墙(wall)而可以允许节省建造成本。
然而,这样的开放式办公室布局在个人办公桌与工作台之间几乎不提供隔音,从而任凭对话、办公设备、HVAC噪声等等到达其办公桌旁的工作人员。这样的远场噪声(背景声音和噪声)在其中工作人员在其开放式工作台上进行电话对话的情形中可能尤其成问题。这样的远场噪声能够与工作人员的对话一起被传输,从而导致差的通信和保密的问题。
桌面电话系统在各种各样的办公室和呼叫中心中已成为无处不在的通信工具。这样的通信系统可以包括桌面视频电话和桌面会议系统。桌面系统通常诸如经由手持式、头戴式或免提式扬声器电话(speaker phone)来支持各种通信模式。桌面系统的扬声器电话功能尤其易受开放式办公环境的远场噪声的影响。
复杂的电话可以并入各种类型的噪声抑制。大多数现有的噪声抑制方案解决稳态“背景声音”(例如HVAC)。非稳态“噪声”(例如一边对话、音乐、关门、街道噪声、键盘打字、打印机和复印机)的抑制是更具挑战性的问题。解决非稳态噪声的算法通常是复杂的、计算密集型的并且时常导致主语音的失真。
使之能够利用有效的音频信号处理和最小的设备投资来控制和降低稳态与非稳态噪声二者的系统和方法将显著改善在开放式办公环境中的通信的音频体验。
发明内容
公开用于在基于桌面电话系统的通信中的噪声抑制的方法、系统和设备。在一个实施例中,多个参考麦克风在开放式办公室布局内监控在主桌面电话周围的远场噪声。主桌面电话中的主要麦克风接收包括在活动时的主说话者的语音和远场噪声二者的主要音频信号。通过将利用参考麦克风所测量的远场噪声与来自主通信设备的主要麦克风的音频信号进行比较,可以在被传输至接收通信设备的音频信号中识别和抑制主要音频信号中的远场噪声。
在实施例中,参考麦克风被选择或被安排成相对于主通信设备来定义声学周界(acoustic perimeter)。声学周界相对于主通信设备定义“远场”。即,在由主通信设备传输至接收通信设备的音频信号中可以抑制被参考麦克风识别为在“远场”中或在声学周界之外的噪声。注意:远场噪声可以是在距主要麦克风至少6英寸的距离上生成的任何噪声。通过将参考麦克风选择和安排成定位在噪声源与主电话之间,这些参考麦克风可以围绕主电话形成声学周界,从而使之能够隔离说话者的语音与远场噪声。
例如,参考麦克风可以被选择并被定位在开放式办公室布局内,以便优先检测超过使用主电话的主说话者的语音的背景声音。例如,参考麦克风可以相对于主麦克风来定位,以致从主说话者到参考麦克风的路径被衰减,而从噪声源到参考麦克风的音频路径类似于从噪声源到主要麦克风的音频路径。另外,参考麦克风可以被选择为具有方向性,以致它优先检测源自或在声学周界之外或在声学周界之内的噪声和声音,同时不太可能检测到在声学周界之内的主语音信号,这能够导致更干净的降噪。
参考麦克风可以被包含在专用麦克风设备或其他通信设备之内。在一个实施例中,参考麦克风设备可以被定位在包含桌面电话的每一个隔间(cube)上方。在另一实施例中,参考麦克风设备可以沿着工作台之间的隔断来定位或被定位在隔断上方。参考麦克风设备可以被放置在背景噪声的其他源诸如走廊之中或在其周围或者靠近窗户。在另一实施例中,参考麦克风设备与声学屏障相结合来使用,以创建麦克风方向性并将参考麦克风与主声源隔离。
在另一实施例中,两个或更多的桌面扬声器电话在开放式办公室布局内形成麦克风的阵列。一个桌面扬声器电话充当参考麦克风,从而检测针对另一主扬声器电话的远场噪声。例如,位于办公桌上或位于与主桌面电话相邻的隔间中的每一个桌面扬声器电话上的麦克风各自可以被指定为参考麦克风。将现有的桌面扬声器电话上的现有麦克风用作参考麦克风允许识别远场噪声而不引入附加的声音检测设备。与主扬声器电话相邻的桌面扬声器电话可以围绕主扬声器电话定义声学周界,从而识别将要抑制的远场噪声。此外,通过使用在每一个通信设备中并入的软件或在通信阵列中并入的单独的音频信号处理器,噪声抑制可以被并入现有的桌面通信设备的阵列之中。
附图说明
通过阅读以下描述并且参考附图,将更容易明白本发明的示例实施例,其中:
图1说明根据本发明的实施例的在开放式办公室中具有噪声抑制的桌面通信系统的透视图。
图2是说明根据本发明的实施例的用于在开放式办公环境中抑制桌面通信系统所传输的噪声的方法的流程图。
图3显示根据本发明的实施例的用于在开放式办公环境中抑制桌面通信设备所传输的噪声的系统的功能框图。
图4说明根据本发明的实施例的包括桌面通信设备阵列的开放式办公环境的自上而下的视图。
图5说明根据本发明的实施例的包括相对于桌面通信设备定义声学周界的麦克风设备的开放式办公环境的自上而下的视图。
图6A-6C说明根据本发明的实施例的用于在形成声学周界中使用的麦克风的示例极性。
图7A说明根据本发明的实施例的相对于桌面通信设备定义声学周界的定向麦克风的透视图。
图7B说明根据本发明的实施例的相对于桌面通信设备定义声学周界的定向麦克风的自上而下的视图。
图8说明根据本发明的实施例的包括相对于桌面通信设备定义声学周界的麦克风设备和参考通信设备的开放式办公环境的自上而下的视图。
图9是说明根据本发明的实施例的用于基于参考音频输入和主要音频输入来抑制噪声的方法的流程图。
具体实施方式
公开用于降低桌面通信设备所传输的噪声的方法、系统和设备。开放式办公室布局使得桌面电话用户暴露于大量的办公室噪声,其包括稳态背景声音例如HVAC和非稳态噪声诸如邻近对话和办公设备。这样的远场背景声音和噪声能够作为扬声器电话对话的一部分被传输,从而导致差的通信和保密的问题。
在本发明的一个方面中,由桌面电话在开放式办公环境中所传输的噪声的量通过使用参考麦克风相对于主通信设备定义声学周界来降低。在声学周界之外利用参考麦克风进行的声音的检测通知来自主通信设备的主要音频信号的传输。参考麦克风可以用于生成包括在主桌面电话附近的远场噪声(例如稳态背景声音和非稳态噪声)的参考音频输入。主桌面电话生成包括主说话者的语音以及背景噪声的主要音频输入。参考音频输入与来自主扬声器电话的主要音频输入进行比较,以识别主要音频信号中的远场噪声部分。降噪算法抑制主要音频信号中的远场噪声。定义声学周界的参考麦克风可以被包括在靠近主要桌面电话放置的单独的麦克风设备内、在其他的邻近桌面电话设备内、或在两种类型的设备的组合内。
在本发明的另一方面中,在开放式办公室布局中对于专用降噪设备的需求利用协作网络或阵列的桌面扬声器电话来降低或消除。在主扬声器电话周围的隔间中或工作台上的桌面扬声器电话内的麦克风可以用于生成参考音频信号,其包含可能干扰在主扬声器电话上的主说话者的语音的远场噪声。如此一来,周围桌面扬声器电话可以针对主扬声器电话定义声学周界而不需要安装附加的麦克风设备。
图1说明根据本发明的实施例的开放式办公室布局,其包括具有桌面电话120A-D的阵列以及麦克风设备130A-D与140A-D的阵列的小隔间110A-D。桌面电话120A-D的示例能够包括产品诸如POLYCOM® SoundPoint IP®系列、POLYCOM® VVX®系列等等。在实施例中,电话120A是主扬声器电话,并且主说话者对其说话的扬声器电话120A内的麦克风是主要麦克风。当主说话者经由主电话120A进行语音通信时,来自主要麦克风的音频输入包括扬声器电话用户的预期语音。除了主说话者的语音之外,主扬声器电话120A还可能由于办公室的开放式特性而被暴露于来自各种源的噪声。噪声源可以包括诸如来自加热通风冷却(HVAC)系统的稳态噪声或非稳态噪声诸如来自相邻隔间110B-D的语音与打字、办公设备(例如打印机)、关门以及街道噪声。
在本发明的一个实施例中,许多麦克风设备130A-D和140A-D被定位在开放式办公室内来捕获远场噪声。根据实施例,麦克风设备130A-D和140A-D之中的一个或多个相对于主扬声器电话120A而被指定为参考麦克风。参考麦克风被选择并被定位,以致具有从(例如在相邻隔间中)远场噪声的源到包含参考麦克风的麦克风设备的直接听觉路径。同时,当主说话者与麦克风设备相隔一些距离并且正在直接对着主电话120A的主要麦克风说话时,从主说话者到参考麦克风的听觉路径被衰减。
例如,由于分区麦克风(partition microphone)设备140A和140B分别被定位在主扬声器电话120A与相邻小隔间110C和110B之间的分区上,所以这些分区麦克风设备140A和140B可以是指定的参考麦克风。分区麦克风设备140A和140B可以生成包含来自相邻小隔间110C和110B的语音和打字的参考音频信号。另外,根据实施例,架空(overhead)麦克风设备130A-D被显示为附着于或悬挂于小隔间110A-D上方的天花板上。在实施例中,架空麦克风130A相对于主电话120A被指定为唯一的参考麦克风。架空麦克风设备130A被定位来捕获也可以被主电话120A上的主要麦克风捕获的大部分的远场噪声。在另一实施例中,架空麦克风设备130A-D相对于主电话120A被指定为参考麦克风。架空麦克风130B和130C的添加使之能够监控和抑制分别来自相邻隔间110B和110C的远场噪声。虽然架空麦克风130A-D被显示为在小隔间110A-D的正上方,但是架空麦克风130A-D也可以采用其他方式来定位,诸如以捕获HVAC或走廊噪声。利用麦克风设备130A-D和140A-D检测到的参考音频信号可以用于确定被算法用于基于与主要音频信号的比较来降低所传输的音频信号中的远场噪声的背景音频信号。
在另一实施例中,在桌面电话120B-D之中的每一个中包含的麦克风相对于主电话120A被指定为参考麦克风。桌面电话120B-D之中的每一个包括至少一个能够检测在其相应隔间110B-D内以及在其相应隔间110B-D附近的声音的麦克风。在实施例中,电话120B和120C被指定为辅助桌面电话。由桌面电话120A生成主要音频输入,其包括说话者的语音和远场噪声。参考音频输入由辅助扬声器电话120B-C上的每一个参考麦克风来生成。以这种方式,在相邻隔间110B-C中检测到的远场噪声能够被包括在参考音频信号中,而参考音频信号将被算法用于隔离来自主扬声器电话120A的主要音频输入中的语音部分。通过使用开放式办公室布局中的其他扬声器电话上的麦克风,能够检测和抑制远场噪声而不需要附加的麦克风设备130A-D和140A-D。
在还一实施例中,麦克风设备130A-D和140A-D与辅助扬声器电话120B-C二者的组合可以被指定为参考麦克风。通过检测可以从主要音频信号中抑制的远场噪声,这一个或多个参考麦克风围绕主扬声器电话有效地形成声学周界。
图2是说明根据本发明的实施例的用于在开放式办公环境中降低由桌面电话传输的远场噪声的方法200的流程图。遍及图2的描述,将参考说明根据本发明的实施例的在开放式办公环境中降低由桌面扬声器电话传输的噪声的通信系统300的图3的元素。也将参考各自说明根据本发明的实施例的设备在开放式办公环境内的安排的图4、5和8。
方法200可以利用音频处理器320来执行,其中音频处理器320包括处理组件以及存储在处理组件上可执行的指令的有形存储设备。在实施例中,音频处理器320基于主要音频信号和至少一个参考音频信号来运行噪声抑制算法,由此产生具有降低的远场噪声的音频信号,以便传输至通信的接收机。
在块210,根据本发明的实施例,从主要麦克风接收主要音频输入。根据实施例,主要麦克风310从主说话者接收语音通信。在实施例中,主要麦克风310也拾取背景声音和噪声。主要麦克风310生成包括主说话者的语音和背景噪声二者的主要音频信号。在实施例中,主要麦克风310是主通信设备330的一部分。主通信设备可以是任何的基于麦克风的通信设备,诸如桌面扬声器电话、视频系统、会议系统、移动电话、桌面计算机系统、膝上型计算机或平板计算机。
在实施例中,音频处理器320和主要麦克风310是单个主通信设备330的组件,并且来自主要麦克风310的主要音频输入经由针对主通信设备330而言内部的装置而被传送至音频处理器320。在另一实施例中,音频处理器320位于与主要麦克风310相分离的设备上,以致经由通信地链接这两个设备的通信网络340来接收主要音频输入。在这个实施例中,音频处理器320可以位于IP PBX或因特网上语音协议(VoIP)服务器中,以提供集中操作。在实施例中,通信网络340是局域网(LAN)。通信网络340可以经由网络接口380与额外的办公网络诸如用于VoIP的因特网进行接口。
在块220,根据本发明的实施例,从一个或多个参考麦克风接收参考音频输入。根据本发明的实施例,通信系统300包括一个或多个参考麦克风350A-C。根据实施例,参考麦克风350A-C之中的每一个生成包含在其附近的声音和噪声的参考音频信号。在实施例中,参考麦克风350A是被指定为辅助通信设备360的通信设备的组件。辅助通信设备360可以是任何的基于麦克风的通信设备,诸如桌面扬声器电话、视频呼叫系统、会议系统、移动电话、桌面计算机系统、膝上型计算机或平板计算机。在另一实施例中,参考麦克风350C被包括在麦克风设备370内。麦克风设备370是其主要目的是从一个或多个麦克风分量中生成音频信号的设备。
根据本发明的实施例,来自参考麦克风350A-C的一个或多个参考音频输入信号经由通信网络340被传送至音频处理器320。在另一实施例中,来自参考麦克风350A-C之中的一个或多个的参考音频信号被直接传送至音频处理器320(即,不经由通信网络340),例如,其中主通信设备330具有指定的麦克风设备370来具体地为主通信设备330生成参考音频信号。在还一实施例中,一个或多个参考信号经由通信网络被传送至音频处理器320,而被传送至音频处理器320的一个或多个参考音频信号并不经由通信网络来传送。例如,主通信设备330可以直接从指定的麦克风设备370接收参考音频输入信号并且也经由通信网络340从辅助通信设备360接收参考音频输入信号。
参考麦克风被选择并被定位,以便捕获也可以被主要麦克风捕获的远场噪声。例如,参考麦克风可以被定位在主通信设备和所识别的声音源之间。在实施例中,参考麦克风被选择或被安排成相对于主通信设备来定义声学周界。声学周界相对于主通信设备定义“远场”。即,在由主通信设备传输至接收通信设备的音频信号中可以抑制被参考麦克风识别为源自“远场”/在声学周界外部的噪声。通过将参考麦克风选择和安排成定位在噪声源与主电话之间,参考麦克风可以围绕主电话形成声学周界,从而使之能够将说话者的语音与远场噪声相隔离。
图4、5和8说明参考麦克风相对于主要麦克风的定位。图4说明根据实施例的其中其他的桌面电话充当主桌面电话的参考麦克风的开放式办公室布局。图5说明根据实施例的其中麦克风设备充当主桌面电话的参考麦克风的开放式办公室布局。图8说明根据实施例的其中桌面设备和麦克风设备二者充当主桌面电话的参考麦克风的开放式办公室布局。
开放式办公室布局为扬声器电话对话提供最小的噪声屏蔽(shielding)。虽然图4-5和8说明开放式办公室布局的小隔间实施例,但是将明白:开放式办公室布局涵盖其中桌面扬声器电话在使用期间被暴露于噪声的各种情形。在实施例中,开放式办公室布局是其中使用扬声器电话而没有从可能干扰经由扬声器电话的通信的声音和噪声中进行足够的噪声屏蔽的任何布局。例如,足够的噪声屏蔽可以存在于具有隔音墙的封闭式会议室中。相比之下,在桌面扬声器电话在封闭式房间内未被隔离的情况下,外部噪声屏蔽可能是不够的。在另一实施例中,开放式办公室布局是其中多个桌面电话位于彼此的声学接近度(acoustic proximity)中的办公室布局。例如,开放式办公室布局可以是其中两个或更多的扬声器电话的声学范围重叠的办公室布局。
在图4中,根据本发明的实施例,隔间办公室(cube farm)400包括许多隔间410,每一个隔间包括通信设备。通信设备420A-B和420E-F分别位于隔间410A-B和410E-F中。每一个通信设备420包括用于在基于扬声器的通信中使用的至少一个麦克风。例如,通信设备420各自可以是桌面扬声器电话、视频电话、会议系统、桌面计算机、移动电话、膝上型计算机或平板计算机。根据实施例,通信设备420A被指定为主通信设备。主通信设备420A包括生成主要音频输入的主要麦克风,其中主要音频输入包括说话者/用户的语音以及背景声音和噪声。
在实施例中,通信设备420B和420E-F之中的每一个被指定为辅助通信设备。辅助通信设备420B和420E-F之中的每一个包括生成参考音频输入的参考麦克风。辅助通信设备420B和420E-F位于与主隔间410A相邻的辅助隔间410B和410E-F中。如此一来,辅助通信设备420B和420E-F由于是位于隔间410B和410E-F中的桌面扬声器电话的性质而被定位成在其相应隔间内捕获声音,其中如果被主通信设备420A中的主要麦克风检测到,则这些声音将相对于主隔间410A中的说话者/用户的语音而构成远场噪声。通过记录围绕主通信设备420A的隔间410B和410E-F中的背景声音和噪声,辅助通信设备420B和420E-F围绕主设备420A形成声学周界440A。在实施例中,声学周界440相对于主通信设备420A定义远场区域,其中在远场区域之外的背景声音和噪声被检测并可以被抑制。声学周界440A的精确轮廓(delineation)取决于辅助通信设备420B和420E-F中的每一个参考麦克风的声学范围和属性。例如,虽然声学周界440A被说明为围绕主通信设备420A的方框(box),但是参考麦克风的特定极性、麦克风的范围和灵敏度以及辅助通信设备420B和420E-F的位置和方位全部可以影响声学周界440A的精确轮廓。另外,其他的布局是可能的,例如,通信设备410A-D可以不同地定位在其相应隔间420A-D内,这可以改变声学周界440的轮廓。
虽然三个辅助通信设备420B和420E-F被说明为定义声学周界440A,但是可以使用更多或更少的辅助通信设备。在一个实施例中,两个辅助通信设备420B和420D相对于主通信设备410C定义声学周界440B。在实施例中,尽管设备420G没有被用作参考设备,但是参考麦克风420B和420D相对于420C的空间几何结构允许识别源自隔间410G的方向的远场噪声。在另一实施例中,五个通信设备420J、420L、420N、420P和420R被指定为相对于主通信设备420K定义声学周界440C的辅助通信设备。在还一实施例中,对于给定的主通信设备而言,隔间办公室中的每一个其他的通信设备被指定为辅助通信设备。
此外,个别通信设备可以充当主通信设备并且相对于另一主通信设备充当辅助通信设备二者。通信设备可以或同时或在不同的时间履行主角色和辅助角色。例如,根据一个实施例,通信设备420L被显示为相对于主通信设备420K定义声学周界440C的辅助通信设备。然而,通信设备420L也可以是主通信设备。根据另一实施例,通信设备420K被说明为相对于主通信设备420L定义声学周界440D的辅助通信设备。为了履行主角色和辅助角色,通信设备420L可以具有生成单个音频信号的单个麦克风,其中单个音频信号充当通信设备420L的主要音频输入并且也充当其他通信设备诸如通信设备420K的参考音频输入。在另一实施例中,通信设备420K包括一个以上的麦克风,这些麦克风包括用于在服务于通信设备的主能力的同时生成主要音频输入的主要麦克风并且也包括被指定为参考麦克风的至少一个其他麦克风,用于相对于通信设备阵列中的任何其他数量的主通信设备生成参考音频输入。
虽然声学周界440A-D被说明为利用直线定义的四边形,但是对于本领域普通技术人员而言将明白:声学周界的形状将取决于各种各样的因素,诸如参考设备的放置、参考设备的方位、中间障碍物(有意或无意)、麦克风方向性等等。另外,虽然在自上而下的视图中将声学周界说明为二维的,但是其事实上是包括架空组件的三维表面。
参考图5,根据本发明的实施例,开放式办公室布局500包括许多隔间510。在实施例中,通信设备520位于每一个隔间510中。根据实施例,开放式办公室布局500包括许多参考麦克风设备530和550。根据实施例,参考麦克风设备530是位于隔间或工作台510上方的架空参考麦克风设备。根据实施例,参考麦克风设备550是位于相邻的隔间或工作台510之间的基于分区的参考麦克风设备。
在实施例中,参考麦克风设备530A-B和530E-F之中的每一个参考麦克风设备中的麦克风被指定为相对于隔间510A中的主通信设备530A而言的参考麦克风。根据实施例,参考麦克风设备530A-B和530E-F围绕主通信设备520A形成声学周界540A。主通信设备520A包括主要麦克风,其记录隔间510A内的主通信设备520A的用户的语音以及周围办公室背景声音和噪声。
架空参考麦克风设备530A-B和530E-F各自可以被安装在隔间或工作台上方的天花板上或者采用某种其他方式来悬挂,以便位于底层的(underlying)隔间上方或位于底层的隔间内。在实施例中,参考麦克风设备530A在小隔间510A上方的放置允许检测相对于主设备520A而言的远场噪声,但是将参考麦克风设备530A保持在与说话者/用户以及主设备520A相隔足够的距离上,以致麦克风设备530A将不会强烈地拾取说话者的语音。在实施例中,麦克风设备530B和530E-F捕获相邻的小隔间内的背景声音和噪声,并且背景声音和噪声由于其接近度而有可能被主设备520A中的主要麦克风检测到。即,在实施例中,从背景声音或噪声的源到参考麦克风设备530A-B和530E-F之中的每一个的音频路径与从背景声音或噪声到主桌面电话520A中的主要麦克风的音频路径相类似。然而,因为主说话者直接对着主通信设备520A的主要麦克风说话,所以从主说话者到主要麦克风的音频路径是直接的,而从主说话者到麦克风设备530A-B和530E-F的参考麦克风的音频路径被衰减。主要音频信号与参考音频信号之间的差异使之能够隔离主说话者的语音并且抑制远场噪声。将明白:取决于预期的噪声抑制等级以及所牵涉的麦克风的特定音频特征,任何单个麦克风设备530A-B和530E-F或麦克风设备530A-B和530E-F的组合可以被指定为相对于主桌面电话520A的参考麦克风。
根据实施例,分别位于隔间510K与隔间510J、510L和510P之间的周界参考麦克风设备550J、55L和550P围绕隔间510K中的主通信设备520K形成声学周界540B。参考麦克风设备550J、55L和550P位于将隔间510K与相邻隔间510J、510L和510P分隔开的隔间隔断上或其上方。如此一来,麦克风设备550J、55L和550P被定位成检测有可能被主通信设备520K的主要麦克风拾取的相邻隔间中的远场噪声。在实施例中,麦克风设备550J、55L和550P各自被指定为相对于主通信设备520K而言的参考麦克风。通过检测在主通信设备520K周围的远场噪声,麦克风设备550J、55L和550P可以定义声学周界540B。
除了选择参考麦克风设备530和550的放置以便定义恰当的声学周界之外,参考麦克风还可以被选择成具有特定极性。例如,架空参考麦克风530可以具有全向极性或定向极性。图6A-6C说明根据本发明的实施例的具有变化的方向性的麦克风。图6A说明根据实施例的全向麦克风610的图案的截面图。全向麦克风具有均匀的径向范围,即,它在所有的方向相等地感测声音。虽然在截面图中被显示为圆形,但是图案620的形状在三维中大致是球形。
图6B说明根据实施例的具有心形麦克风极性图案640的定向麦克风630的图案的截面图。正如本领域所明白的,心形麦克风被认为是“单向的”,这是因为与来自利用箭头660所示的零方向的声音相比,这些心形麦克风对于来自利用箭头650所示的主方向的声音具有显著更高的灵敏度。
图6C说明根据实施例的与声学屏障670结合使用的具有球形图案620的全向麦克风610。声学屏障670将麦克风610与在屏障的相对侧上的声音相隔离。声学屏障的使用允许全向麦克风610作为定向麦克风起作用,这是因为与零方向660 相比而言,该麦克风对于来自主方向650的声音具有显著更高的灵敏度。声学屏障可以被放置在声源与麦克风之间的任何点上,以便防止声源被麦克风检测到。例如,可以在架空参考麦克风设备与主通信设备之间使用声学屏障,以便降低被架空参考麦克风检测到的语音信号的量。
图7A-B说明根据本发明的实施例如何可以使用定向参考麦克风来相对于主通信设备的主要麦克风定义声学周界。图7A说明根据实施例的包括主通信设备720A的隔间710A的透视图。图7B说明根据实施例的隔间710A和相邻隔间710B-C的自上而下的视图。根据实施例,参考麦克风设备750A-C各自位于隔间710A的隔断墙上。参考麦克风设备750B和750C分别位于隔间710A与相邻隔间710B和710C之间。根据实施例,架空参考麦克风设备730A被悬挂在隔间710A上方的天花板上。分区参考设备750A-C以及架空参考设备730A一起定义声学周界740。
在实施例中,参考麦克风设备750A-C之中的每一个包含定向参考麦克风。在实施例中,每一个定向参考麦克风背对着隔间710A进行定向,以便检测在隔间710A外部的远场噪声。另外,架空参考麦克风设备730A包括向上且背对着隔间710A定向的定向参考麦克风。这可以帮助捕获源自隔间710A上方的源的远场噪声,诸如HVAC声音。定向麦克风可以被定向在声学周界之内或被定向在声学周界之内和之外二者,以便识别噪声源相对于主要麦克风的位置或接近度。
定向麦克风的使用可以使之能够定义与参考麦克风设备750A-C和730A的安置大致对准的声学周界740。然而,将明白:定向麦克风对于相对于主通信设备创建声学周界而言并不是必需的。此外,如上所讨论的,虽然在图7B中将声学周界740显示为二维线,但是在一些情况中声学周界可以被可视为表面封闭隔间710A。参考麦克风设备750A-C和730A可以包括任何合适的例如上面相对于图6B-C所讨论的定向麦克风。
在实施例中,周界参考麦克风设备750B包含在相反方向760A和760B中确定方位的至少两个定向麦克风。这可以使得该设备能够给相邻隔间中的每一个主通信设备提供单独的参考音频输入。例如,在参考麦克风设备750B中,第一定向参考麦克风设备可以在朝向隔间710B的方向720B中被确定方位,从而为主通信设备720B生成参考音频输入。参考麦克风设备750B中的第二定向参考麦克风可以在朝着隔间710A的方向720A中被确定方位,从而为主通信设备720B生成参考音频输入。在另一实施例中,并入定向麦克风的单独的参考麦克风设备可以用于每一个主通信设备。
图8说明根据本发明的实施例的声学周界840A和840B,其中每一个声学周界并入在通信设备820内包含的参考麦克风以及参考麦克风设备850和870。开放式办公环境800包括多个隔间或工作台810。根据实施例,每一个隔间810包括通信设备820。麦克风设备870B与辅助通信设备820B、820C和820F的组合围绕隔间810G中的第三主通信设备820G形成声学周界840A。麦克风设备870A-B位于走廊860中,以便捕获诸如语音、脚步、手推车、打印机等等之类的走廊噪声。辅助通信设备820B、820C和820F捕获可以被主通信设备820G检测到的在其相应隔间中的声音和噪声。
在另一实施例中,参考设备被包括在声学周界内,从而使之能够检测在声学周界之外和在声学周界之内的声音和噪声。在声学周界之外检测到的噪声可以与声学周界内的噪声不同地进行对待。例如,相对于来自声学周界之外的远场噪声,可以使用基于静音的本地谈话检测方法。在这种情况下,与定向在声学周界之外的参考麦克风相比,当在主要音频信号中没有识别出语音分量,则主要麦克风被静音。相反,对于被声学周界之内的参考麦克风检测到的噪声来说,可以从主要音频信号中减去远场噪声的估计,以便抑制噪声。将明白:相对于在声学周界之内和在声学周界之外检测到的噪声,可以使用其他恰当的噪声抑制方法。
参考图8,分区参考麦克风设备850K、850L、850N和850R连同辅助通信设备820J和820N一起相对于主通信设备820K定义声学周界840B。根据实施例,分区参考麦克风设备850K、850L、850N和850R以及辅助通信设备820J和820N之中的每一个包括生成参考音频输入信号的参考麦克风。参考麦克风设备850K、850L、850N、850R、820J和820N可以是定向的或全向的。在一个实施例中,在声学周界840B内的分区参考麦克风设备850P相对于主通信设备820K附加生成参考音频信号。通过将在声学周界之外的参考音频信号与来自声学周界内的参考音频信号进行比较,可以使用与用于抑制在声学周界之内检测到的噪声的噪声抑制方法不同的方法来抑制在声学周界之外检测到的噪声。
根据本发明的实施例,在块230,基于参考音频输入与主要音频输入的比较,生成具有抑制的远场噪声的音频输出。如上所讨论的,主要音频输入可以包括远场噪声(稳态背景声音和非稳态噪声)和主说话者/用户的语音。参考音频输入包括远场噪声。如此一来,通过将主要音频输入与参考音频输入进行比较,能够识别主要音频输入中的远场噪声部分。主要音频输入中的远场噪声部分随后可以被抑制,从而由此产生具有降低的背景声音和远场噪声的输出音频信号。在其公开的所有内容通过参考而被并入在此的题为“Far FieldNoise Suppression for Telephony Devices”的美国专利公开2014/0148224中描述用于通过比较主要音频信号和参考音频信号来抑制远场噪声的示例方法。
图9说明根据本发明的实施例的用于抑制音频信号中的远场噪声的方法900。根据本发明的实施例,在块910,确定静音阈值。静音阈值可以根据多个参考音频输入与主要音频输入的分析和比较来确定。在一个实施例中,主参考音频输入被识别。例如,通过从多个参考音频输入中选择具有最大数量的能量的参考音频输入,可以识别主参考音频输入。在一个实施例中,对于频率范围300Hz到5000Hz,每20毫秒确定能量。在一些实施例中具有最大能量的参考麦克风随后能够被挑选来与主麦克风进行比较。
根据本发明的实施例,主参考音频输入和主要音频输入随后各自被分解成许多子带。根据等式1,可以计算总和D2:
其中Xmain[i]是主要音频输入信号中的第i个子带能量,Xref[i]是参考音频输入信号中的第i个子带能量,并且ERL[i]是在主要音频输入与参考音频输入之间的第i个子带声学耦合,其被定义为在没有针对主要音频信号的活动的本地语音分量时比率Xmain[i]/Xref[i]的期望值。数量“P”是在计算总和D2中的子带数量。
在实施例中,主要音频输入信号与参考音频输入信号之间的声学耦合ERL[i]在音频频谱上大约是统一的(unity),以致D2是所有子带的比率之总和。在实施例中,主要音频输入信号的频谱能量在音频频谱上比参考音频输入信号大6-10dB。如此一来,静音阈值可以利用等式2来定义:
。
根据本发明的实施例,在块920,确定是否主要音频输入大于静音阈值。在块930,如果超出该阈值,则主要音频信号包括主说话者的语音并因此作为音频输出信号被传输。在块940,如果没有超出该阈值,则主要音频信号只包含远场噪声,并因此不传输它。如此一来,远场噪声在主要音频输出的部分中被抑制。
将明白:图9中的方法说明用于抑制输出音频信号中的远场噪声的方法的一个实施例。许多算法能够完成具有抑制的远场噪声的音频输出的生成。
上面的描述是说明性的而非限制性的。对于本领域技术人员来说,依据这个公开的仔细研究,本发明的众多变体将变得显而易见。本发明的范畴因此不应该参考上面的描述来确定,而是应该参考所附的权利要求书连同其全部范围的等价物一起来确定。