CN104769670A - 用于将参考音频信号提供给声学处理单元的装置和方法 - Google Patents
用于将参考音频信号提供给声学处理单元的装置和方法 Download PDFInfo
- Publication number
- CN104769670A CN104769670A CN201380058021.2A CN201380058021A CN104769670A CN 104769670 A CN104769670 A CN 104769670A CN 201380058021 A CN201380058021 A CN 201380058021A CN 104769670 A CN104769670 A CN 104769670A
- Authority
- CN
- China
- Prior art keywords
- sound signal
- interface
- microphone
- equipment
- slit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 123
- 238000000034 method Methods 0.000 title claims description 19
- 238000012545 processing Methods 0.000 title abstract description 43
- 238000001914 filtration Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 7
- 230000001629 suppression Effects 0.000 claims description 6
- 230000005055 memory storage Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000000712 assembly Effects 0.000 description 5
- 238000000429 assembly Methods 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明涉及一种设备,所述设备包括:用于与声音再现装置连接的第一接口和用于与至少一个麦克风连接的至少一个第二接口;以及声学处理单元,其适合于输出通过从所述第二接口接收的音频信号对参考音频信号的衰减或抑制而滤波的音频信号。在初始化阶段中,所述设备确定(405)传播延迟,并使用根据所确定的传播延迟限定的读取触发阈值来配置(406)缓冲器存储器。在标称操作阶段中,所述设备经由所述第一接口来发送第三音频信号,所述第三音频信号是经过存储器缓冲器之后的参考信号。
Description
本发明涉及包括用于与声音再现(reproduction)装置连接的第一接口和用于与至少一个麦克风连接的至少一个第二接口的设备(equipment),所述设备包括声学(acoustic)处理单元,所述声学处理单元适合于传送通过从经由所述第二接口接收的音频信号对参考音频信号的衰减或抑制而滤波的音频信号。
目前可以找到用于语音识别从而通过语音来控制设备的众多应用。困难在于能够从嘈杂的(noisy)环境辨别这些语音命令。
在电话会议领域中发现相同类型的问题。由于嘈杂的环境,可能有时难以清晰地辨别说话者的话语。
该嘈杂的环境经常与在电话会议期间或者在用户正在发送其语音命令时再现的音频或视听(audiovisual)内容有关。让我们以希望通过语音来控制的家庭剧场系统的情况为例。当家庭剧场系统正在操作时,在房间中可能利用高的音量来再现可听(audible)信号。对于该系统,则难以在这种情况下辨别语音命令。
存在用于使用借助于一个或更多个麦克风捕获的音频信号来抑制参考音频信号的组件。可基于这些组件在架子(shelf)上获得电子评估板。然而,这些组件和电子评估板不能实现在许多安装配置中获得满意的结果。这是因为,如果采取上述家庭剧场系统的示例,则从扬声器发出的可听信号在空气中的传播时间依赖于这些扬声器的实际位置,并且这些组件和电子板的配置经常不适当,这意味着这些组件不会在由麦克风捕获的音频信号中找到参考信号。
因此期望克服现有技术的这些缺点。
本发明涉及包括用于与声音再现装置连接的第一接口和用于与至少一个麦克风连接的至少一个第二接口的设备,所述设备包括声学处理单元,所述声学处理单元适合于传送通过根据经由所述第二接口接收的音频信号对参考音频信号的衰减或抑制而滤波的音频信号。所述设备是这样的:它包括用于实施初始化阶段的装置,用于实施所述初始化阶段的所述装置包括:用于确定第一音频信号经由所述第一接口的发送的时刻与第二音频信号经由所述第二接口的接收的时刻之间的传播等待时间(latency)的装置;以及用于将缓冲器配置成具有根据所述确定的传播等待时间限定的读取触发阈值的装置。所述设备是这样的:它还包括用于实施标称(nominal)操作阶段的装置,用于实施所述标称操作阶段的所述装置包括:用于经由所述第一接口发送第三音频信号的装置,所述第三音频信号是经过所述缓冲器之后的所述参考信号。
因此,能够使所述设备的配置完全适合于各种情况,在这些情况中,由于所述设备发送给再现装置的音频信号,必须在嘈杂的或者甚至非常嘈杂的环境中辨别用户的语音。
根据特定实施方式,所述第一音频信号由预定的模式(pattern)组成。
根据特定实施方式,用于确定所述传播等待时间的所述装置包括用于检测所述第二音频信号的幅度阈值的超过(crossing)的装置。
根据特定实施方式,用于确定所述传播等待时间的所述装置包括在所述第一音频信号与所述第二音频信号之间应用的North滤波器。
根据特定实施方式,用于实施所述初始化阶段的所述装置在与所述声学处理单元的输出端连接的控制单元中来实施以接收所述滤波的音频信号,并且,所述控制单元在所述初始化阶段期间使参考音频信号到所述声学处理单元的任何发送无效(deactivate)。
根据特定实施方式,用于实施所述初始化阶段的所述装置、所述第一接口和用于发送所述第三音频信号的所述装置在第一装置(103)中来实施,并且,所述声学处理单元和所述第二接口在用于与所述第一装置连接的第二装置(102)中来实施。
根据特定实施方式,所述麦克风是单向的,所述声学处理单元和所述麦克风在箱体(box)中来实施,对于每个麦克风,所述箱体包括第一狭槽和第二狭槽,并且,每个麦克风安装在支承件的腔中,在所述支承件中,也形成有第一狭槽和第二狭槽,并且当所述支承件安装在所述箱体中时,该第一狭槽和该第二狭槽设置成分别对应于所述箱体中的所述狭槽,所述支承件适合于使得所述第一狭槽与所述麦克风的设置在感兴趣的(favoured)可听信号的方向上的面之间的距离和所述第二狭槽与所述麦克风的相反(opposite)面之间的距离大致相等。
本发明还涉及一种由包括用于与声音再现装置连接的第一接口和用于与至少一个麦克风连接的至少一个第二接口的设备实现的方法,所述设备包括声学处理单元,所述声学处理单元适合于传送通过从经由所述第二接口接收的音频信号对参考音频信号的衰减或抑制而滤波的音频信号。所述方法是这样的:它包括初始化阶段,所述初始化阶段包括以下步骤:确定第一音频信号经由所述第一接口的发送的时刻与第二音频信号经由所述第二接口的接收的时刻之间的传播等待时间;以及将缓冲器配置成具有根据所述确定的传播等待时间限定的读取触发阈值。所述方法是这样的:它还包括标称操作阶段,所述标称操作阶段包括下列步骤:经由所述第一接口来发送第三音频信号,所述第三音频信号是经过所述缓冲器之后的所述参考信号。
本发明还涉及一种计算机程序,所述计算机程序可以存储到介质上和/或从通信网络下载,以便由处理器读取。该计算机程序包括用于在所述程序由所述处理器执行时实现上述方法中的任一种的指令。本发明还涉及包括这种计算机程序的存储装置。
本发明的上述特征以及其它特征将根据阅读示例实施方式的下列描述显得更清楚,所述描述与附图相关地给出,其中:
图1示意性地例示了可以实现本发明的系统;
图2A示意性地例示了图1的系统的源装置的硬件架构(architecture)的示例;
图2B示意性地例示了图1的系统的声学处理装置的硬件架构的示例;
图3示意性地例示了源装置的硬件架构的另一示例;
图4示意性地例示了用于初始化源装置的算法;
图5示意性地例示了源装置的标称操作的算法;
图6示意性地例示了可以安装有声学处理装置的箱体的壳体(shell)的简化立体图;
图7A示意性地例示了用于被设置在箱体中的麦克风支承件的立体图;
图7B示意性地例示了麦克风支承件的另一视图。
在其中再现装置用于以可听信号的形式再现由源设备提供的音频信号的系统中,提出实施初始化阶段,在该初始化阶段中,确定在音频信号通过源设备的发出与对应的可听信号通过用于在标称操作阶段中至少捕获用户的语音的至少一个麦克风的接收之间的传播等待时间。然后将缓冲器配置成具有根据所确定的传播等待时间限定的读取触发阈值。然后,在标称操作阶段中,当所述设备向再现装置发送音频信号时,所述设备还将所述音频信号发送给缓冲器,这因此导致了延迟。使用适合于传送通过从接收的音频信号对参考音频信号的衰减或抑制而滤波的音频信号的声学处理单元,来利用由该麦克风或多个麦克风捕获的内容作为输入并且利用通过所述缓冲器延迟的信号作为参考信号。
图1示意性地例示了可以实现本发明的系统。
图1中的系统包括音频或视听信号源装置103。根据第一示例,源装置103是数字解码器,该数字解码器适合于接收并解码来自卫星链路或以太网链路到家庭网关的视听信号,经由该家庭网关从互联网(Internet)接收视听内容。根据第二示例,源装置103是其上执行媒体播放器的Blu-Ray(注册商标)读取器或计算机。可以使用适合于提供用于由声音再现装置再现的音频信号的任何装置。
图1的系统还包括声音再现装置101,该声音再现装置101可以是视听再现装置。根据第一示例,声音再现装置101是包括集成扬声器的屏幕。根据第二示例,声音再现装置101是hi-fi放大器。
源装置103包括接口151,该接口151用于通过链路141与声音再现装置101连接。声音再现装置101包括接口110,该接口110用于经由链路141与源装置103连接。例如,链路141符合HDMI(高清晰度多媒体接口)、WHDI(无线家庭数字接口)、SPDIF(索尼(Sony)/飞利浦(Philips)数字互连格式)或者Peritel(注册商标)规范。因此,声音再现装置101能够再现从源装置103经由链路141接收的任何音频信号。
图1的系统还包括声学处理装置102和至少一个麦克风111、112。声学处理装置102包括适合于连接该麦克风或多个麦克风111、112的至少一个接口121、122。声学处理装置102因此能够接收与由该麦克风或多个麦克风111、112捕获的声音信号对应的音频信号。声学处理装置102还包括接口123,该接口123用于通过链路142与源装置103连接。源装置103包括接口153,该接口153用于经由链路142与声学处理装置102连接。例如,链路142符合HDMI、USB(通用串行总线)或者IEEE 1394规范。
麦克风111、112能够捕获声音环境、并且尤其是由再现装置101广播的声音信号以及系统的用户的语音。
源装置103和声学处理装置102可以包含在相同的箱体中,并且还可以在相同的印刷电路板(PCB)上来实施,链路142则是印刷电路板的迹线(track)。
图2A示意性地例示了源装置103的硬件架构的示例。
源装置103包括音频信号提供单元211,该音频信号提供单元211用于提供例如由对经由卫星链路接收的视听信号的解复用和解码所产生的音频信号。该音频信号被提供给接口151和源装置103的FIFO(先进先出)类型的缓冲器202的输入端。在初始化阶段期间,该音频信号还被提供给源装置103的控制单元203。在初始化阶段期间,来自接口153的另一音频信号也被提供给控制单元203。
音频信号提供单元211还可以包括生成器,该生成器根据预定的模式生成在初始化阶段期间可用的音频信号。
以下参照图4详细说明上述的初始化阶段,并且以下参照图5详细说明源装置103的后续的标称操作阶段。
源装置103包括处理单元212,该处理单元212用于对来自接口153的经滤波的音频信号施加处理。根据第一示例,处理单元212实施语音识别机制。根据第二示例,处理单元212实施用于在电话会议的情况下发送经滤波的音频信号的成形(shaping)机制。
图2B示意性地例示了声学处理装置102的硬件架构的示例。
声学处理装置102包括声学处理单元201,该声学处理单元201的功能是从第二音频信号抑制被称为参考信号的第一音频信号。参考音频信号由源装置经由链路142提供。第二音频信号是根据由麦克风111、112捕获的声音信号产生的音频信号。当在由所述麦克风捕获的信号中检测到该参考音频信号时,声学处理单元201则经由链路142向源装置103提供经滤波的音频信号(即,尽可能没有参考音频信号)。例如,声学处理单元201是来自Connexant公司的具有参考编号(reference)CX20708-21X的组件。
应当注意的是,声学处理单元201可以包括执行由该声学处理单元201期望的处理操作的内部缓冲器。然而,该内部缓冲器仅用于在预定的时间窗(例如,约200ms)期间存储音频信号,以便执行这些处理操作。没有读取触发阈值与该内部缓冲器关联并且不能被配置。
图2A和图2B分别是源装置103和声学处理装置102的硬件架构的补充的示例。可以设想所实现的功能的不同的分配。例如,可以在声学处理装置102中来实施控制单元203和/或FIFO 202。然而,根据图2A和图2B的布置具有以下的优点:使得能够容易更新例如在私人家庭中已经部署的提供音频或视听内容的装置。这是因为,以IP(互联网协议)电视的卫星解码器为例,这些卫星解码器通过软件实现了众多功能。于是容易升级该软件,以便实现本文中针对源装置103描述的功能。于是将该软件增加到声学处理装置102是足够的,以便实现本发明,而无需更换这些解码器的硬件平台。
将使用术语“设备”来指定实现这些功能的装置或者装置的集合。
图3示意性地例示了源装置103的硬件架构的另一示例,该源装置103则包括通过通信总线310连接的以下项:处理器或CPU(中央处理单元)300;随机存取存储器RAM 301;只读存储器302、存储单元或存储介质读取器(诸如硬盘驱动器HDD303);用于经由链路141进行通信的第一接口304;以及用于经由链路142进行通信的第二接口305。
应当注意的是,可以使用相似的硬件架构来实施声学处理装置102。
在图3中所示的架构的情况下,FIFO 202可以例如以连接列表(concatenated list)的形式在第二接口305内或者在RAM 301内来实施。
处理器300能够执行从ROM 302、从外部存储器(未示出)、从诸如硬盘驱动器HDD 303这样的存储介质或者从通信网络加载到RAM 301中的指令。当源装置103被通电时,处理器300能够从RAM 301读取指令并执行这些指令。这些指令形成计算机程序,该计算机程序使得由处理器300实施以下描述的算法和步骤的全部或某些。以下描述的算法和步骤的全部或某些可以以软件形式通过由诸如DSP(数字信号处理器)或微控制器这样的可编程机器执行指令集来实施,或者以硬件形式通过诸如FPGA(现场可编程门阵列)或ASIC(专用集成电路)这样的机器或专用组件来实施。
图4示意性地例示了实施源装置103的初始化阶段400的算法。
在步骤401中,源装置103经由接口151发送音频信号。该音频信号优选地对应于预定的模式。该音频信号也可以是对于源装置103事先(a priori)未知的,例如根据对由源装置103经由卫星链路接收的视听信号的解复用和解码所产生。在图2A中所示的架构中,源装置103还向控制单元203发送音频信号。
在接下来的步骤402中,源装置103确定表示源装置103已经经由接口151发送了音频信号的时刻的信息。由源装置103发送的音频信号因此被用于由再现装置101再现。再现装置101对由源装置103发送的音频信号进行解码并且生成对应的声音信号,麦克风111、112适合于捕获该声音信号。
在接下来的步骤403中,源装置103执行或者请求声音环境捕获。为了这样做,源装置103经由链路142指示声学处理装置102利用麦克风111、112开始声音环境捕获。在该初始化阶段期间,源装置103不经由接口153向声学处理装置102发送任何参考音频信号。声学处理装置102然后向源装置103直接重新发送与由麦克风111、112捕获的声音信号对应的音频信号,无需从由麦克风111、112捕获的声音信号抑制参考音频信号。在图2A中所示的架构中,源装置103将从声学处理装置102接收的音频信号发送给控制单元203。
在接下来的步骤404中,源装置103确定表示声学处理装置102利用麦克风111、112接收到音频信号的时刻的信息。可以认为,声学处理装置102利用麦克风111、112接收到音频信号的时刻与源装置103经由接口153接收到该音频信号的时刻相同。于是认为,由声学处理装置102执行的处理操作具有可忽略的等待时间。如果情况不是这样,则源装置103通过配置来获知该等待时间并因此可以将其考虑在内。
为了确定声学处理装置102利用麦克风111、112接收到音频信号的时刻,源装置103检测由接口153接收到的音频信号超过预定的阈值的时刻。源装置103然后认为,超过所述预定的阈值的该时刻是声学处理装置102利用麦克风111、112接收到音频信号的时刻。根据变型实施方式,源装置103进行经由接口151发送的音频信号与经由接口153接收的音频信号之间的关联(correlation),以便确定所发送的音频信号在接收到的音频信号中对应于哪个时间窗。为了这样做,可以应用也称为North滤波器的匹配滤波器。这种滤波器的使用有利地使信噪比最大化。可以使用其它的关联方法。
在接下来的步骤405中,源装置103确定表示传播等待时间的信息,该传播等待时间是声学处理装置102利用麦克风111、112接收到音频信号的时刻与源装置103经由接口151发送了音频信号的时刻之间的差。该传播等待时间利用分别在步骤404和步骤402中确定的信息来确定。
在接下来的步骤406中,源装置103确定表示待在源装置103的标称操作阶段期间实施的FIFO 202的触发阈值的信息。FIFO 202的该触发阈值根据在步骤405确定的传播等待时间来确定,并且使得能够对待经由接口153发送给声学处理装置102的参考音频信号应用延迟。如果忽略源装置103与声学处理装置102之间的传播时间,则该延迟等于在步骤405确定的传播等待时间。否则,该延迟等于从在步骤405确定的传播等待时间减去源装置103与声学处理装置102之间的传播时间的预定的值。
然后,源装置103配置FIFO 202,使得在标称操作阶段中应用在步骤405确定的触发阈值。然后结束初始化阶段,并且可以开始标称操作阶段。
源装置103可以例如通过用户接口的LED(发光二极管)向用户提供正在进行初始化阶段的指示。这可以使得用户能够知道他是否必须限制任何环境噪声,以便利于由源装置103期待返回的音频信号的检测。
在图2A中所示的架构中,由控制单元203执行步骤402、404、405和406。
图5示意性地例示了一旦执行了初始化阶段,源装置103的标称操作的算法。
在步骤501中,源装置103激活FIFO 202的填充(filling)。然后没有数据项存在于FIFO 202中。
在接下来的步骤502中,源装置103激活利用麦克风111、112进行的声音信号捕获。为了这样做,源装置103向声学处理装置102发送触发这种捕获的指令。然后由声学处理单元201接收与由麦克风111、112捕获的声音信号对应的音频信号。
在接下来的步骤503中,源装置103激活音频信号经由接口151到再现装置101的发送。例如通过对由源装置103接收或读取的视听内容的解复用和解码来产生该音频信号。源装置103已经激活了FIFO 202的填充,该音频信号还被存储到FIFO 202中。
在接下来的步骤504中,源装置103检查是否达到了在步骤406确定的FIFO 202的填充阈值。如果情况是这样,则执行步骤505,否则重复步骤504。
在步骤505中,源装置103激活FIFO 202的读取。在FIFO 202中存储的数据然后作为参考音频信号经由接口153被发送给声学处理装置102。FIFO 202的该读取以音频信号的数据被写入到FIFO 202的速率来进行。因此对由源装置103提供给声学处理装置102的音频信号施加时间延迟,调节该时间延迟的持续时间,以便补偿在步骤405确定的传播等待时间。
因此,由于该延迟的施加,使输入到声学处理单元201的音频信号充分同步,以使得声学处理单元202能够抑制来自与由麦克风111、112捕获的声音信号对应的音频信号的参考音频信号。以这种方式,提供给处理单元212的音频信号被滤波并且基本上没有与由再现装置101再现的音频信号对应的声音信号。然而,由于由麦克风111、112捕获的声音信号关于参考音频信号的失真,可能保留了少量的噪声。然后,当用户希望使用语音命令或者参与电话会议时,可以在音频信号中清晰地辨别出该用户的语音,即使再现装置101的音量高。
图6示意性地例示了可以安装有声学处理装置102的箱体600的壳体的简化立体图。
箱体600的壳体包括第一部件601和第二部件602。这两个部件601和602被用于例如通过粘附接合或者通过组装螺钉或者使用夹具来相互连接。
优选地,所述第一部件601用作用于所述第二部件602的盖(cover)。在图6中以虚线示出了该第一部件的外部厚度。声学处理装置102由电子板组成,实现前面描述的功能的组件安装在该电子板上。该电子板安装在所述第一部件601的内表面上。该电子板可以通过组装螺钉、铆钉或夹具与所述第一部件601组装在一起。
麦克风111、112也被集成在箱体600中,对于每个麦克风111、112,箱体600的壳体包括第一狭槽610和第二狭槽611。这些狭槽610、611使得麦克风111、112能够捕获声音环境,如以下针对图7A和图7B所描述的。在图6的示例中,狭槽610和611形成在所述壳体的所述第二部件602中。
图7A示意性地例示了用于被设置在箱体600中的麦克风支承件701的立体图。每个麦克风111、112则是单向的并且具有关联的支承件701。
用于以调整的方式接纳麦克风111或112的支承件701优选地由橡胶制造,以便使麦克风111或112与由箱体600的机械部件传递的振动隔离。例如使用来自MWMAcoustics公司的具有参考编号CM1045RFH-35BL-C56F1K-LF的麦克风。
在支承件701的一面上,形成有两个狭槽710、711,该两个狭槽710、711被用于在支承件701安装在箱体600中时分别设置成与在箱体600的壳体中形成的狭槽610、611匹配。
支承件701具有在狭槽710、711上形成并且用于接纳麦克风111或112的腔702。一旦安装在腔702中,就将麦克风111或112设置成使得麦克风111或112的在感兴趣的声音信号的方向上的面与狭槽711并且因此与狭槽611对齐(inline);此外,将麦克风111或112设置成使得麦克风111或112的和感兴趣的声音信号的方向相反的面与狭槽710并且因此与狭槽610对齐。在单向麦克风的典型设计中,与感兴趣的声音信号的方向相反的这个面包括孔(hole),该孔使得除了感兴趣的声音以外的声音(即,来自除了感兴趣的声音信号来自的方向以外的方向的声音)能够通过后部进入。换句话说,该孔在没有消除环境噪声的情况下使环境噪声衰减。然而为了这样做,有必要使来自箱体600的壳体中形成的狭槽和麦克风111、112的上述两个面的声音信号的传播时间大致相等,即,使这些狭槽与这些面之间的距离大致相等。支承件701的布置使得能够实现该目的。术语“大致”是指任何存在的差异对于麦克风的反应性是可忽略的。
至少一个麦克风111、112与如提出的支承件701的组合因此使得能够突出(highlight)在由单向麦克风111、112支持的方向上的声音信号(图1的系统中的用户的语音)。“突出”是指使用户的语音相对于声音环境中的其它声音突显出来。这利于由声学处理装置102执行的处理。
图7B示意性地例示了麦克风支承件701的另一视图。显然,在该视图中更显著的是,狭槽711优选地由台阶(step)或凹部(recess)形成。当支承件701安装在箱体600的壳体的第一部件601的内表面上的抵接部(abutment)中时,由此明确地形成了狭槽711。
应当注意的是,在不执行由源装置103和声学处理装置102执行的处理操作的情况下,可以使用支承件701将单向麦克风安装到箱体中。这使得能够改善用户的语音的显著性(prominence)。
Claims (10)
1.一种包括用于与声音再现装置连接的第一接口(151)和用于与至少一个麦克风(111、112)连接的至少一个第二接口(121、122)的设备(102、103),所述设备包括声学处理单元(201),所述声学处理单元(201)适合于传送通过从经由所述第二接口接收的音频信号对参考音频信号的衰减或抑制而滤波的音频信号,其特征在于,所述设备包括用于实施初始化阶段的装置,用于实施所述初始化阶段的所述装置包括:
用于确定第一音频信号经由所述第一接口的发送的时刻与第二音频信号经由所述第二接口的接收的时刻之间的传播等待时间的装置(405);
用于将缓冲器(202)配置成具有根据所确定的传播等待时间限定的读取触发阈值的装置(406);
并且,所述设备还包括用于实施标称操作阶段的装置,用于实施所述标称操作阶段的所述装置包括:
用于经由所述第一接口发送第三音频信号的装置(503),所述第三音频信号是经过所述缓冲器之后的所述参考信号。
2.根据权利要求1所述的设备,其特征在于,所述第一音频信号由预定的模式组成。
3.根据权利要求1和2中的任一项所述的设备,其特征在于,用于确定所述传播等待时间的所述装置包括用于检测所述第二音频信号的幅度阈值的超过的装置。
4.根据权利要求1和2中的任一项所述的设备,其特征在于,用于确定所述传播等待时间的所述装置包括在所述第一音频信号与所述第二音频信号之间应用的North滤波器。
5.根据权利要求1至4中的任一项所述的设备,其特征在于,用于实施所述初始化阶段的所述装置在与用于接收所滤波的音频信号的所述声学处理单元的输出端连接的控制单元中来实施,并且,所述控制单元使参考音频信号在所述初始化阶段期间到所述声学处理单元的任何发送停用。
6.根据权利要求1至5中的任一项所述的设备,其特征在于,用于实施所述初始化阶段的所述装置、所述第一接口和用于发送所述第三音频信号的所述装置在第一装置(103)中来实施,
并且,所述声学处理单元和所述第二接口在用于与所述第一装置连接的第二装置(102)中来实施。
7.根据权利要求1至6中的任一项所述的设备,其特征在于,所述麦克风是单向的,所述声学处理单元和所述麦克风在箱体中来实施,对于每个麦克风,所述箱体包括第一狭槽(610)和第二狭槽(611),
并且,每个麦克风安装在支承件(701)的腔(702)中,在所述支承件(701)中,也形成有第一狭槽(710)和第二狭槽(711),并且当所述支承件安装在所述箱体中时,所述第一狭槽(710)和所述第二狭槽(711)设置成分别对应于所述箱体中的所述狭槽,
所述支承件适合于使得所述第一狭槽与所述麦克风的设置在感兴趣的声音信号的方向上的面之间的距离和所述第二狭槽与所述麦克风的相反面之间的距离大致相等。
8.一种由包括用于与声音再现装置连接的第一接口(151)和用于与至少一个麦克风(111、112)连接的至少一个第二接口(121、122)的设备(102、103)实现的方法,所述设备包括声学处理单元(201),所述声学处理单元(201)适合于传送通过从经由所述第二接口接收的音频信号对参考音频信号的衰减或抑制而滤波的音频信号,其特征在于,所述方法包括初始化阶段,所述初始化阶段包括以下步骤:
确定(405)第一音频信号经由所述第一接口的发送的时刻与第二音频信号经由所述第二接口的接收的时刻之间的传播等待时间;
将缓冲器(202)配置(406)成具有根据所确定的传播等待时间限定的读取触发阈值;
并且,所述方法还包括标称操作阶段,所述标称操作阶段包括以下步骤:
用于经由所述第一接口发送第三音频信号的装置(503),所述第三音频信号是经过所述缓冲器之后的所述参考信号。
9.一种计算机程序产品,其特征在于,所述计算机程序产品包括用于在所述程序由设备的处理器执行时由所述设备实现根据权利要求8的所述方法的指令。
10.一种存储装置,其特征在于,所述存储装置存储有计算机程序,所述计算机程序包括用于当所述程序由设备的处理器执行时由所述设备实现根据权利要求8的所述方法的指令。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1258360A FR2995122B1 (fr) | 2012-09-06 | 2012-09-06 | Dispositif et procede pour fournir un signal audio de reference a une unite de traitement acoustique |
FR12/58360 | 2012-09-06 | ||
PCT/EP2013/067960 WO2014037283A1 (fr) | 2012-09-06 | 2013-08-30 | Dispositif et procédé pour fournir un signal audio de référence à une unité de traitement acoustique |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104769670A true CN104769670A (zh) | 2015-07-08 |
CN104769670B CN104769670B (zh) | 2019-05-14 |
Family
ID=47624211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380058021.2A Active CN104769670B (zh) | 2012-09-06 | 2013-08-30 | 包括第一接口和至少一个第二接口的设备、由该设备实现的方法、存储介质 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9412378B2 (zh) |
EP (1) | EP2893531B1 (zh) |
CN (1) | CN104769670B (zh) |
BR (1) | BR112015004905B1 (zh) |
FR (1) | FR2995122B1 (zh) |
WO (1) | WO2014037283A1 (zh) |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106790968A (zh) * | 2016-11-10 | 2017-05-31 | 环鸿电子(昆山)有限公司 | 一种手持式电子装置及其音量调节方法 |
CN107230478A (zh) * | 2017-05-03 | 2017-10-03 | 上海斐讯数据通信技术有限公司 | 一种语音信息处理方法及系统 |
CN113467715A (zh) * | 2015-09-08 | 2021-10-01 | 苹果公司 | 零延迟数字助理 |
CN113763978A (zh) * | 2021-04-25 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 语音信号处理方法、装置、电子设备以及存储介质 |
US11467802B2 (en) | 2017-05-11 | 2022-10-11 | Apple Inc. | Maintaining privacy of personal information |
US11538469B2 (en) | 2017-05-12 | 2022-12-27 | Apple Inc. | Low-latency intelligent automated assistant |
US11557310B2 (en) | 2013-02-07 | 2023-01-17 | Apple Inc. | Voice trigger for a digital assistant |
US11630525B2 (en) | 2018-06-01 | 2023-04-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US11675491B2 (en) | 2019-05-06 | 2023-06-13 | Apple Inc. | User configurable task triggers |
US11696060B2 (en) | 2020-07-21 | 2023-07-04 | Apple Inc. | User identification using headphones |
US11783815B2 (en) | 2019-03-18 | 2023-10-10 | Apple Inc. | Multimodality in digital assistant systems |
US11790914B2 (en) | 2019-06-01 | 2023-10-17 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11809886B2 (en) | 2015-11-06 | 2023-11-07 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11838579B2 (en) | 2014-06-30 | 2023-12-05 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US11837237B2 (en) | 2017-05-12 | 2023-12-05 | Apple Inc. | User-specific acoustic models |
US11838734B2 (en) | 2020-07-20 | 2023-12-05 | Apple Inc. | Multi-device audio adjustment coordination |
US11893992B2 (en) | 2018-09-28 | 2024-02-06 | Apple Inc. | Multi-modal inputs for voice commands |
US11900936B2 (en) | 2008-10-02 | 2024-02-13 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11907436B2 (en) | 2018-05-07 | 2024-02-20 | Apple Inc. | Raise to speak |
US11914848B2 (en) | 2020-05-11 | 2024-02-27 | Apple Inc. | Providing relevant data items based on context |
US11979836B2 (en) | 2007-04-03 | 2024-05-07 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US12001933B2 (en) | 2015-05-15 | 2024-06-04 | Apple Inc. | Virtual assistant in a communication session |
US12026197B2 (en) | 2017-05-16 | 2024-07-02 | Apple Inc. | Intelligent automated assistant for media exploration |
US12051413B2 (en) | 2015-09-30 | 2024-07-30 | Apple Inc. | Intelligent device identification |
US12067985B2 (en) | 2018-06-01 | 2024-08-20 | Apple Inc. | Virtual assistant operations in multi-device environments |
US12067990B2 (en) | 2014-05-30 | 2024-08-20 | Apple Inc. | Intelligent assistant for home automation |
US12118999B2 (en) | 2014-05-30 | 2024-10-15 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US12136419B2 (en) | 2023-08-31 | 2024-11-05 | Apple Inc. | Multimodality in digital assistant systems |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3402220A1 (en) * | 2017-05-11 | 2018-11-14 | Tap Sound System | Obtention of latency information in a wireless audio system |
US10867615B2 (en) | 2019-01-25 | 2020-12-15 | Comcast Cable Communications, Llc | Voice recognition with timing information for noise cancellation |
FR3105500B1 (fr) | 2019-12-20 | 2021-12-17 | Sagemcom Broadband Sas | Enceinte connectée comprenant une interface LAN et une interface WPAN |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0597201A1 (en) * | 1992-11-12 | 1994-05-18 | Motorola, Inc. | Apparatus and method for noise reduction for a full-duplex speakerphone or the like |
US5400399A (en) * | 1991-04-30 | 1995-03-21 | Kabushiki Kaisha Toshiba | Speech communication apparatus equipped with echo canceller |
EP0696126A1 (en) * | 1994-08-01 | 1996-02-07 | Motorola Inc. | Method and apparatus for estimating echo cancellation time |
US7190775B2 (en) * | 2003-10-29 | 2007-03-13 | Broadcom Corporation | High quality audio conferencing with adaptive beamforming |
CN102460567A (zh) * | 2009-04-28 | 2012-05-16 | 伯斯有限公司 | 声音相关的anr信号处理调节 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5365516A (en) * | 1991-08-16 | 1994-11-15 | Pinpoint Communications, Inc. | Communication system and method for determining the location of a transponder unit |
US5761638A (en) * | 1995-03-17 | 1998-06-02 | Us West Inc | Telephone network apparatus and method using echo delay and attenuation |
US8243937B2 (en) * | 2008-10-03 | 2012-08-14 | Adaptive Sound Technologies, Inc. | Adaptive ambient audio transformation |
-
2012
- 2012-09-06 FR FR1258360A patent/FR2995122B1/fr not_active Expired - Fee Related
-
2013
- 2013-08-30 EP EP13759465.1A patent/EP2893531B1/fr active Active
- 2013-08-30 WO PCT/EP2013/067960 patent/WO2014037283A1/fr active Application Filing
- 2013-08-30 BR BR112015004905-2A patent/BR112015004905B1/pt active IP Right Grant
- 2013-08-30 CN CN201380058021.2A patent/CN104769670B/zh active Active
- 2013-08-30 US US14/425,648 patent/US9412378B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5400399A (en) * | 1991-04-30 | 1995-03-21 | Kabushiki Kaisha Toshiba | Speech communication apparatus equipped with echo canceller |
EP0597201A1 (en) * | 1992-11-12 | 1994-05-18 | Motorola, Inc. | Apparatus and method for noise reduction for a full-duplex speakerphone or the like |
EP0696126A1 (en) * | 1994-08-01 | 1996-02-07 | Motorola Inc. | Method and apparatus for estimating echo cancellation time |
US7190775B2 (en) * | 2003-10-29 | 2007-03-13 | Broadcom Corporation | High quality audio conferencing with adaptive beamforming |
CN102460567A (zh) * | 2009-04-28 | 2012-05-16 | 伯斯有限公司 | 声音相关的anr信号处理调节 |
Non-Patent Citations (1)
Title |
---|
CHRISTINA BREINING 等: "Acoustic echo control. An application of very-high-order adaptive filters", 《IEEE SIGNAL PROCESSING MAGAZINE》 * |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11979836B2 (en) | 2007-04-03 | 2024-05-07 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US11900936B2 (en) | 2008-10-02 | 2024-02-13 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11557310B2 (en) | 2013-02-07 | 2023-01-17 | Apple Inc. | Voice trigger for a digital assistant |
US12009007B2 (en) | 2013-02-07 | 2024-06-11 | Apple Inc. | Voice trigger for a digital assistant |
US11862186B2 (en) | 2013-02-07 | 2024-01-02 | Apple Inc. | Voice trigger for a digital assistant |
US12067990B2 (en) | 2014-05-30 | 2024-08-20 | Apple Inc. | Intelligent assistant for home automation |
US12118999B2 (en) | 2014-05-30 | 2024-10-15 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11838579B2 (en) | 2014-06-30 | 2023-12-05 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US12001933B2 (en) | 2015-05-15 | 2024-06-04 | Apple Inc. | Virtual assistant in a communication session |
US11550542B2 (en) | 2015-09-08 | 2023-01-10 | Apple Inc. | Zero latency digital assistant |
CN113467715A (zh) * | 2015-09-08 | 2021-10-01 | 苹果公司 | 零延迟数字助理 |
US11954405B2 (en) | 2015-09-08 | 2024-04-09 | Apple Inc. | Zero latency digital assistant |
US12051413B2 (en) | 2015-09-30 | 2024-07-30 | Apple Inc. | Intelligent device identification |
US11809886B2 (en) | 2015-11-06 | 2023-11-07 | Apple Inc. | Intelligent automated assistant in a messaging environment |
CN106790968A (zh) * | 2016-11-10 | 2017-05-31 | 环鸿电子(昆山)有限公司 | 一种手持式电子装置及其音量调节方法 |
CN106790968B (zh) * | 2016-11-10 | 2021-01-15 | 环鸿电子(昆山)有限公司 | 一种手持式电子装置及其音量调节方法 |
CN107230478A (zh) * | 2017-05-03 | 2017-10-03 | 上海斐讯数据通信技术有限公司 | 一种语音信息处理方法及系统 |
US11467802B2 (en) | 2017-05-11 | 2022-10-11 | Apple Inc. | Maintaining privacy of personal information |
US11837237B2 (en) | 2017-05-12 | 2023-12-05 | Apple Inc. | User-specific acoustic models |
US11538469B2 (en) | 2017-05-12 | 2022-12-27 | Apple Inc. | Low-latency intelligent automated assistant |
US11862151B2 (en) | 2017-05-12 | 2024-01-02 | Apple Inc. | Low-latency intelligent automated assistant |
US12026197B2 (en) | 2017-05-16 | 2024-07-02 | Apple Inc. | Intelligent automated assistant for media exploration |
US11907436B2 (en) | 2018-05-07 | 2024-02-20 | Apple Inc. | Raise to speak |
US11630525B2 (en) | 2018-06-01 | 2023-04-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US12061752B2 (en) | 2018-06-01 | 2024-08-13 | Apple Inc. | Attention aware virtual assistant dismissal |
US12067985B2 (en) | 2018-06-01 | 2024-08-20 | Apple Inc. | Virtual assistant operations in multi-device environments |
US11893992B2 (en) | 2018-09-28 | 2024-02-06 | Apple Inc. | Multi-modal inputs for voice commands |
US11783815B2 (en) | 2019-03-18 | 2023-10-10 | Apple Inc. | Multimodality in digital assistant systems |
US11675491B2 (en) | 2019-05-06 | 2023-06-13 | Apple Inc. | User configurable task triggers |
US11790914B2 (en) | 2019-06-01 | 2023-10-17 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11914848B2 (en) | 2020-05-11 | 2024-02-27 | Apple Inc. | Providing relevant data items based on context |
US11838734B2 (en) | 2020-07-20 | 2023-12-05 | Apple Inc. | Multi-device audio adjustment coordination |
US11696060B2 (en) | 2020-07-21 | 2023-07-04 | Apple Inc. | User identification using headphones |
US11750962B2 (en) | 2020-07-21 | 2023-09-05 | Apple Inc. | User identification using headphones |
CN113763978B (zh) * | 2021-04-25 | 2024-05-03 | 腾讯科技(深圳)有限公司 | 语音信号处理方法、装置、电子设备以及存储介质 |
CN113763978A (zh) * | 2021-04-25 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 语音信号处理方法、装置、电子设备以及存储介质 |
US12136419B2 (en) | 2023-08-31 | 2024-11-05 | Apple Inc. | Multimodality in digital assistant systems |
Also Published As
Publication number | Publication date |
---|---|
EP2893531A1 (fr) | 2015-07-15 |
EP2893531B1 (fr) | 2018-05-30 |
US9412378B2 (en) | 2016-08-09 |
FR2995122B1 (fr) | 2015-09-04 |
WO2014037283A1 (fr) | 2014-03-13 |
FR2995122A1 (fr) | 2014-03-07 |
BR112015004905B1 (pt) | 2021-05-11 |
BR112015004905A2 (pt) | 2017-07-04 |
CN104769670B (zh) | 2019-05-14 |
US20150228282A1 (en) | 2015-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104769670A (zh) | 用于将参考音频信号提供给声学处理单元的装置和方法 | |
EP3128767B1 (en) | System and method to enhance speakers connected to devices with microphones | |
CN105814909B (zh) | 用于反馈检测的系统和方法 | |
EP3794589A1 (en) | Linear filtering for noise-suppressed speech detection | |
JP4792156B2 (ja) | マイクロホンアレイを有するボイス制御システム | |
CN101277331B (zh) | 声音再现设备和声音再现方法 | |
EP3857911A1 (en) | Linear filtering for noise-suppressed speech detection via multiple network microphone devices | |
US7889872B2 (en) | Device and method for integrating sound effect processing and active noise control | |
CN107004423A (zh) | 用于共享声学空间中的增强型交谈式通信的反馈消除 | |
US20090034750A1 (en) | System and method to evaluate an audio configuration | |
CN105794231A (zh) | 免提波束方向图配置 | |
US9942655B2 (en) | Sound processing | |
CA3193393A1 (en) | Intelligent setup for playback devices | |
EP2731360B1 (en) | Automatic audio enhancement system | |
CN107068164B (zh) | 音频信号处理方法、装置和电子设备 | |
JP7436564B2 (ja) | ヘッドホン、及びヘッドホン状態の検出方法 | |
JP2003510645A (ja) | 音声認識装置及び消費者電子システム | |
WO2017039575A1 (en) | Remote sensor voice recognition | |
WO2017000774A1 (zh) | 一种机器人自身音源消除系统 | |
US8249515B2 (en) | Mobile communication device with rotating earpiece | |
TWM526238U (zh) | 可依據使用者年齡調整等化器設定之電子裝置及聲音播放裝置 | |
JP2007104046A (ja) | 音響調整装置 | |
CN104242850A (zh) | 一种音频信号处理方法及电子设备 | |
US20160351192A1 (en) | Voice Recognition Device, Voice Control System And Voice Communication System | |
US11875769B2 (en) | Baby monitor system with noise filtering and method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |