CN107004425A - 共享声学空间中的增强型对话通信 - Google Patents

共享声学空间中的增强型对话通信 Download PDF

Info

Publication number
CN107004425A
CN107004425A CN201580066510.1A CN201580066510A CN107004425A CN 107004425 A CN107004425 A CN 107004425A CN 201580066510 A CN201580066510 A CN 201580066510A CN 107004425 A CN107004425 A CN 107004425A
Authority
CN
China
Prior art keywords
loudspeaker
microphone
signal
voice signal
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580066510.1A
Other languages
English (en)
Other versions
CN107004425B (zh
Inventor
萨米尔·库马尔·古普塔
阿西夫·伊克巴勒·穆罕默德
埃里克·维瑟
金莱轩
肖恩·威廉·范戴肯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN107004425A publication Critical patent/CN107004425A/zh
Application granted granted Critical
Publication of CN107004425B publication Critical patent/CN107004425B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

一种多声道声学系统MAS包括麦克风和扩音器的布置以及多声道声学处理器MAP以便一起增强例如汽车等共享声学空间中的两个或两个以上人之间的对话语音。所述增强通过以下操作实现:接收大体上源自相对靠近的声音源的声音信号;对所述声音信号进行滤波以消除针对来自所述多个麦克风的至少一个麦克风检测到的至少一个回波信号;对由所述多个麦克风接收的所述声音信号进行滤波以消除针对来自所述多个麦克风的至少一个麦克风检测到的至少一个反馈信号;以及在相对远离源麦克风的对应的扩音器子集上再现针对来自所述多个麦克风的每一麦克风的所述经滤波的声音信号。

Description

共享声学空间中的增强型对话通信
相关申请案的交叉参考
本申请案主张共同拥有的2014年12月12日申请的第62/091,367号美国临时专利申请案和2015年7月24日申请的第14/808,870号美国非临时专利申请案的优先权,以上申请案的内容全文明确地以引用的方式并入本文中。
背景技术
两个人之间的对话在共享声学空间中可能较困难,在共享声学空间中,其他人也在说话,存在其它噪声音源(语音和非语音),和/或另外环境的物理局限性使语音难以实现。举例来说,在移动的汽车的情境中,前排乘客座椅中的人可能难以容易地且清楚地与第三排乘客座椅中的人对话,因为车辆中的其他人(其可较接近前排座椅乘客或在前排座椅乘客和第三排座椅乘客之间)之间正发生语音。此外,移动车辆普遍的其它噪声音源(例如,引擎噪声、道路噪声、交通噪声、音乐等)也可使对话难以实现,这是因为环境的物理局限性,例如各方之间的距离以及前排座椅乘客远离第三排座椅乘客的定向(不考虑前排座椅乘客的身体和头部朝向车辆背后的不适和非安全转向)。
发明内容
本文中所揭示的各种实施方案是针对包括麦克风和扩音器的布置的多声道声学系统(MAS)连同多声道声学处理器(MAP)一起来增强共享声学空间中两个或两个以上人之间的对话语音。若干此类实施方案特定地针对MAS到汽车中的集成。其它实施方案是针对MAS到其它形式的交通工具(例如,飞机、火车、摩托车、船等)中的集成。另外其它实施方案是针对非交通共享声学空间,例如剧院、会议室、演示厅,和其中可能利用公共地址系统的任何其它位置。
各种此类实施方案是针对增强车辆的共享声学空间中的对话语音,所述车辆具有在所述共享声学空间内操作的多声道声学系统,所述多声道声学系统包括多个麦克风和多个扩音器,所述车辆具有包括至少第一区和第二区的多个区,所述方法包括:在遍及共享声学空间分布的所述多个麦克风处接收大体上源自第一区声音源的声音信号;在多个可调适声音滤波器处对所述声音信号进行回波滤波以消除至少一个回波信号;在所述多个可调适声音滤波器处对所述声音信号进行反馈滤波以消除至少一个反馈信号,所述反馈滤波在所述回波滤波之前或之后发生;以及在第二区中的扩音器的子集上再现经滤波的声音信号。对于若干此类实施方案,多声道声学系统使就座在对应于第一区的车辆前排中的第一乘客能够与就座在对应于除第一排外的排的第二区中的第二乘客对话,和/或基于预定回波消除校准执行所述至少一个回波信号的消除。对于选定实施方案,预定回波消除校准为来自多个预定回波消除校准的一者,其中所述预定回波消除校准中的每一者基于不同乘客配置而执行。
对于特定实施方案,来自所述多个可调适声音滤波器的每一滤波器经配置以:在每一滤波器处接收既定用于在第二区中的至少一个扩音器上再现且由第一区中的至少一个麦克风检测的声音信号;在每一滤波器处接收来自第二区中的至少一个麦克风的评估信号,所述评估信号对应于所述所接收的声音信号;在滤波器处且基于所述所接收的评估信号确定所述声音信号包含反馈信号;消除所述反馈信号;以及将经滤波的声音信号发送到第二区中的至少一个扩音器。对于此类实施方案的子集,来自所述多个可调适声音滤波器的每一滤波器耦合到第一区中的至少一个麦克风、第二区中的至少一个扩音器,和第二区中的至少一个辅助麦克风,其中麦克风、扩音器和辅助麦克风的每一组合针对来自所述多个可调适声音滤波器的每一滤波器是不同的。
对于若干实施方案,所述多个麦克风包括多个定向麦克风,且由来自所述多个扩音器的每一扩音器再现的声音信号限于与每一此类扩音器相同的区中的收听者。
提供此概述是为了以简化形式引入下文在详细描述内容中进一步描述的概念的选择。此概述并非意图识别所主张的标的物的关键特征或基本特征,也并非意图用于限制所主张的标的物的范围。
附图说明
当结合附图阅读时,更好地理解前述概述以及说明性实施例的以下详细描述。出于说明实施例的目的,图式中展示实施例的实例构造;然而,所述实施例不限于所揭示的特定方法和工具。在图式中:
图1是说明其中可实施本文所揭示的各种实施方案的示范性共享声学空间100(具体地说,具有布置成三排的七个座椅的汽车)的框图;
图2是说明并入有表示本文所揭示的各种实施方案的多声道声学系统(MAS)的图1的汽车的共享声学空间的框图;
图3是说明一起工作以执行表示本文所揭示的各种实施方案并由所述实施方案利用的(半双工)串扰消除技术的系统组件的框图;
图4是说明一起工作以执行表示本文所揭示的各种实施方案并由所述实施方案利用的全双工串扰消除技术的系统组件的框图;
图5是执行表示本文所揭示的各种实施方案的MAS的共享声学空间中的串扰消除的方法的过程流程图;
图6是用于将图5中所说明的半双工处理延伸到表示本文所揭示的各种实施方案的全双工处理的过程流程图;
图7是由包括多个麦克风、多个扩音器以及多个回波消除和反馈消除滤波器且表示本文所揭示的若干实施方案的多声道声学系统所执行的用于增强共享声学空间(例如图1和2中所说明的汽车的共享声学空间)中的对话语音的方法的过程流程图;
图8是表示本文所揭示的实施方案的对原本将由共享声学空间中的多个扩音器产生的回波信号(例如在自适应声音滤波器处)进行滤波或消除的方法的过程流程图;
图9是表示本文所揭示的实施方案的对来自从共享声学空间中的麦克风接收到的将由同一共享声学空间中的远扩音器再现的声音信号的反馈信号(例如在自适应声音滤波器处)进行滤波或消除的方法的过程流程图;
图10是说明其中可实施(至少部分地)本文所揭示的各种实施方案的方面的无线通信装置的一个配置的框图;以及
图11说明可包含在用于实施(至少部分地)本文所揭示的各种实施方案的电子装置内的某些组件。
具体实施方式
除非通过其上下文明确限制,否则在本文中使用术语“信号”来指示其一般含义中的任一者,包含如在导线、总线或其它发射媒体上表达的存储器位置的状态(或存储器位置的集合)。除非通过其上下文明确地限制,否则在本文中使用术语“产生”来指示其一般含义中的任一者,例如计算或以其它方式产生。除非通过其上下文明确限制,否则在本文中使用术语“计算”来指示其一般含义中的任一者,例如计算、评估、估计,和/或从多个值进行选择。除非通过其上下文明确限制,否则术语“获得”用以指示其一般含义中的任一者,例如计算、导出、接收(例如从外部装置)和/或检索(例如从存储元件阵列)。除非通过其上下文明确限制,否则使用术语“选择”来指示其一般含义中的任一者,例如识别、指示、应用和/或使用一组两个或两个以上中的至少一者和少于所有者。在本发明描述及权利要求书中使用术语“包括”时,并不排除其它要素或操作。使用术语“基于”(如在“A是基于B”中)来指示其一般含义中的任一者,包含情况(i)“从...导出”(例如“B是A的前驱体”),(ii)“至少基于”(例如“A至少是基于B”),且如果在特定上下文中适当,(iii)“等于”(例如“A等于B”或“A与B相同”)。类似地,使用术语“响应于”来指示其一般含义中的任一者,包含“至少响应于”。对麦克风的“位置”的参考指示所述麦克风的声学敏感面的中心的位置,除非上下文另有指示。根据特定上下文,有时使用术语“通道”来指示信号路径且在其它时候指示由此路径携载的信号。
此外,除非另有指示,否则对具有特定特征的设备的操作的任何揭示内容也明确地希望揭示具有类似特征的方法(且反之亦然),且对根据特定配置的设备的操作的任何揭示也明确地希望揭示根据类似配置的方法(且反之亦然)。术语“配置”可参考由其特定上下文指示的方法、设备和/或系统来使用。除非特定上下文另有指示,否则术语“方法”、“过程”、“程序”及“技术”通用地且可互换地使用。除非特定上下文另有指示,否则术语“设备”与“装置”也通用地且可互换地使用。术语“元件”和“模块”通常用以指示较大配置的一部分。除非通过其上下文明确地限制,否则术语“系统”在此用以指示其一般含义中的任一者,包含“相互作用以用于共同目的的元件群组”。
通过参考文献的一部分的任何并入也应理解为并入在所述部分内参考的术语或变量的定义(其中此些定义出现在文献中的其它地方),以及在所并入部分中参考的任何图式。除非起初通过定冠词引入,否则用于修饰权利要求要素的序数术语(例如,“第一”、“第二”、“第三”等)本身不指示所述权利要求要素相对于另一权利要求要素的任何优先级或次序,而是仅区别所述权利要求要素与具有同一名称(如果没有序数术语)的另一权利要求要素。除非其上下文明确地限制,否则本文使用术语“多个”和“组”中的每一者来指示大于一的整数数量,而本文使用术语“子集”来指示大于或等于一的整数数量。
可通过以下操作实现增强共享声学空间中的对话语音:在遍及共享声学空间分布的所述多个麦克风处接收大体上源自相对近的声音源的声音信号;在多个可调适声音滤波器处对由所述多个麦克风接收的声音信号进行滤波以消除针对来自所述多个麦克风的至少一个麦克风检测到的至少一个回波信号;在多个可调适声音滤波器处对所述多个麦克风接收的声音信号进行滤波以消除针对来自所述多个麦克风的至少一个麦克风检测到的至少一个反馈信号;以及在来自遍及共享声学空间分布的所述多个扩音器的扩音器的子集上再现来自所述多个麦克风的每一麦克风的经滤波的声音信号,其中针对每一麦克风,扩音器的子集对应于一或多个相对远的扩音器。
增强对话语音可用于“针对人的交通车辆”(例如,汽车)的内部乘客室,或非交通共享声学空间。对于此类汽车和相关实施方案,所述多个麦克风和所述多个扩音器可遍及共享声学空间相对于车辆的乘客座椅分布,且此类实施方案可借此使就座在汽车前排中的第一乘客能够与就座在除汽车的第一排外的排中的第二乘客对话。
消除回波信号还可基于预定回波消除校准执行,且此预定回波消除校准可为来自基于不同乘客配置预先确定(或执行)的多个预定回波消除校准的一者。
可调适声音滤波器可用于反馈消除,其中每一滤波器经配置以:接收由来自所述多个麦克风的麦克风检测到的声音信号,所述声音信号既定用于来自多个扩音器的相对远的扩音器;从相对靠近远扩音器的第二麦克风接收评估信号,所述评估信号对应于所述声音信号;基于所述所接收的评估信号确定所述声音信号包含反馈信号;以及消除所述反馈信号;以及将经滤波的声音信号发送到相对远的扩音器。此外,对于选定实施方案,来自所述多个可调适声音滤波器的每一滤波器可耦合到来自所述多个麦克风的麦克风、来自多个扩音器的相对远离所述麦克风的扩音器,以及来自所述多个麦克风的相对靠近所述扩音器并相对远离所述麦克风的第二麦克风,其中麦克风、扩音器和第二麦克风的每一组合对于来自所述多个滤波器的每一滤波器是不同的(即,每一者对应于乘客的不同配置)。
可能针对所述多个麦克风利用定向麦克风,且一些实施方案可经配置使得由来自所述多个扩音器的每一扩音器再现的声音信号限于相对靠近每一此扩音器的收听者。
图1是示范性共享声学空间100的说明,具体地说,具有布置成三排106a到106c的七个座椅104a到104g的汽车102的内部乘客室。如图1中所说明,在任何给定时间(或旅行)的乘客的总数可在配置(即,坐)在有限数目的相对固定位置中的一个到七个变动。因此,物理就座配置(即,所占用座椅与未占用座椅)的数目是有限且受限的,且此共享声学空间100是界限分明的。
举例来说,在如图1中所说明的一个配置中,四个乘客112a到112d可占用座椅104a(其在针对汽车102展示的配置中是驾驶员座椅)、104b(用于前排座椅乘客)、104d(针对中间排中心座椅乘客),以及104g(针对车辆右侧的第三排座椅乘客)。此外,因为此共享声学空间100是汽车102,因此乘客112a-112d通常面向前(即,朝向车辆的前面)。出于此原因,乘客112d可具有清楚且容易地倾听乘客112b的困难时间。由此,乘客112b和112d可能难以彼此对话,且此情形可能因为来自其他乘客的噪声、车辆的引擎和移动、在中心提供的音乐等而恶化。
图2说明并入有表示本文所揭示的各种实施方案的多声道声学系统(MAS)的图1的汽车102的共享声学空间100。如所说明,汽车102的共享声学空间100进一步包括多个麦克风202a-202g,以及扩音器204a-204h,其为MAS的可见或暴露组件,其以通信方式耦合到遍及车辆集成(且因此未图示)的多声道声学处理器(MAP),所述多声道声学处理器处理声音输入,且产生增强型输出以实现改进的声学体验。对于本文所揭示的各种实施方案,MAP用以通过采取在麦克风202a-202g中的一或多者处作为输入接收的从车辆的任何部分产生的声音且在车辆的其它部分中的扩音器204a-204h的集合或子集上再现这些声音,来平衡跨越车辆的声音。
扩音器可布置在例如图2中说明的7.1环绕声系统布置等若干不同配置中的任一者中。此外,所述多个麦克风202a-202g和所述多个扩音器204a-204h可能以通信方式耦合到位于车辆中任何地方的单一位置中的集中式MAP。此外,在替代的实施方案中,MAP可能实际上远程定位且通过无线手段连接。无论如何,MAP以操作方式耦合到各种输入,且产生增强型输出用于改进声学体验(例如,所听到的语音的增强的清晰度、来自多余的背景噪声的较少刺激,等等)。
对于某些实施方案,每一排中的所述对扩音器(例如第一排106a中的扩音器204a和204b)可提供用于音乐播放器的立体声输出,且对于某些其它实施方案,所述组六个扩音器204a-204h一起操作,以向乘客提供音乐的环绕声、电影声道,或其它环绕声媒体。同样地,对于某些实施方案(且如图2所示),可为驾驶员提供一个以上麦克风,例如麦克风202a和202g,和/或不专门为座椅104d(中间排中心座椅)中的乘客112c提供麦克风,其可改为利用麦克风202c和202d两者,其中MAS能够使用这两个麦克风来服务第二排106b中的所有三个就座位置(且同样地,如果将具有第三中间座椅,那么用于其它排)。
然而,应注意,与多个扩音器共享的声学空间中多个麦克风的使用可导致非所要的回波和反馈效应。
大体来说,回波(也被称作“环绕声回波”)由从不同扩音器发射的特定声音行进不同路径且在不同时间到达收听者借此产生双重、重复或模糊音效所依据的任何条件产生。对于多扩音器系统,每一扩音器高效地促成回波效应,因为由每一扩音器产生的声音将在某一程度上行进唯一声学路径,然后到达收听者的耳朵。此外,尽管回波效应的发生并不需要麦克风,但对于采用多个麦克风的本文中所揭示的各种实施方案,这些各种麦克风可部分检测这些声音且以进一步增强回波效应(与本文稍后论述的任何反馈效应相异且分离)的方式在一或多个扩音器处再现这些声音。
为补偿回波效应,且对于本文所揭示的特定实施方案,一个方法为MAS相对于声学空间内发现的特定目标收听位置从扩音器中的每一者主动地习得声学路径。此有效方法可包括校准模式,其在每一扩音器处个别地产生一或多个测试声音,使用一或多个麦克风测量这些声音,且相对于目标收听位置针对每一此类扩音器确定习得的声学路径。MAS可随后通过使用习得的声学路径混合个别测试声音信号来产生单声道远端参考信号此单声道远端参考信号可随后用于通过恰当地修改(延迟、安静等)每一扩音器产生的声音信号以高效地消除回波来消除所述回波。
此外,举例来说,由于七座椅环境中一个人与七个人之间的有限配置,有可能回波效应基于人的每一不同配置而不同。因此,对于选定实施方案,MAS可习得各种回波取消方案,针对每一配置一个,且接着当对于其确定的特定配置再次发生时使用本文稍后论述的主动或被动配置确定技术部署先前习得的回波消除方案。
此外,对于选定实施方案,还可针对每一配置基于不同目标收听位置作出回波效应校准,所述不同目标收听位置对应于特定有利的目标座椅位置(例如,驾驶员座椅)或有利于基于各种准则(例如,当对应座椅被占用时)自动选择的特定座椅位置(例如,驾驶员座椅和前排乘客的座椅之间)的子集的目标位置,或对于特定实施方案,可能由驾驶员或乘客相应地直接可选择。且对于一些实施方案,可基于一或多个乘客的特定身份(例如,车辆所有者或“VIP乘客”)(基于其在车辆内的位置)选择特定配置,所述身份由系统使用本文稍后论述的主动或被动识别确定技术自动确定。
另一方面,当音频输入(例如,麦克风)和音频输出(例如,扩音器)之间存在声音回路时发生反馈(或“声学正反馈”)。举例来说,麦克风接收到的信号可放大并从扩音器穿出。来自扩音器的声音可随后再次由麦克风接收、进一步放大,且接着再次通过扩音器穿出。所得声音的频率由麦克风、放大器和扩音器中的谐振频率、房间的声学、麦克风和扩音器的定向拾取和发射模式以及其间的距离确定。对于小公共地址(PA)系统,声音容易被辨识为大声啸叫、尖叫或嚎叫声音。
一种用于减少反馈的方法是利用可仅拾取受限范围((例如,小于到任何扩音器的距离的范围)内的声音的低灵敏度定向麦克风的选择性输入技术。这种解决方案对于其中所利用的麦克风为由例如经设计以接近人的嘴巴操作(或当与由扩音器产生的声音相比语音在近得多的近程内发起时)的个人通信装置提供的那些麦克风的共享声学空间可以是有用的。
当人和麦克风与扩音器和麦克风之间的距离的差异不是显著的(其通常是不靠近嘴使用(例如那些建构到汽车中的麦克风,如图2所示)的相对受限共享声学空间和/或麦克风的情况)时,一种用于减少反馈的更有效方法是其中当在一附近麦克风(或若干附近麦克风)处接收到时扩音器不再现声音的选择性再现。举例来说,对于图2的扩音器204a,由附近麦克风202a和/或202g接收到的声音可能不在此扩音器204a上再现,从而减少可能的反馈;然而,来自扩音器204a的声音仍可在远麦克风202e处接收,其仍可能在扩音器204a上再现,从而导致反馈。
用于减少扩音器(例如,扩音器204a)上的产生于可能仍检测由主体扩音器204a产生的声音(确切地说,响亮的声音)的远麦克风(例如,麦克风202e)的反馈且可单独或结合先前段落中描述的选择性输入方法使用的替代方法为本申请案的串扰消除技术。串扰消除使用扩音器附近的麦克风(例如麦克风202a)来收集扩音器(包括产生声音信号以及附近麦克风202a可检测的任何其它声音的扩音器204a)的参考声音输出,所述参考声音输出接着可用以前瞻性地确定和滤除原本可针对扩音器204a且在其上再现的远麦克风202e的相同声音输出(且到由所述远麦克风检测的程度)。
用于扩音器204a的附近麦克风202a所收集的参考声音输出是自动排除由扩音器204a在上文描述的选择性再现技术中直接再现的相同输出。
图3是说明一起工作以执行表示本文所揭示的各种实施方案并由所述实施方案利用的串扰消除技术的系统组件的框图300。图3中(且参考图1和2),扩音器204a产生声音信号,其由附近麦克风202a检测以产生发送到自适应滤波器302a的参考声音输出。所述声音信号还至少部分地由远麦克风202e检测,且此部分检测到的声音通常将(连同也由麦克风202e检测到的本地声音)发送到扩音器204a并再现(产生反馈)。然而,自适应滤波器302a使用附近麦克风202a所检测到的参考声音输出,滤出部分检测到的声音,使得仅远麦克风202e所检测到的本地声音在扩音器204a上再现。
对于某些实施方案,所述自适应滤波器可为固定的经校准滤波器。举例来说,在共享声学空间中仅具有两个固定麦克风和两个固定扩音器的实施方案中,固定的经校准滤波器可事先在其中每一扩音器正播放且由每一麦克风捕获的校准模式期间配置,以确定所述系统随后将执行消除。使用固定的经校准滤波器来执行串扰消除不限于仅汽车情境,而是可在对应于共享声学空间的任何相对固定环境中利用。因此,针对本文所揭示的各种实施方案的自适应滤波器的任何使用应理解为还实现固定的经校准滤波器的使用,且供在特征为麦克风和扩音器的固定配置的共享声学空间中使用(但不限于此)。
图3中说明的串扰消除是半双工(仅在一个方向上操作),但可扩展到用于分别在每一麦克风附近的两个人之间的双向对话的全双工。此外,对于具有多个麦克风和多个扩音器的共享声学空间,可针对扩音器、附近麦克风和远麦克风的每一组合,形成类似的全双工串扰消除配置。在这些各种实例中,从收听者的角度来看,所得“消除”导致减弱或减少的串扰以实现较高音质。
图4是说明一起工作以执行表示本文所揭示的各种实施方案并由所述实施方案利用的全双工串扰消除技术的系统组件的框图。与在图3中一样,此处在图4中,扩音器204a产生声音信号,其由附近麦克风202a检测到以产生发送到自适应滤波器302a的参考声音输出。所述声音信号还至少部分地由远麦克风202e检测,且发送到自适应滤波器302a,自适应滤波器302a使用附近麦克风202a所检测到的参考声音输出,滤除部分检测到的声音,使得仅远麦克风202e所检测到的本地声音在扩音器204a上再现。另外,扩音器204e产生单独声音信号,其由麦克风202e(此上下文中为附近麦克风)检测到以产生发送到自适应滤波器302e的单独参考声音输出。此单独声音信号还至少部分地由麦克风202a(在此上下文中为远麦克风)检测,且发送到自适应滤波器302e,自适应滤波器302e接着使用所述参考声音输出,滤除部分检测到的声音,使得仅远麦克风202a所检测到的本地声音在扩音器204e上再现。
图5是执行表示本文所揭示的各种实施方案的MAS的共享声学空间中的串扰消除的方法的过程流程图500。在图5中,在502处,MAS在第一扩音器处产生第一组声音信号。在504处,MAS在相对靠近所述第一扩音器的第一麦克风处,检测第一组声音信号。在506处,MAS通过第一麦克风,将第一组声音信号发送到第一自适应滤波器,作为第一参考声音输出。在508处,MAS在第一自适应滤波器处接收相对远离第一扩音器的第二麦克风检测到的第二组声音信号,所述第二组声音信号包括由第二麦克风检测到的所述第一组声音信号的分量。在510处,MAS在第一自适应滤波器处,对第二组声音信号进行滤波,以消除第一组声音信号的包含于第二组声音信号中的分量,所述滤波是基于从第一麦克风接收到的第一参考声音输出。在512处,MAS通过第一自适应滤波器将经滤波的第二组声音信号发送到第一扩音器。在514处,MAS在第一扩音器处,产生经滤波的第二组声音信号。
图6是用于将图5中所说明的半双工处理扩展到表示本文所揭示的各种实施方案的全双工处理的过程流程图600。在图6中(且从图5中的过程流程的结尾继续),在616处,MAS在相对靠近第二麦克风且相对远离第一麦克风的第二扩音器处,产生第三组声音信号。在618处,MAS在第二麦克风处,检测第三组声音信号,且在620处,MAS通过第二麦克风,将第三组声音信号发送到第二自适应滤波器,作为第二参考声音输出。在622处,MAS在第二自适应滤波器处,接收第一麦克风所检测到的第四组声音信号,所述第四组声音信号包括由第一麦克风检测到的第三组声音信号的分量。在624处,MAS在第二自适应滤波器处,对第四组声音信号进行滤波,以消除第三组声音信号的包含于第四组声音信号中的分量,所述滤波是基于从第二麦克风接收到的第二参考声音输出。在626处,MAS通过第二自适应滤波器将经滤波的第四组声音信号发送到第二扩音器。在628处,MAS在第二扩音器处,产生经滤波的第四组声音信号。
对于若干实施方案,所述自适应滤波器可仅操作以在参考声音输入较响且声音信号较软(不响)时,将参考声音输出从对应的接收到的声音信号滤除。举例来说,对于某些实施方案,可适应滤波器可量化参考声音输入的声学转移函数,量化声音信号的声学转移函数,且在前者与后者的比率超过预定阈值的情况下,仅接着基于参考声音输入对声音信号进行滤波。对于其它实施方案,前述比率可改为用以执行与所确定的比率成比例的部分滤波。在另外其它实施方案中,当参考声音输入的声学转移函数超过“响”的预定义最大阈值时,当声学转移函数声音信号超过“软”的预定义最小阈值时,或这两者时,还可能仅应用滤波(通过包含两个先前所描述的技术的任何技术)。
图7是由包括多个麦克风、多个扩音器以及多个回波消除和反馈消除滤波器且表示本文所揭示的若干实施方案的多声道声学系统所执行的用于增强共享声学空间(例如图1和2中所说明的汽车102的共享声学空间100)中的对话语音的方法的过程流程图700;在图7中,方法在710处开始,其中在遍及共享声学空间分布的所述多个麦克风处接收大体上源自相对于每一麦克风的附近声音源的声音信号。在720处,使用多个可调适声音滤波器(或其它回波消除装置)来对声音信号进行滤波,以消除确定在声音信号中的回波信号。在730处,使用多个可调适声音滤波器(或其它反馈消除装置)来对声音信号进行进一步滤波,以消除在声音信号中检测到的反馈信号。在740处,在来自遍及共享声学空间分布的所述多个扩音器中的扩音器子集上再现经滤波的声音信号,所述扩音器子集仅对应于相对不在每一源麦克风附近(即,相对远离)的那些扩音器。
因此,如图7中所说明,可通过以下操作由本文中所揭示的各种实施方案实现增强车辆的共享声学空间中的对话语音,所述车辆具有在所述共享声学空间内操作的多声道声学系统,所述多声道声学系统包括多个麦克风和多个扩音器,所述车辆具有包括至少第一区和第二区的多个区:在遍及共享声学空间分布的所述多个麦克风处接收大体上源自第一区声音源的声音信号;在多个可调适声音滤波器处对所述声音信号进行回波滤波以消除至少一个回波信号;在所述多个可调适声音滤波器处对所述声音信号进行反馈滤波以消除至少一个反馈信号,所述反馈滤波在所述回波滤波之前或之后发生;以及在第二区中的扩音器的子集上再现经滤波的声音信号。此使得就座在对应于第一区的车辆前排中的第一乘客能够与就座在对应于除第一排外的排的第二区中的第二乘客对话,且反之亦然。可基于预定回波消除校准执行所述至少一个回波信号的消除,且此还可包含所述预定回波消除校准为来自多个预定回波消除校准的一者,其中预定回波消除校准中的每一者基于不同乘客配置执行。
此外,来自所述多个可调适声音滤波器的每一滤波器还可经配置以:在每一滤波器处接收既定用于在第二区中的至少一个扩音器上再现且由第一区中的至少一个麦克风检测的声音信号;在每一滤波器处接收来自第二区中的至少一个麦克风的评估信号,所述评估信号对应于所述所接收的声音信号;在滤波器处且基于所述所接收的评估信号确定所述声音信号包含反馈信号;消除所述反馈信号;以及将经滤波的声音信号发送到第二区中的至少一个扩音器。此外,来自所述多个可调适声音滤波器的每一滤波器可耦合到第一区中的至少一个麦克风、第二区中的至少一个扩音器,和第二区中的至少一个辅助麦克风,其中麦克风、扩音器和辅助麦克风的每一组合针对来自所述多个可调适声音滤波器的每一滤波器为不同的。此外,所述多个麦克风包括多个定向麦克风,且由来自所述多个扩音器的每一扩音器再现的声音信号限于与每一此类扩音器相同的区中的收听者。
图8是表示本文所揭示的实施方案的对原本将由共享声学空间中的多个扩音器产生的回波信号(例如在自适应声音滤波器处)进行滤波或消除的方法的过程流程图800;在图8中,在810处,滤波器接收既定由共享声学空间中的多个扩音器当中的一扩音器再现的声音信号。单独地,在820处(且通常在820处接收到声音信号之前很久),相同滤波器接收(和/或从存储器召回)因关于扩音器的共享声学空间的先前执行的校准而产生的经预校准的系数。在830处,滤波器调适所述声音信号,以有效地消除原本将由声音信号产生的回波。在840处,将经滤波的声音信号(其中回波信号已经被消除)发送到扩音器以供再现。
图9是表示本文所揭示的实施方案的对来自从共享声学空间中的麦克风接收到的将由同一共享声学空间中的远扩音器再现的声音信号的反馈信号(例如在自适应声音滤波器处)进行滤波或消除的方法的过程流程图900。在图9中,在910处,滤波器接收由麦克风检测到的既定由相对较远的扩音器再现的声音信号。单独地,在920处,相同滤波器接收(大体上与声音信号同时)来自相对靠近远扬声器的第二麦克风的评估信号,所述评估信号对应于所述声音信号。在930处,滤波器基于所述接收到的评估信号,确定所述声音信号是否包含反馈信号。如果是,那么在940处,滤波器消除来自声音信号的反馈信号,且在950处,将经滤波的声音信号发送到相对远的扩音器以供再现。如果否,那么将声音信号在由滤波器接收时(即,未经滤波)发送到相对远的扩音器以供再现。
关于图7、8和9,术语“滤波器”可为能够执行回波消除和反馈消除两者的单个滤波器,且此滤波器的能力可包含多声道声学处理器和/或其它组件所提供的处理能力。
除前述内容之外,本文所揭示的某些实施方案可利用主动或被动配置确定技术和/或主动或被动识别确定技术。这些实施方案可经配置以使用用于确定共享声学空间中的乘客的当前配置的若干手段中的任一者。举例来说,对于某些实施方案,MAS可通过监视来自车辆的特定座椅位置的声音以确定哪些座椅被占用以及哪些座椅未被占用,来确定乘客的当前配置。还可能利用并入到共享声学空间中的图像或视频捕获裝置来确定哪些座椅被占用,以及哪些座椅未被占用。同样地,还可利用其它检测装置,例如集成到座椅底部中的重量传感器(例如或类似于已经用于前排乘客座椅中的那些),来检测是否停用安全气囊来保护儿童乘客。并且,这些和其它方法的组合可用于主动地或被动地确定哪些座椅被占用以及哪些座椅未被占用,且借此使MAS能够基于被占用的座椅确定乘客的当前配置,且基于此特定配置,执行关于所述特定配置的回波消除、反馈消除和多种其它功能。
同样,关于主动或被动识别确定,为方便起见,本文中所揭示的且图1和2的汽车102的上下文中再次论述的各种实施方案可经配置以使用用于确定共享声学空间的每一被占用座椅中乘客的特定身份的若干装置中的任一者。举例来说,对于某些实施方案,MAS可通过监视源自每一座椅的语音声音来确定乘客的特定身份,其中人与人之间的语音的差异是唯一地识别每一乘客的基础。还可能利用并入到共享声学空间中且利用面部辨识软件或一些类似技术的图像或视频捕获裝置来唯一地识别所占用座椅中的乘客。同样,还可利用用以检测是否停用安全气囊来保护儿童乘客的其它检测特征,例如集成到座椅底部中的重量传感器(例如或类似于已经用于前排乘客座椅中的那些),以在潜在乘客的数目足够小且量度足够相异而能够启用唯一识别时区分不同乘客。并且,这些和其它方法的组合可用于主动地或被动地以较大准确性来确定每一所占用座椅中的乘客的特定唯一身份。
以此方式,不仅的确唯一地识别每一乘客还提供在所占用座椅基础上的乘客的配置的广泛确定(类似于上文所描述的较一般配置确定),而且其还实现个人化配置确定的额外水平的特定性,所述特定性除基于哪些座椅被占用外还基于哪些座椅被特定已知个体占用而进一步细化。这进而允许基于谁就座在那些被占用座椅中的每一者中来以额外尺度来区分图1和2中所反映的特定基于四人座位配置(其为基于哪些座椅被占用的许多可能配置中的一个配置)。对于图1和2中所反映的基于四人座位配置,基于身份的此额外尺度基本上是无限的(即,整个人类的身份);然而,由于大多数个人车辆常常运输来自小得多的个体子集的人,所以考虑身份尺度的可能额外配置的实际数目当然大于不考虑乘客身份的配置,但仍是相对有限的(且可通过引入滤波器,例如仅考虑已在最小数目的旅行或在特定时间窗内的最小数目的旅行等中占用了座椅的乘客,来使其更加有限)。
如本文所使用,参考(所占用座椅配置和/或乘客身份的)“被动”确定是MAS在无来自乘客的直接用户输入的情况下经由其功能的正常和典型操作执行的那些确定,而“主动”确定是还并入有用户或乘客提供直接或故意用户输入的那些确定,所述用户输入例如说出其自身名字、提供访问码,或指示偏好或选择特定配置、设定等。然而,这些区别无意从本文所揭示的本发明概念减损或限制所述本发明概念,且因此如本文所使用的“被动”的任何解译包含“主动”等效物,且反之亦然。
图10为说明无线通信装置1202的一个配置的框图,其中可(至少部分)在例如汽车环境、房间或任何其它共享声学空间中等各种位置中的任一者中单独或作为此类环境的组成部分而实施本文所揭示的各种实施方案的方面。图10中说明的无线通信装置1202可为本文所描述的电子装置中的一或多者的实例。无线通信装置1202可包含应用处理器1221。应用处理器1221通常处理指令(例如,运行程序)以执行无线通信装置1202上的功能。应用处理器1221可耦合到音频译码器/解码器(编解码器)1219。
音频编解码器1219可用于对音频信号进行译码和/或解码。音频编解码器1219可耦合到至少一个扬声器1211、耳机1213、输出插孔1215和/或至少一个麦克风1217。扬声器1211可包含一或多个将电或电子信号转换为声学信号的电声转换器。举例来说,扬声器1211可用于播放音乐或输出扬声电话对话等。耳机1213可为可用于向用户输出声学信号(例如,语音信号)的另一扬声器或电声转换器。举例来说,可使用耳机1213使得仅用户可可靠地听到声学信号。输出插孔1215可用于将其它装置(例如头戴式耳机)耦合到无线通信装置1202以用于输出音频。扬声器1211、耳机1213和/或输出插孔1215可通常用于从音频编解码器1219输出音频信号。所述至少一个麦克风1217可为将声学信号(例如用户的话音)转换为提供到音频编解码器1219的电或电子信号的声电转换器。在一些配置中,音频编解码器1219可执行本文所描述的第一级处理和第二级处理中的一或多者(和/或其它功能或程序中的一或多者)。
应用处理器1221还可耦合到功率管理电路1294。功率管理电路1294的一个实例是功率管理集成电路(PMIC),其可用于管理无线通信装置1202的电功率消耗。功率管理电路1294可耦合到电池1296。电池1296可通常将电功率提供到无线通信装置1202。举例来说,电池1296和/或功率管理电路1294可耦合到包含于无线通信装置1202中的元件中的至少一者。
应用处理器1221可耦合到至少一个输入装置1298以用于接收输入。输入装置1298的实例包含红外传感器、图像传感器、加速计、触摸传感器、小键盘等。输入装置1298可允许用户与无线通信装置1202交互。应用处理器1221还可耦合到一或多个输出装置1201。输出装置1201的实例包含打印机、投影仪、屏幕、触觉装置等。输出装置1201可允许无线通信装置1202产生可由用户体验的输出。
应用处理器1221可耦合到应用存储器1203。应用存储器1203可为能够存储电子信息的任何电子装置。应用存储器1203的实例包含双数据速率同步动态随机存取存储器(3RAM)、同步动态随机存取存储器(SDRAM)、快闪存储器等。应用存储器1203可提供用于应用处理器1221的存储装置。举例来说,应用存储器1203可存储用于在应用处理器1221上运行的程序的运作的数据和/或指令。
应用处理器1221可耦合到显示器控制器1205,所述显示器控制器进而可耦合到显示器1207。显示控制器1205可为用于在显示器1207上产生图像的硬件块。举例来说,显示器控制器1205可将来自应用处理器1221的指令和/或数据转译为可呈现在显示器1207上的图像。显示器1207的实例包含液晶显示器(LCD)面板、发光二极管(LED)面板、阴极射线管(CRT)显示器、等离子显示器等。
应用处理器1221可耦合到基带处理器1223。基带处理器1223通常处理通信信号。举例来说,基带处理器1223可对接收到的信号进行解调和/或解码。另外或替代地,基带处理器1223可对信号进行编码和/或调制以准备发射。
基带处理器1223可耦合到基带存储器1209。基带存储器1209可为能够存储电子信息的任何电子装置,例如SDRAM、3RAM、快闪存储器等。基带处理器1223可从基带存储器1209读取信息(例如指令和/或数据),和/或将信息写入到基带存储器1209。另外或替代地,基带处理器1223可使用存储在基带存储器1209中的指令和/或数据来执行通信操作。
基带处理器1223可耦合到射频(RF)收发器1225。RF收发器1225可耦合到功率放大器1227以及一或多个天线1229。RF收发器1225可发射和/或接收射频信号。举例来说,RF收发器1225可使用功率放大器1227以及至少一个天线1229发射RF信号。RF收发器1225还可使用所述一或多个天线1229接收RF信号。
图11说明可包含在用于实施(至少部分地)本文所揭示的各种实施方案的电子装置1302内的某些组件。结合图11所描述的电子装置1302可为本文所描述的电子装置中的一或多者的实例,和/或可根据本文所描述的电子装置中的一或多者来实施。
电子装置1302包含处理器1347。处理器1347可为通用单芯片或多芯片微处理器(例如ARM)、专用微处理器(例如数字信号处理器(DSP))、微控制器、可编程门阵列等。处理器1347可被称作中央处理单元(CPU)。尽管图11的电子装置1302中仅展示单一处理器1347,但在替代配置中,可使用处理器(例如ARM和DSP)的组合。
电子装置1302还包含与处理器1347进行电子通信的存储器1331(即,处理器1347可从存储器1331读取信息和/或将信息写入到存储器1331)。存储器1331可为能够存储电子信息的任何电子组件。存储器1331可为随机存取存储器(RAM)、只读存储器(ROM)、磁盘存储媒体、光学存储媒体、RAM中的快闪存储器装置、随处理器一起包含的机载存储器、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除PROM(EEPROM)、寄存器等,包含其组合。
数据1333和指令1335可存储在存储器1331中。指令1335可包含一或多个程序、例程、子例程、功能、程序、代码等。指令1335可包含单个计算机可读语句或许多计算机可读语句。指令1335可由处理器1347执行,以实施本文所描述的方法中的一或多者。执行指令1335可涉及使用存储在存储器1331中的数据1333。图11展示一些指令1335a和数据1333a加载到处理器1347中。
电子装置1302还可包含发射器1343和接收器1345以允许在电子装置1302与远程位置(例如基站)之间发射和接收信号。发射器1343和接收器1345可统称为收发器1341。天线1339可电耦合到收发器1341。电子装置1302还可包含(未图示)多个发射器、多个接收器、多个收发器和/或多个天线。
电子装置1310的各种组件可通过一或多个总线耦合在一起,所述总线可包含功率总线、控制信号总线、状态信号总线、数据总线等。为简单起见,各种总线在图11中说明为总线系统1337。
提供对所描述的配置的呈现以使得所属领域的技术人员能够制作或使用本文中揭示的方法及其它结构。本文中所展示和描述的流程图、框图和其它结构仅为实例,且这些结构的其它变型也在本发明的范围内。对这些配置的各种修改均为可能的,且本文中所呈现的一般原理也可应用于其它配置。因此,本发明无意限于以上展示的配置,而是应被赋予与本文中(包含在形成原始揭示内容的一部分的所申请的所附权利要求书中)以任何方式所揭示的原理及新颖特征一致的最广范围。
应注意,在兼容的情况下,结合本文中所描述的配置中的任一者所描述的特征、功能、程序、组件、元件、结构等中的一或多者可与结合本文中所描述的其它配置中的任一者所描述的功能、程序、组件、元件、结构等中的一或多者组合。换句话说,可根据本文中揭示的系统和方法来实施本文中所描述的功能、程序、组件、元件等的任何兼容的组合。
本文中所揭示的方法包括用于实现所描述的方法的一或多个步骤或动作。在不偏离权利要求书的范围的情况下,方法步骤和/或动作可彼此互换。换句话说,除非正描述的方法的适当操作需要步骤或动作的特定次序,否则,在不脱离权利要求书的范围的情况下,可修改特定步骤及/或动作的次序及/或使用。除非以其它方式明确地指定,否则短语“基于”并不意味着“仅基于”。换句话说,短语“基于”描述“仅基于”与“至少基于”两者。
在以上描述中,有时结合各种术语而使用参考标号。在术语结合参考数字使用的情况下,此可意味着指代图式中的一或多者中展示的特定元件。在无参考标号而使用术语的情况下,此可意味着大体指代所述术语,而不限于任何特定图式。此外,所属领域的技术人员将理解,可使用多种不同技术及技艺中的任一者来表示信息及信号。举例来说,可通过电压、电流、电磁波、磁场或磁粒子、光场或光粒子或其任何组合来表示在整个上文描述中可能参考的数据、指令、命令、信息、信号、位和符号。
本文所揭示的配置的实施方案的设计要求可包含最小化处理延迟和/或计算复杂性(通常以每秒数百万个指令或MIPS来测量),尤其是针对计算密集型应用,例如经压缩音频或视听信息(例如根据压缩格式编码的文件或流,例如本文所识别的实例中的一者)的重放,或用于宽带通信(例如高于八千赫兹,例如12、16、32、44.1、48或192kHz的取样率下的话音通信)的应用。
本文所揭示的设备(例如经配置以执行本文所描述的技术的任何装置)可用硬件与软件和/或与固件的任何被视为适合于既定应用的组合实施。举例来说,可将此设备的元件制造为(例如)驻留在相同芯片上或芯片组中的两个或两个以上芯片当中的电子及/或光学装置。此类装置的一个实例是逻辑元件(例如,晶体管或逻辑门)的固定或可编程阵列,且这些元件中的任一者可实施为一或多个此类阵列。这些元件中的任何两个或两个以上乃至全部可实施于同一个(一些)阵列内。此类一或多个阵列可在一或多个芯片内(例如,包含两个或两个以上芯片的芯片组内)实施。
本文中揭示的设备的各个实施方案的一或多个元件可完全或部分实施为一或多个指令集,所述一或多个指令集经布置以在逻辑元件的一或多个固定或可编程阵列上执行,所述逻辑元件例如微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA、(现场可编程门阵列)、ASSP(专用标准产品)及ASIC(专用集成电路)。如本文所揭示的设备的实施方案的各个元件中的任一者还可体现为一或多个计算机(例如,包含经编程以执行指令的一或多个集合或序列的一或多个阵列的机器,也称为“处理器”),且这些元件中的任何两个或两个以上乃至全部可实施在相同的此类计算机内。
可将如本文所揭示的处理器或用于处理的其它装置制造为(例如)驻留在相同芯片上或芯片组中的两个或两个以上芯片当中的一或多个电子及/或光学装置。此类装置的一个实例是逻辑元件(例如,晶体管或逻辑门)的固定或可编程阵列,且这些元件中的任一者可实施为一或多个此类阵列。此类一或多个阵列可在一或多个芯片内(例如,包含两个或两个以上芯片的芯片组内)实施。此类阵列的实例包含逻辑元件的固定或可编程阵列,例如微处理器、嵌入式处理器、IP核心、DSP、FPGA、ASSP及ASIC。如本文所揭示的处理器或用于处理的其它装置还可体现为一或多个计算机(例如,包含经编程以执行一或多个指令集或序列的一或多个阵列的机器)或其它处理器。有可能使用如本文所描述的处理器来执行任务或执行不与相对于各种图所描述的方法的实施方案的程序直接有关的其它指令集,例如与处理器嵌入其中的装置或系统(例如音频感测装置)的另一操作有关的任务。还可能如本文所揭示的方法的一部分由音频感测装置的处理器执行,且方法的另一部分在一或多个其它处理器的控制下执行。
所属领域的技术人员将了解,结合本文所揭示的配置而描述的各种说明性模块、逻辑块、电路及测试及其它操作可实施为电子硬件、计算机软件或两者的组合。可使用通用处理器、数字信号处理器(DSP)、ASIC或ASSP、FPGA或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件,或其经设计以产生如本文所揭示的配置的任何组合来实施或执行此类模块、逻辑块、电路及操作。举例来说,可将此类配置至少部分地实施为硬连线电路、实施为制造到专用集成电路中的电路配置,或实施为加载到非易失性存储装置中的固件程序,或者作为机器可读代码从数据存储媒体加载或加载到数据存储媒体中的软件程序,此类代码为可由例如通用处理器或其它数字信号处理单元等逻辑元件阵列执行的指令。通用处理器可为微处理器,但在替代方案中,处理器可以为任何常规理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器的组合、一或多个微处理器结合DSP核心,或任何其它此类配置。软件模块可驻留在非暂时性存储媒体中,所述非暂时性存储媒体例如为RAM(随机存取存储器)、ROM(只读存储器)、非易失性RAM(NVRAM)(例如,快闪RAM、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM))、寄存器、硬盘、可装卸式磁盘或CD-ROM;或驻留在此项技术中已知的任何其它形式的存储媒体中。说明性存储媒体耦合到处理器,使得处理器可从存储媒体读取信息及将信息写入到存储媒体。在替代方案中,存储媒体可与处理器成一体式。处理器和存储媒体可驻留于ASIC中。ASIC可以驻留于用户终端中。在替代例中,处理器及存储媒体可作为离散组件驻留于用户终端中。
应注意,本文所揭示的各种方法可以通过逻辑元件的阵列(例如处理器)执行,并且本文所描述的设备的各种元件可以实施为经设计以在此阵列上执行的模块。如本文所使用,术语“模块”或“子模块”可指代包含呈软件、硬件或固件形式的计算机指令(例如,逻辑表达式)的任何方法、设备、装置、单元或计算机可读数据存储媒体。应理解,可将多个模块或系统组合为一个模块或系统,且可将一个模块或系统分离成多个模块或系统以执行相同功能。在以软件或其它计算机可执行指令实施时,过程的元件基本上是用以例如使用例程、程序、对象、组件、数据结构及其类似者执行相关任务的码段。术语“软件”应理解为包括源代码、汇编语言代码、机器代码、二进制代码、固件、宏码、微码、可由逻辑元件阵列执行的任何一或多个指令集或序列,以及此类实例的任何组合。程序或码段可存储于处理器可读媒体中或由体现在发射媒体或通信链路上的载波中的计算机数据信号发射。
本文所揭示的方法、方案和技术的实施方案还可(例如在如本文所列的一或多个计算机可读存储媒体的有形、计算机可读特征中)有形地体现为可由包含逻辑元件(例如处理器、微处理器、微控制器或其它有限状态机)的阵列的机器执行的一或多个指令集。术语“计算机可读媒体”可包含可存储或传送信息的任何媒体,包含易失性、非易失性、可装卸式及非可装卸式媒体。计算机可读媒体的实例包含电子电路、半导体存储器装置、ROM、快闪存储器、可擦除ROM(EROM)、软盘或其它磁性存储装置、CD-ROM/DVD或其它光学存储装置、硬盘或可用来存储所要信息的任何其它媒体、光纤媒体、射频(RF)链路,或可用来携载所要信息并可被存取的任何其它媒体。计算机数据信号可包含可经由发射媒体传播的任何信号,所述发射媒体例如为电子网络信道、光纤、空气、电磁、RF链路等。可经由例如因特网或企业内部网等计算机网络下载码段。在任何情况下,不应将本发明的范围解释为受此类实施例限制。
本文中所描述的方法的任务中的每一者可直接以硬件、以由处理器执行的软件模块,或以所述两者的组合体现。在本文所揭示的方法的实施方案的典型应用中,逻辑元件(例如,逻辑门)的阵列经配置以执行所述方法的各种任务的一者、一者以上乃至全部。还可将所述任务中的一或多者(可能全部)实施为体现在计算机程序产品(例如,一或多个数据存储媒体,例如磁盘、快闪或其它非易失性存储器卡、半导体存储器芯片等)中的代码(例如,一或多个指令集),所述计算机程序产品可由包含逻辑元件(例如,处理器、微处理器、微控制器或其它有限状态机)的阵列的机器(例如,计算机)读取及/或执行。如本文所揭示的方法的实施方案的任务还可由一个以上此阵列或机器执行。在这些或其它实施方案中,所述任务可在用于无线通信的装置(例如,蜂窝式电话或具有此类通信能力的其它装置)内执行。此装置可经配置以与电路交换和/或包交换网络(例如使用一或多个协议,例如VoIP)通信。举例来说,此装置可包含经配置以接收及/或发射经编码帧的RF电路。
明确地揭示本文所揭示的各种方法可(至少部分地)由例如手持机、头戴式耳机或便携式数字助理(PDA)等便携式通信装置执行,且本文所描述的各种设备可包含在此装置内。典型的实时(例如,在线)应用是使用此移动装置进行的电话对话。
在一或多个示范性实施例中,本文中描述的操作可在硬件、软件、固体或其任何组合中实施。如果实施于软件中,那么可将此类操作作为一或多个指令或代码存储在计算机可读媒体上或经由计算机可读媒体进行发射。术语“计算机可读媒体”包含计算机可读存储媒体和通信(例如,发射)媒体两者。举例来说而非限制,计算机可读存储媒体可包括存储元件阵列,例如半导体存储器(其可包含(不限于)动态或静态RAM、ROM、EEPROM及/或快闪RAM),或铁电、磁阻、双向开关半导体、聚合或相变存储器;CD-ROM或其它光盘存储装置;和/或磁盘存储装置或其它磁性存储装置。此类存储媒体可以可由计算机存取的指令或数据结构的形式存储信息。通信媒体可包括可用于携载呈指令或数据结构的形式的所希望的程序代码且可由计算机存取的任何媒体,包含促进将计算机程序从一处传送到另一处的任何媒体。并且,任何连接被恰当地称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或无线技术(例如红外线、无线电及/或微波)从网站、服务器或其它远程源发射软件,那么所述同轴电缆、光纤电缆、双绞线、DSL或无线技术(例如红外线、无线电及/或微波)包含在媒体的定义中。如本文中所使用的磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及蓝光DiscTM(蓝光光盘协会,环球城,加州),其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
如本文所描述的设备可并入到电子装置中,其接受语音输入以便控制某些操作或可以其它方式得益于所要噪声与背景噪声的分离(例如通信装置)。许多应用可受益于增强或从源自多个方向的背景声音分离清晰的所要声音。此类应用可包含并入有例如话音辨识及检测、语音增强及分离、话音激活控制等能力的电子或计算装置中的人机接口。可能需要实施在仅提供有限处理能力的装置中合适的此类声学信号处理设备。
本文所描述的模块、元件及装置的各种实施方案的元件可制造为驻留在(例如)相同芯片上或芯片组中的两个或两个以上芯片当中的电子及/或光学装置。此类装置的一个实例为固定的或可编程逻辑元件阵列,例如晶体管或门。本文描述的设备的各种实施方案的一或多个元件还可完全地或部分地实施为经布置以在一或多个固定的或可编程逻辑元件阵列(例如,微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA、ASSP及ASIC)上执行的一或多个指令集。
如本文所描述的设备的实施方案的一或多个元件有可能用于执行任务或执行不与所述设备的操作直接相关的其它指令集,例如与其中嵌入有所述设备的装置或系统的另一操作相关的任务。此设备的实施方案的一或多个元件还有可能具有共同的结构(例如,用以执行对应于不同时间的不同元件的代码的部分的处理器、经执行以在不同时间执行对应于不同元件的任务的指令集,或在不同时间执行不同元件的操作的电子及/或光学装置的布置)。
提供本发明的前述描述以使所属领域的技术人员能够制造或使用本发明。所属领域的技术人员将易于了解对本发明的各种修改,且本文中界定的一般原理可应用于其它变体而不脱离本发明的范围。因此,本发明并不希望限于本文中所描述的实例和设计,而是应被赋予与本文中所揭示的原理和新颖特征相一致的最广范围。
虽然示范性实施方案可能提及在一或多个独立计算机系统的上下文中利用当前揭示的标的物的方面,但所述标的物不限于此,而是可结合任何计算环境(例如网络或分布式计算环境)来实施。再者,当前揭示的标的物的方面可在多个处理芯片或装置中或跨越多个处理芯片或装置实施,且可以类似地跨越多个装置实现存储。此些装置可能包含例如PC、网络服务器和手持式装置。术语“确定”涵盖各种各样的动作,且因此“确定”可包含计算、运算、处理、导出、调查、查找(例如,在表、数据库或另一数据结构中查找)、查实等等。并且,“确定”可包含接收(例如,接收信息)、存取(例如,在存储器中存取数据)及类似者。并且,“确定”可包括解析、选择、挑选、建立等等。换句话说,应理解,权利要求书不限于上文所说明的精确配置和组件,且可在不脱离权利要求书的范围的情况下在本文所描述的系统、方法和设备的布置、操作和细节方面作出各种修改、改变和变化。
尽管已经以特定地针对结构特征和/或方法动作的语言来描述标的物,但应理解,所附权利要求书中所界定的标的物未必限于上文所描述的特定特征或动作。实际上,揭示上文所描述的特定特征和动作以作为实施所附权利要求书的实例形式。

Claims (28)

1.一种用于增强共享声学空间中的对话语音的方法,所述方法包括:
在遍及所述共享声学空间分布的多个麦克风处接收大体上源自第一区声音源的声音信号;
在多个可调适声音滤波器处对所述声音信号进行回波滤波以消除至少一个回波信号;
在所述多个可调适声音滤波器处对所述声音信号进行反馈滤波以消除至少一个反馈信号;以及
基于所述回波滤波和所述反馈滤波在位于第二区中的扩音器的子集上再现经滤波的声音信号。
2.根据权利要求1所述的方法,其中所述多声道声学系统使就座在所述第一区中的第一乘客能够与就座在所述第二区中的第二乘客对话。
3.根据权利要求1所述的方法,其中基于预定回波消除校准执行所述至少一个回波信号的消除。
4.根据权利要求3所述的方法,其中所述预定回波消除校准是选自多个预定回波消除校准,其中所述预定回波消除校准中的每一者基于不同乘客配置而执行。
5.根据权利要求1所述的方法,其中来自所述多个可调适声音滤波器的每一滤波器经配置以:
在每一滤波器处接收既定用于在所述第二区中的至少一个扩音器上再现且由所述第一区中的至少一个麦克风检测到的声音信号;
在每一滤波器处接收来自所述第二区中的至少一个麦克风的评估信号,所述评估信号对应于所述所接收的声音信号;
在所述滤波器处且基于所述所接收的评估信号确定所述声音信号包含反馈信号;
消除所述反馈信号;以及
将所述经滤波的声音信号发送到所述第二区中的至少一个扩音器。
6.根据权利要求5所述的方法,其中来自所述多个可调适声音滤波器的每一滤波器耦合到所述第一区中的至少一个麦克风、所述第二区中的至少一个扩音器,和所述第二区中的至少一个辅助麦克风,其中麦克风、扩音器和辅助麦克风的每一组合针对来自所述多个可调适声音滤波器的每一滤波器为不同的。
7.根据权利要求1所述的方法,其中所述多个麦克风包括多个定向麦克风,且其中由来自所述多个扩音器的每一扩音器再现的所述声音信号限于与每一此类扩音器相同的区中的收听者。
8.一种用于增强共享声学空间中的对话语音的多声道声学系统,所述多声道声学系统包括:
多声道声学处理器,其包括多个可调适声音滤波器,所述多声道声学处理器耦合到所述多个麦克风和所述多个扩音器,所述多声道声学处理器经配置以:
在遍及所述共享声学空间分布的所述多个麦克风处接收大体上源自第一区声音源的声音信号;
在所述多个可调适声音滤波器处对所述声音信号进行回波滤波以消除至少一个回波信号;
在所述多个可调适声音滤波器处对所述声音信号执行反馈滤波以消除至少一个反馈信号,所述反馈滤波在所述回波滤波之前或之后发生;以及
基于所述回波滤波和所述反馈滤波在位于所述第二区中的扩音器的子集上再现经滤波的声音信号。
9.根据权利要求8所述的系统,其中所述多声道声学系统进一步包括:
多个麦克风,其遍及所述多个区分布,用于接收源自来自所述多个区的每一区内的声音信号;以及
多个扩音器,其遍及所述多个区分布;
其中所述多声道声学系统使就座在所述第一区中的第一乘客能够与就座在所述第二区中的第二乘客对话。
10.根据权利要求8所述的系统,其中基于预定回波消除校准执行所述至少一个回波信号的消除。
11.根据权利要求10所述的系统,其中所述预定回波消除校准是选自多个预定回波消除校准,其中所述预定回波消除校准中的每一者基于不同乘客配置而执行。
12.根据权利要求8所述的系统,其中来自所述多个可调适声音滤波器的每一滤波器经配置以:
在每一滤波器处接收既定用于在所述第二区中的至少一个扩音器上再现且由所述第一区中的至少一个麦克风检测到的声音信号;
在每一滤波器处接收来自所述第二区中的至少一个麦克风的评估信号,所述评估信号对应于所述所接收的声音信号;
在所述滤波器处且基于所述所接收的评估信号确定所述声音信号包含反馈信号;
消除所述反馈信号;以及
将所述经滤波的声音信号发送到所述第二区中的至少一个扩音器。
13.根据权利要求12所述的系统,其中来自所述多个可调适声音滤波器的每一滤波器耦合到所述第一区中的至少一个麦克风、所述第二区中的至少一个扩音器,和所述第二区中的至少一个辅助麦克风,其中麦克风、扩音器和辅助麦克风的每一组合针对来自所述多个可调适声音滤波器的每一滤波器为不同的。
14.根据权利要求8所述的系统,其中所述多个麦克风包括多个定向麦克风,且其中由来自所述多个扩音器的每一扩音器再现的所述声音信号限于与每一此类扩音器相同的区中的收听者。
15.一种增强共享声学空间中的对话语音的设备,所述设备包括:
用于接收大体上源自第一区声音源的声音信号的装置;
用于对所述声音信号进行回波滤波以消除至少一个回波信号的装置;
用于对所述声音信号进行反馈滤波以消除至少一个反馈信号的装置;以及
用于基于所述回波滤波和所述反馈滤波再现位于所述第二区中的经滤波的声音信号的装置。
16.根据权利要求15所述的设备,其中所述多声道声学系统使就座在所述第一区中的第一乘客能够与就座在所述第二区中的第二乘客对话。
17.根据权利要求15所述的设备,其中基于预定回波消除校准执行所述至少一个回波信号的消除。
18.根据权利要求17所述的设备,其中所述预定回波消除校准是选自多个预定回波消除校准,其中所述预定回波消除校准中的每一者基于不同乘客配置而执行。
19.根据权利要求15所述的设备,其中来自所述多个可调适声音滤波器的每一滤波器经配置以:
在每一滤波器处接收既定用于在所述第二区中的至少一个扩音器上再现且由所述第一区中的至少一个麦克风检测到的声音信号;
在每一滤波器处接收来自所述第二区中的至少一个麦克风的评估信号,所述评估信号对应于所述所接收的声音信号;
在所述滤波器处且基于所述所接收的评估信号确定所述声音信号包含反馈信号;
消除所述反馈信号;以及
将所述经滤波的声音信号发送到所述第二区中的至少一个扩音器。
20.根据权利要求19所述的设备,其中来自所述多个可调适声音滤波器的每一滤波器耦合到所述第一区中的至少一个麦克风、所述第二区中的至少一个扩音器,和所述第二区中的至少一个辅助麦克风,其中麦克风、扩音器和辅助麦克风的每一组合针对来自所述多个可调适声音滤波器的每一滤波器为不同的。
21.根据权利要求15所述的设备,其中所述多个麦克风包括多个定向麦克风,且其中由来自所述多个扩音器的每一扩音器再现的所述声音信号限于与每一此类扩音器相同的区中的收听者。
22.一种非暂时性计算机可读媒体,其包括用于增强共享声学空间中的对话语音的计算机可执行指令,所述计算机可执行指令包括用于以下操作的指令:
在遍及所述共享声学空间分布的多个麦克风处接收大体上源自第一区声音源的声音信号;
在多个可调适声音滤波器处对所述声音信号进行回波滤波以消除至少一个回波信号;
在所述多个可调适声音滤波器处对所述声音信号进行反馈滤波以消除至少一个反馈信号;以及
基于所述回波滤波和所述反馈滤波在位于所述第二区中的扩音器的子集上再现经滤波的声音信号。
23.根据权利要求22所述的计算机可读媒体,其中所述指令使就座在所述第一区中的第一乘客能够与就座在所述第二区中的第二乘客对话。
24.根据权利要求22所述的计算机可读媒体,其中用于消除所述至少一个回波信号的所述指令基于预定回波消除校准而执行。
25.根据权利要求24所述的计算机可读媒体,其中所述预定回波消除校准是选自多个预定回波消除校准,其中所述预定回波消除校准中的每一者基于不同乘客配置而执行。
26.根据权利要求22所述的计算机可读媒体,其进一步包括致使所述多声道声学系统进行以下操作的指令:
在每一滤波器处接收既定用于在所述第二区中的至少一个扩音器上再现且由所述第一区中的至少一个麦克风检测到的声音信号;
在每一滤波器处接收来自所述第二区中的至少一个麦克风的评估信号,所述评估信号对应于所述所接收的声音信号;
在所述滤波器处且基于所述所接收的评估信号确定所述声音信号包含反馈信号;
消除所述反馈信号;以及
将所述经滤波的声音信号发送到所述第二区中的至少一个扩音器。
27.根据权利要求26所述的计算机可读媒体,其进一步包括来自所述多个可调适声音滤波器的每一滤波器借以耦合到所述第一区中的至少一个麦克风、所述第二区中的至少一个扩音器和所述第二区中的至少一个辅助麦克风的指令,其中麦克风、扩音器和辅助麦克风的每一组合针对来自所述多个可调适声音滤波器的每一滤波器为不同的。
28.根据权利要求22所述的计算机可读媒体,其进一步包括用于当所述多个麦克风包括多个定向麦克风时将由来自所述多个扩音器的每一扩音器再现的所述声音信号限于与每一此类扩音器相同的区中的收听者的指令。
CN201580066510.1A 2014-12-12 2015-10-29 共享声学空间中的增强型对话通信 Active CN107004425B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462091367P 2014-12-12 2014-12-12
US62/091,367 2014-12-12
US14/808,870 US9947334B2 (en) 2014-12-12 2015-07-24 Enhanced conversational communications in shared acoustic space
US14/808,870 2015-07-24
PCT/US2015/058133 WO2016093973A1 (en) 2014-12-12 2015-10-29 Enhanced conversational communications in shared acoustic space

Publications (2)

Publication Number Publication Date
CN107004425A true CN107004425A (zh) 2017-08-01
CN107004425B CN107004425B (zh) 2020-08-11

Family

ID=54542551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580066510.1A Active CN107004425B (zh) 2014-12-12 2015-10-29 共享声学空间中的增强型对话通信

Country Status (4)

Country Link
US (1) US9947334B2 (zh)
EP (1) EP3231166B1 (zh)
CN (1) CN107004425B (zh)
WO (1) WO2016093973A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108022597A (zh) * 2017-12-15 2018-05-11 北京远特科技股份有限公司 一种声音处理系统、方法及车辆
CN108449502A (zh) * 2018-03-12 2018-08-24 广东欧珀移动通信有限公司 语音通话数据处理方法、装置、存储介质及移动终端
CN108449506A (zh) * 2018-03-12 2018-08-24 广东欧珀移动通信有限公司 语音通话数据处理方法、装置、存储介质及移动终端
CN110503969A (zh) * 2018-11-23 2019-11-26 腾讯科技(深圳)有限公司 一种音频数据处理方法、装置及存储介质
CN113674754A (zh) * 2021-08-20 2021-11-19 深圳地平线机器人科技有限公司 基于音频的处理方法和装置
CN114157973A (zh) * 2020-09-09 2022-03-08 英属开曼群岛商迪芬尼环球股份有限公司 用于在车辆中提供音频的方法与用于车辆的音频设备

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10002478B2 (en) 2014-12-12 2018-06-19 Qualcomm Incorporated Identification and authentication in a shared acoustic space
WO2017064840A1 (ja) * 2015-10-16 2017-04-20 パナソニックIpマネジメント株式会社 音源分離装置および音源分離方法
US9773495B2 (en) * 2016-01-25 2017-09-26 Ford Global Technologies, Llc System and method for personalized sound isolation in vehicle audio zones
US10067907B2 (en) * 2016-05-05 2018-09-04 GM Global Technology Operations LLC Vehicle including noise management system having automotive audio bus (A2B) interface
EP3549355A4 (en) 2017-03-08 2020-05-13 Hewlett-Packard Development Company, L.P. COMBINED SOUND OUTPUT
JP2023012772A (ja) * 2021-07-14 2023-01-26 アルプスアルパイン株式会社 車内コミュニケーション支援システム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1591995A1 (en) * 2004-04-29 2005-11-02 Harman Becker Automotive Systems GmbH Indoor communication system for a vehicular cabin
US6980663B1 (en) * 1999-08-16 2005-12-27 Daimlerchrysler Ag Process and device for compensating for signal loss
CN1750573A (zh) * 2004-09-03 2006-03-22 哈曼贝克自动系统股份有限公司 采用组合的噪声减少和回波补偿的语音信号处理
CN102918825A (zh) * 2010-05-24 2013-02-06 松下电器产业株式会社 集合住宅用对讲系统的住户机
US20130064405A1 (en) * 2009-03-12 2013-03-14 Starkey Laboratories, Inc. Hearing assistance devices with echo cancellation

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5022082A (en) * 1990-01-12 1991-06-04 Nelson Industries, Inc. Active acoustic attenuation system with reduced convergence time
US20020071573A1 (en) * 1997-09-11 2002-06-13 Finn Brian M. DVE system with customized equalization
US7912228B2 (en) * 2003-07-18 2011-03-22 Volkswagen Ag Device and method for operating voice-supported systems in motor vehicles
JP4551652B2 (ja) 2003-12-02 2010-09-29 ソニー株式会社 音場再生装置及び音場空間再生システム
JP2008035472A (ja) 2006-06-28 2008-02-14 National Univ Corp Shizuoka Univ 車内外音響伝送システム
JP2008042390A (ja) 2006-08-03 2008-02-21 National Univ Corp Shizuoka Univ 車内会話支援システム
WO2008061205A2 (en) 2006-11-16 2008-05-22 Johnson Controls Technology Company Integrated vehicle communication system
EP2211564B1 (en) 2009-01-23 2014-09-10 Harman Becker Automotive Systems GmbH Passenger compartment communication system
JP2014093597A (ja) * 2012-11-01 2014-05-19 Sony Corp 再生装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6980663B1 (en) * 1999-08-16 2005-12-27 Daimlerchrysler Ag Process and device for compensating for signal loss
EP1591995A1 (en) * 2004-04-29 2005-11-02 Harman Becker Automotive Systems GmbH Indoor communication system for a vehicular cabin
CN1750573A (zh) * 2004-09-03 2006-03-22 哈曼贝克自动系统股份有限公司 采用组合的噪声减少和回波补偿的语音信号处理
US20130064405A1 (en) * 2009-03-12 2013-03-14 Starkey Laboratories, Inc. Hearing assistance devices with echo cancellation
CN102918825A (zh) * 2010-05-24 2013-02-06 松下电器产业株式会社 集合住宅用对讲系统的住户机

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108022597A (zh) * 2017-12-15 2018-05-11 北京远特科技股份有限公司 一种声音处理系统、方法及车辆
CN108449502A (zh) * 2018-03-12 2018-08-24 广东欧珀移动通信有限公司 语音通话数据处理方法、装置、存储介质及移动终端
CN108449506A (zh) * 2018-03-12 2018-08-24 广东欧珀移动通信有限公司 语音通话数据处理方法、装置、存储介质及移动终端
CN110503969A (zh) * 2018-11-23 2019-11-26 腾讯科技(深圳)有限公司 一种音频数据处理方法、装置及存储介质
CN110503969B (zh) * 2018-11-23 2021-10-26 腾讯科技(深圳)有限公司 一种音频数据处理方法、装置及存储介质
US11710490B2 (en) 2018-11-23 2023-07-25 Tencent Technology (Shenzhen) Company Limited Audio data processing method, apparatus and storage medium for detecting wake-up words based on multi-path audio from microphone array
CN114157973A (zh) * 2020-09-09 2022-03-08 英属开曼群岛商迪芬尼环球股份有限公司 用于在车辆中提供音频的方法与用于车辆的音频设备
CN114157973B (zh) * 2020-09-09 2024-05-28 英属开曼群岛商迪芬尼环球股份有限公司 用于在车辆中提供音频的方法与用于车辆的音频设备
CN113674754A (zh) * 2021-08-20 2021-11-19 深圳地平线机器人科技有限公司 基于音频的处理方法和装置

Also Published As

Publication number Publication date
WO2016093973A1 (en) 2016-06-16
EP3231166A1 (en) 2017-10-18
US20160171989A1 (en) 2016-06-16
CN107004425B (zh) 2020-08-11
EP3231166B1 (en) 2019-12-11
US9947334B2 (en) 2018-04-17

Similar Documents

Publication Publication Date Title
CN107004425A (zh) 共享声学空间中的增强型对话通信
CN107004423A (zh) 用于共享声学空间中的增强型交谈式通信的反馈消除
US9743213B2 (en) Enhanced auditory experience in shared acoustic space
CN109286875B (zh) 用于定向拾音的方法、装置、电子设备和存储介质
CN101194536B (zh) 用于确定扬声器之间距离的方法和系统
US8787602B2 (en) Device for and a method of processing audio data
JP6336968B2 (ja) 呼中における三次元サウンド圧縮及びオーバー・ザ・エア送信
CN104136299B (zh) 用于在车内对声音进行导向的系统、方法以及装置
CN102520391B (zh) 认知负荷减少
CN103190158A (zh) 用于基于所记录的声音信号进行头部跟踪的系统、方法、设备和计算机可读媒体
CN104247461A (zh) 音频再现系统和方法
US10002601B2 (en) In-vehicle communication signal processing
CN103392349A (zh) 用于空间选择性音频增强的系统、方法、设备和计算机可读媒体
Tervo et al. Spatial analysis and synthesis of car audio system and car cabin acoustics with a compact microphone array
CN105794231A (zh) 免提波束方向图配置
CN106664497A (zh) 音频再现系统和方法
US11126398B2 (en) Smart speaker
CN107439019B (zh) 用于动态声学环境中的多信道声音的声学回波抵消的校准
KR20220157965A (ko) 적응형 네트워크를 이용한 앰비소닉 계수들 변환
CN109923877A (zh) 对立体声音频信号进行加权的装置和方法
US20230108565A1 (en) Reproduction apparatus, method and program for the same
JP2002304191A (ja) 鳴き声による音声ガイドシステム
WO2023056280A1 (en) Noise reduction using synthetic audio
KR20230113853A (ko) 오디오 소스 지향성에 기초한 심리음향 강화
CN114730562A (zh) 信息处理系统、信息处理设备、信息处理方法及程序

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant