CN113965856A - 差分音频数据补偿 - Google Patents
差分音频数据补偿 Download PDFInfo
- Publication number
- CN113965856A CN113965856A CN202110821689.4A CN202110821689A CN113965856A CN 113965856 A CN113965856 A CN 113965856A CN 202110821689 A CN202110821689 A CN 202110821689A CN 113965856 A CN113965856 A CN 113965856A
- Authority
- CN
- China
- Prior art keywords
- microphone
- speakerphone
- signal
- information
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000000694 effects Effects 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims description 25
- 230000003044 adaptive effect Effects 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 11
- 230000032683 aging Effects 0.000 claims description 6
- 230000015556 catabolic process Effects 0.000 claims description 4
- 238000006731 degradation reaction Methods 0.000 claims description 4
- 239000000725 suspension Substances 0.000 claims description 3
- 230000003679 aging effect Effects 0.000 claims description 2
- 238000002592 echocardiography Methods 0.000 description 23
- 238000004590 computer program Methods 0.000 description 17
- 238000013461 design Methods 0.000 description 15
- 230000005236 sound signal Effects 0.000 description 13
- 238000003860 storage Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 230000002457 bidirectional effect Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000008030 elimination Effects 0.000 description 5
- 238000003379 elimination reaction Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000009347 mechanical transmission Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 241001203771 Eudonia echo Species 0.000 description 1
- 210000003926 auditory cortex Anatomy 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000000860 cochlear nerve Anatomy 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 210000003027 ear inner Anatomy 0.000 description 1
- 210000000959 ear middle Anatomy 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1785—Methods, e.g. algorithms; Devices
- G10K11/17853—Methods, e.g. algorithms; Devices of the filter
- G10K11/17854—Methods, e.g. algorithms; Devices of the filter the filter being an adaptive filter
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6033—Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
- H04R1/025—Arrangements for fixing loudspeaker transducers, e.g. in a box, furniture
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
- H04R29/005—Microphone arrays
- H04R29/006—Microphone matching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
Abstract
本申请公开了差分音频数据补偿,其中相应方法包括:获取表示由至少一第一传声器收集的音频数据的至少一第一信息;获取表示由至少一第二传声器收集的音频数据的至少一第二信息;确定差分信息,其中差分信息至少部分基于至少一第一信息和至少一第二信息确定;及补偿对音频数据的影响,其中第一信息和/或第二信息的音频数据至少部分基于确定的差分信息进行补偿。本申请还公开了喇叭扩音器及包括喇叭扩音器的系统。
Description
技术领域
本申请涉及喇叭扩音器领域。更具体地,本申请涉及例如用于与喇叭扩音器连接或者作为喇叭扩音器系统的一部分的设备。
背景技术
已知在喇叭扩音器或者喇叭扩音器系统中,远端用户感知到回波是自然会话的主要损害或影响因素。喇叭扩音器的扬声器单元(如扬声器(也称为喇叭))播放的声音被传声器拾取并作为回波返回到远端。
在最近开发的音频装置如喇叭扩音器中,扬声器与传声器之间在会话期间的声学耦合导致给远端用户的相应音频输出的质量下降。因此,已开发例如回波消除器应用。这样的回波消除器应用通常形成为滤波器单元并配置成避免移动音频装置的声学输出信号将经传声器传回到与移动音频装置连接的外部装置。特别重要的是用于具有硬墙壁的封闭房间、混响室等的回波消除应用,其有支持长回波的趋势,即其中传声器将遭受高度混响的房间。
其它已知的去除或消除回波的方法产生不想要的非自然信号,如线性声学消除器。一个这样的在现今的喇叭扩音器中经常使用的例子是在扬声器播放声音时简单地使传声器(部分地)静音。尽管这是有效的消除回波的方法,但其具有一些缺点,例如其使喇叭扩音器的用户不可能中断远端讲话者,因为该系统被简化为半双工/单工系统。
因此,需要提供一种至少解决部分上面提及的问题的解决方案。具体地,需要提供一种使能在前述喇叭扩音器应用中消除回波的解决方案。至少需要提供现有技术的备选方案。
发明内容
本发明至少涉及一种设备。该设备可以是喇叭扩音器。
本发明提供多种不同的、配置成减少或消除本地输出变换器对靠近设置的输入变换器的影响的方法和设备,尤其是在喇叭扩音器中。这预期在例如电话呼叫如软件电话呼叫或者视频会议期间减少喇叭扩音器的输出信号中的回波量。
根据第一示例性方面,公开了一种设备,该设备包括至少一处理器和包含计算机程序代码的至少一存储器,至少一存储器和计算机程序代码配置成与至少一处理器一起使得所述设备至少执行:
-获取表示由至少一第一传声器收集的音频数据的至少一第一信息及表示由至少一第二传声器收集的音频数据的至少一第二信息;
-确定表示至少两个信息之间的一个或多个差别的差分信息,其中差分信息至少部分基于至少一第一信息和至少一第二信息确定;及
-补偿对音频数据的影响,其中第一信息和/或第二信息的音频数据至少部分基于确定的差分信息进行补偿。
设备的组件或者用于实现上述功能的相应设备一般可以硬件和/或软件实施。该设备例如可包括用于运行执行所需功能的计算机程序的至少一处理器、存储计算机程序的至少一存储器、或者二者。作为备选,它们例如可包括设计来实施所需功能的电路,例如实施在芯片组或芯片中,如集成电路。一般地,该设备例如可包括一个或多个处理单元或处理器。
在一例子中,该设备可包括用于执行和/或控制相应功能的装置。然而,该设备也可包括一个或多个另外的部件。该设备可配置成与喇叭扩音器或者喇叭扩音器系统连接,和/或配置成作为喇叭扩音器或者喇叭扩音器系统的辅助装置。该设备可以是由喇叭扩音器或者喇叭扩音器系统包含的或者可连接到喇叭扩音器或者喇叭扩音器系统的辅助装置。
根据第二示例性方面,公开了一种系统,该系统包括根据第一示例性方面的设备并包括包含至少一第一传声器、至少一第二传声器和用于播放音频信息的扬声器的喇叭扩音器或者喇叭扩音器系统。
该系统的所述设备可配置成消除可由喇叭扩音器或者喇叭扩音器系统的远端用户感知的至少一回波。
根据第三示例性方面,公开了一种方法,该方法包括:
-获取表示由至少一第一传声器收集的音频数据的至少一第一信息;
-获取表示由至少一第二传声器收集的音频数据的至少一第二信息;
-确定差分信息,其中差分信息至少部分基于至少一第一信息和至少一第二信息确定;及
-补偿对音频数据的影响,其中第一信息和/或第二信息的音频数据至少部分基于确定的差分信息进行补偿。
该方法可至少通过根据第二示例性方面的系统的设备和/或根据第一示例性方面的设备执行。作为备选,该方法可至少通过根据第二示例性方面的系统的设备执行,尤其是根据第一示例性方面的包括至少一第一传声器和至少一第二传声器的设备执行,所述系统或设备包括用于播放音频信息的扬声器。
根据第四示例性方面,公开了一种计算机程序,所述计算机程序在由处理器运行时使得设备执行和/或控制根据第三示例性方面的方法。
计算机程序可存储在计算机可读存储介质如有形和/或非短暂介质上。计算机可读存储介质例如可以是磁盘、存储器等。计算机程序可以编码计算机可读存储介质的指令的形式存储在计算机可读存储介质中。计算机可读存储介质可计划参与装置如内部或外部存储器例如计算机的只读存储器(ROM)或硬盘的运行或者计划用于分布计算机程序如光盘。
此外,本申请提供包括指令的计算机程序(产品),当该程序由计算机运行时,导致计算机执行上面描述的、“具体实施方式”中详细描述的和/或权利要求中限定的方法(的步骤)。获取表示由至少一第一传声器收集的音频数据的至少一第一信息以及表示由至少一第二传声器收集的音频数据的至少一第二信息;确定表示至少两个信息之间的一个或多个差别的差分信息,其中差分信息至少部分基于至少一第一信息和至少一第二信息确定;补偿影响;调整至少一第一传声器和/或至少一第二传声器收集的音频数据;或者其组合可实施在前述计算机程序(产品)中。
根据第五示例性方面,公开了一种非短暂计算机可读存储介质,其上存储有计算机程序,所述计算机程序在由处理器运行时使得至少一设备执行根据第三示例性方面的方法。计算机可读存储介质包括适于存储包括程序代码的计算机程序的计算机存储介质,当计算机程序在处理系统上运行时使得数据处理系统执行在此描述的方法的至少部分(如大部分或全部)步骤。
作为另一例子,本发明提供喇叭扩音器或者喇叭扩音器系统,其中喇叭扩音器包括喇叭扩音器壳体,其中第一输入变换器和第二输入变换器设置在喇叭扩音器壳体中,输出变换器设置在喇叭扩音器壳体中,处理器与第一传声器、第二传声器和输出变换器通信,其中处理器配置成从第一传声器和第二传声器接收电信号,这些电信号表示分别由第一传声器和第二传声器接收的环境声音,其中来自第一传声器的信号被馈给配置成提供第一校准信号的第一校准单元,自适应滤波器配置成接收第一校准信号,来自第二传声器的信号被馈给配置成提供第二校准信号的第二校准单元,其中处理器配置成基于第一校准信号和第二校准信号建立处理后的信号,其中在处理后的信号中,来自输出变换器的信号贡献被实质上消除。处理器进行的处理可包括确定第一校准信号和第二校准信号之间的差别。自适应滤波器可配置成基于第一校准信号和第二校准信号之间的差别运行。在一些情形下,可能需要控制扬声器/输出变换器的输出电平使得第一和/或第二传声器不会达到不饱和。上述配置和处理预期使能在拾取来自喇叭扩音器附近讲话的人的声音的同时以改进的方式消除来自位于近场内的扬声器的输出信号,该扬声器可能与传声器处于同一壳体中,因为讲话者相对远离。这至少部分基于所谓的平方反比律的假设,其中该假设是,当用户讲话时,传声器上的振幅差相较于从扬声器到每一传声器体验到的差别将不明显。处理器可被包括在喇叭扩音器壳体中,但作为备选,也可位于外部装置如计算机、摄影机装置或其它适当类型的装置中。
可提供外部传声器,其中外部传声器配置成与处理器通信从而从喇叭扩音器提供处理后的声音。外部传声器可提供输入,该输入可用于减少来自喇叭扩音器的环境的混响或其它干扰音频现象。这可包括回波和/或噪声。
为了调整以成功消除来自扬声器/输出变换器的贡献,自适应滤波器在求减之前应包括明显的衰减(以确保扬声器信号的振幅相等)。由于扬声器/输出变换器与传声器之间的距离明显短于从传声器到想要的语音源的距离,可以看出,该阵列类型实施消除“点”而不是消除面。这种方案中的波束形成器因而消除来自本地输出变换器的声音信号,其被假定喇叭扩音器对其不感兴趣,即称为回波,因而改善来自例如房间中使用喇叭扩音器的人的语音的拾取。这样,回波被抑制甚或消除,意味着远端讲话者/用户不会感知到来自使用喇叭扩音器的人的信号因回波而失真。
在前述喇叭扩音器中,传声器可设置成使得传声器和输出变换器一起形成在一平面如在与喇叭扩音器壳体的顶表面平行的平面中通过他们的直线或轴。在一情形下,喇叭扩音器壳体的顶表面可具有圆周,或者喇叭扩音器壳体的顶表面可具有椭圆形周围。
本发明使得,在喇叭扩音器壳体中,当从喇叭扩音器壳体的顶表面看时,第一传声器、第二传声器和输出变换器设置在轴或线上。当这些部件在轴上对齐时,计算不太复杂。
本发明使得,在喇叭扩音器壳体中,当从喇叭扩音器壳体的顶表面看时,第一传声器、第二传声器和输出变换器相对于轴或线偏离设置,自适应滤波器提供补偿这些部件对齐的非对称性的输出信号。该系统的自适应特性还使能克服例如由生产公差甚或部件相对于彼此的故意放置引起的非对称性。
在喇叭扩音器壳体中可包括一个或多个悬置机构。这可在这样的喇叭扩音器中出现,其中喇叭扩音器包括具有扬声器的扬声器包围结构。扬声器可以是机电部件,其在工作时通过扬声器膜片偏斜并与扬声器包围结构协作而产生声波。喇叭扩音器壳体可包括喇叭扩音器的外壳并可容纳喇叭扩音器工作或者其它目的所需的另外的电子元件。扬声器包围结构可机械连接到扬声器装置壳体。在一些实施例中,扬声器包围结构可通过至少一连接件机械连接到扬声器装置壳体。该连接件可具有振动阻尼结构,其配置成抑制通过连接件传递的机械振动。
这使能抑制机械振动从扬声器包围结构到扬声器装置壳体的传递。从而,可减少因扬声器引起及通过连接件传递的咔嗒声以及对容纳在扬声器装置壳体中的电子元件的负面影响。
喇叭扩音器壳体中包括的部件可包括下述之一或多个:无线通信电路、用于无线通信的一个或多个天线、用于有线通信的一个或多个端口如数据通信、功率输入端口。
作为例子但非限制,前述有形计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储器、磁盘存储器或其他磁性存储装置,或者可用于执行或保存指令或数据结构形式的所需程序代码并可由计算机访问的任何其他介质。如在此使用的,盘包括压缩磁盘(CD)、激光盘、光盘、数字多用途盘(DVD)、软盘及蓝光盘,其中这些盘通常磁性地复制数据,同时这些盘可用激光光学地复制数据。上述盘的组合也应包括在计算机可读介质的范围内。除保存在有形介质上之外,计算机程序也可经传输介质如有线或无线链路或网络如因特网进行传输并载入数据处理系统从而在不同于有形介质的位置处运行。
所述系统可适于在喇叭扩音器与所述设备(如辅助装置)之间建立通信链路以使得信息(如控制和状态信号,可能音频信号)可进行交换或者从一装置转发给另一装置。
辅助装置可包括遥控器、智能电话、或者其它便携或可穿戴电子设备如智能手表等。
辅助装置可由遥控器构成或者可包括遥控器,其用于控制所述设备的功能和运行。遥控器的功能实施在智能电话中,智能电话可能运行使能经智能电话控制音频处理装置的功能的APP(所述设备包括适当的到智能电话的无线接口,例如基于蓝牙或一些其它标准化或专有方案)。
辅助装置可以是或包括音频网关设备,其适于(例如从娱乐装置如TV或音乐播放器、从电话设备如移动电话或者从计算机如PC)接收多个音频信号并适于选择和/或组合所接收的音频信号中的适当信号(或信号组合)以传给所述设备。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的或权利要求中限定的装置的部分或所有结构特征可与本发明方法的实施结合,反之亦然。方法的实施具有与对应装置一样的优点。
在下面,将更详细地描述所有方面的另外的示例性特征。
例如,在喇叭扩音器或者喇叭扩音器系统中,由远端用户(如电话会议的参与者)感知到的回波可能是损害自然会话的主要因素。喇叭扩音器或者喇叭扩音器系统的扬声器(喇叭)播放的声音可能被至少一第一传声器和/或至少一第二传声器拾取并例如作为回波返回到远端用户。
至少一第一信息例如可通过接收或触发至少一第一信息的提供而获取。至少一第一信息可由至少一第一传声器收集(如记录)。至少一第一信息至少部分是或包括信号。至少一第一信息表示由至少一第一传声器收集(如记录)的音频数据。音频数据计划提供给远端用户,例如作为可由远端用户感知的话音或语音。通过收集而分别获取至少一第一信息和至少一第二信息,启用收集(如记录)而分别获取的两个通道。
至少一第二信息例如可通过接收或触发至少一第二信息的提供而获取。至少一第二信息可由至少一第二传声器收集(如记录)。至少一第二信息至少部分是或包括信号。至少一第二信息表示由至少一第二传声器收集(如记录)的音频数据。
至少一第一信息和至少一第二信息可通过至少一第一传声器和至少一第二传声器同时收集(如记录)。至少一第一传声器和/或至少一第二传声器可被所述设备包含或者可连接到所述设备。在至少一第一传声器和至少一第二传声器未被所述设备包含的情形下,由至少一第一传声器和至少一第二传声器收集的至少一第一信息和至少一第二信息被提供(如传输)给所述设备,使得所述设备能够获取(如接收)至少一第一信息和至少一第二信息。
至少一第一传声器和至少一第二传声器可配置为双向传声器。作为备选或另外,至少一第一传声器和至少一第二传声器可配置为单点消除器。在至少一第一传声器和至少一第二传声器被配置为单点消除器的情形下,相对于至少一第一信息和至少一第二信息基于其进行收集的声源(如扬声器或喇叭),至少一第一传声器和至少一第二传声器可不等距地设置(如放置)。在至少一第一传声器和至少一第二传声器被配置为双向配置的情形下,理想地但不必须,至少一第一传声器和至少一第二传声器与前述声源等距地设置(如放置)。目前,第一传声器和第二传声器优选为全向传声器。包括第一和第二传声器的组合的传声器系统可以是双向传声器系统。
差分信息表示至少两个信息之间的一个或多个差别。差分信息至少部分基于通过至少一第一传声器和至少一第二传声器收集的至少一第一信息和至少一第二信息进行确定。在至少一第一传声器和至少一第二传声器被配置为双向传声器例如与声源(如扬声器,一个或多个电话会议参与者因而一个或多个远端用户的话音使用其进行播放)等距设置和/或在该声源的每一侧镜像设置时,可形成通过该声源的对称线。这使能消除影响音频数据的线性和非线性部分。这样的影响可以是回波。回波可能源自例如设备中的喇叭。传声器可以同样的电平退场从而在同样的动态范围工作并展现接近一样的失真。此外,前述影响可以是失真,其可能由机械传递引起。例如,如果机械设计被使得沿对称线对称,如上所述,及对于至少一第一传声器和至少一第二传声器一样,后者可被算入。该影响可被补偿,例如通过确定将向电话会议的远端用户播放的、经补偿的音频数据,这仅为一个非限制性的例子。
这使能启用双通道差分消除器。
至少一第一传声器和至少一第二传声器可设置成具有指向性如双向模式,其可优选地消除处于所谓的“零位面”中的任何声源。在此使用的“零位面”指处于传声器几乎不收集音频数据的传声器模式的方向。
例如,将喇叭扩音器或者喇叭扩音器系统的喇叭放在该“零位面”中可能明显降低来自至少一第一传声器和至少一第二传声器的信号中的源自扬声器/输出变换器的音频量,即在处理来自这些传声器的输入信号之后。然而,这可能消除或至少衰减来自同一地方的所有其它音频数据,包括想要的语音,仅作为非限制性的例子。
对音频数据的影响可由一个或多个非线性部件和/或机械振动导致(如回波),其中一个或多个非线性部件和/或机械振动至少部分通过至少部分消除而进行补偿。
例如,抑制回波对音频数据的影响的一种方法是使用空间信息,例如喇叭与至少一第一传声器和/或至少一第二传声器之间的关系。
在所述设备的单点消除器配置中,例如回波可能由喇叭引起,其它降级源包括由至少一第一传声器和/或至少一第二传声器导致的非线性,和/或来自例如振动的机械传递,这些仅为几个非限制性的例子。通过在传给远端用户之前补偿至少一第一传声器和至少一第二传声器收集(如记录)的音频数据,前述影响(如可由远端用户听见的回波)可被有效地消除,而不需要相应喇叭扩音器系统的喇叭和传声器的高对称性布置。
本发明方法还可包括:
-调整由至少一第一传声器和/或至少一第二传声器收集的音频数据,其中调整影响至少一第一传声器和/或至少一第二传声器的性能的一个或多个参数,使得至少一第一传声器和至少一第二传声器之间的性能差异被消除。
在此使用的一个或多个参数可包括传声器灵敏度、传声器阻抗、传声器频率响应、传声器过载、传声器失真或其组合,这些仅作为几个非限制性的例子。调节一个或多个参数可使能消除可导致至少一第一传声器和至少一第二传声器之间的、音频数据的不同收集(如记录)的差异(例如如果有的话)。此外,这使能在确定差分信息之前,至少一第一信息和至少一第二信息能有偏。消除可至少部分经校准模块实现,其针对相应设备包含的至少一第一传声器和/或至少一第二传声器包括相应的校准模块。
差分信息例如可通过将至少一第一信息从至少一第二信息减去和/或通过将至少一第二信息从至少一第一信息减去而确定。这可通过相应设备包含的加法电路进行。因而,差分信息的确定可利用至少一加法电路。如在此使用的,前述至少一加法电路可配置成将第一信息从第二信息减去或将第二信息从第一信息减去。
在求减之前,可调整至少一第一传声器和/或至少一第二传声器。
一个或多个参数可根据至少一第一传声器和/或至少一第二传声器的当前老化状态进行调节,使得例如导致至少一第一传声器和/或至少一第二传声器收集(如记录)的音频数据改变的老化影响可被补偿。老化可能因时间消逝而出现,但也可能因突然的变化如设备掉落引起,其可能导致部件降级进而可能具有与老化同样的影响,即使得部件表现比初始指定的差。在此提及的方法和设备可适于检测可表示一个或多个部件的降级状态的当前状态。这样,使能至少一第一传声器和/或至少一第二传声器的校准和/或匹配。通过至少一第一传声器和至少一第二传声器收集的至少一第一信息和至少一第二信息可以类似的传声器性能进行收集,相应的传声器性能在所述设备的寿命期间可保持一样或至少类似。
音频数据的调整可利用至少一校准电路,其配置成调整至少一第一传声器和/或至少一第二传声器的一个或多个参数。前述至少一校准电路例如可以是调节元件,作为一个非限制性例子,例如频率响应校准电路。此外,调整也可受益于至少一第一传声器和/或至少一第二传声器的相位校准,其中相位校准可通过校准传声器彼此的相位进行。这可至少部分基于从喇叭播放的信号进行。
补偿可利用至少一补偿电路。前述至少一校准电路可配置成校正至少一第一传声器和至少一第二传声器的双向配置或单点消除器配置可能已导致的、任何不想要的对信号的影响。根据相应喇叭扩音器的物理扬声器-传声器布置,所得的指向性可能不必然是双向。同样,前述指向性可以是单向,其中单点消除器配置可使能补偿影响至少一第一传声器和至少一第二传声器收集的音频数据的、不想要的影响。
喇叭可以是扬声器单元或者可由前述扬声器单元包含。喇叭可用于播放音频信息。例如,音频信息可通过至少一第一传声器和/或至少一第二传声器收集,从而使将被传给远端用户的音频数据能被补偿,进而使远端用户能不会感知到不想要的影响(如回波)地体验音频数据。
这样,根据第一示例性方面的设备可配置成消除可由相应喇叭扩音器的远端用户感知的至少一回波。
上述特征应被视为以彼此任何组合的方式公开。此外,执行方法步骤的任何装置的公开应当理解为同样公开了相应的方法步骤,方法步骤的公开应当理解为同样公开了执行步骤的相应装置。
附图说明
本发明的各个方面将从下面结合附图进行的详细描述得以最佳地理解。为清晰起见,这些附图均为示意性及简化的图,它们只给出了对于理解本发明所必要的细节,而省略其他细节。在整个说明书中,同样的附图标记用于同样或对应的部分。每一方面的各个特征可与其他方面的任何或所有特征组合。这些及其他方面、特征和/或技术效果将从下面的图示明显看出并结合其阐明,其中:
图1a示出了根据所有示例性方面的喇叭扩音器系统的俯视图;
图1b示出了根据图1a的喇叭扩音器系统的截面图;
图2示出了双向传声器极坐标图;
图3示出了根据所有示例性方面的喇叭扩音器系统的示意性框图;
图4示出了根据所有示例性方面的喇叭扩音器系统的另一示意性框图;
图5示出了根据所有示例性方面的喇叭扩音器系统的又一示意性框图;
图6示出了根据所有示例性方面的方法的流程图。
具体实施方式
下面结合附图提出的具体描述用作多种不同配置的描述。具体描述包括用于提供多个不同概念的彻底理解的具体细节。然而,对本领域技术人员显而易见的是,这些概念可在没有这些具体细节的情形下实施。装置和方法的几个方面通过多个不同的块、功能单元、模块、元件、电路、步骤、处理、算法等(统称为“元素”)进行描述。根据特定应用、设计限制或其他原因,这些元素可使用电子硬件、计算机程序或其任何组合实施。
电子硬件可包括微机电系统(MEMS)、(例如专用)集成电路、微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、选通逻辑、分立硬件电路、印刷电路板(PCB)(如柔性PCB)、及配置成执行本说明书中描述的多个不同功能的其它适当硬件,例如用于感测和/或记录环境、装置、用户等的物理性质的传感器。计算机程序应广义地解释为指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、可执行、执行线程、程序、函数等,无论是称为软件、固件、中间件、微码、硬件描述语言还是其他名称。
喇叭扩音器或者喇叭扩音器系统可以是或包括根据第一示例性方面的设备,其适于改善或增强远端用户的听觉能力从而接收声信号(如音频数据)。“改善或增强远端用户的听觉能力”可包括补偿音频数据。“喇叭扩音器”还可指适于以电子方式接收音频数据的装置如会议电话、耳麦或耳机,可能补偿音频数据及将可能经补偿的音频数据作为可听见的信号提供给用户的至少一只耳朵。前述音频数据可以下述形式提供:辐射到用户外耳内的声信号、作为机械振动通过用户头部的骨结构和/或通过用户中耳的部分传到用户内耳的声信号、或者直接或间接传到用户的耳蜗神经和/或听觉皮层的电信号。
喇叭扩音器或者喇叭扩音器系统(例如在此也称为听力系统)可指包括至少一根据第一示例性方面的设备的系统,例如包括至少两个传声器,其中相应的装置适于协作地将音频数据提供到例如远端用户的耳朵和/或至少根据另一例子的装置。喇叭扩音器或者喇叭扩音器系统至少包括喇叭扩音器壳体、输出变换器/扬声器及包含第一和第二传声器的输入系统。喇叭扩音器或者喇叭扩音器系统可配置成与一个或多个另外的辅助装置通信,辅助装置与所述至少一设备通信,辅助装置影响至少一设备的运行和/或受益于至少一设备的功能。在至少一设备和辅助装置之间可建立有线或无线通信链路以使信息(如控制和状态信号,可能音频信号和/或音频数据)能在其间进行交换。辅助装置可至少包括下述之一:遥控器、远程传声器、音频网关设备、无线通信设备如移动电话(例如智能电话)或平板电脑或例如包括图形界面的另一设备、广播系统、汽车音频系统、音乐播放器或其组合。音频网关设备可适于如从娱乐装置例如TV或音乐播放器,从电话装置例如移动电话,或从计算机例如PC接收多个音频信号。辅助装置还可适于(例如使用户能)选择和/或组合所接收音频信号(或信号组合)中的适当信号以传给至少一听力装置。遥控器适于控制至少一听力装置的功能和/或运行。遥控器的功能可实施在智能电话或其它(如便携)电子设备中,该智能电话/电子设备可能运行控制至少一听力装置的功能的应用程序(APP)。
一般地,喇叭扩音器或者喇叭扩音器系统包括:i)用于从用户周围接收音频数据(如声信号)并提供对应的输入音频信号的输入单元如传声器;和/或ii)用于以电子方式接收输入音频数据的接收单元。喇叭扩音器或者喇叭扩音器系统还包括用于处理输入音频信号的信号处理单元及用于根据经补偿的音频信号将听得见的信号提供给用户的输出单元。
输入单元可包括多个输入传声器,例如用于提供随方向而变的音频信号处理。前述定向传声器系统适于(相对地)增强用户环境中的多个声源中的目标声源和/或衰减其它声音(如噪声)。在一方面,该定向系统适于检测(如自适应检测)传声器信号的特定部分源自哪一方向。这可使用传统已知的方法实现。信号处理单元可包括适于将随频率而变的增益施加到输入音频信号的放大器。
信号处理单元还可适于提供其它适宜的功能如压缩、降噪等。
几十年来,“理想的”商务会议均是所有参与者物理上同时出现在房间中的情形。这使出席人员能容易地发表想法、问问题、交换信息和接收反馈。
当然,将所有会议参与者集合在单一房间中不总是可行甚至在现今不可取。此外,随着商务已日益变得全球化及技术日益强健,许多商务会议现在在喇叭扩音器的帮助下经视频会议进行。
为确保最好可能的会议,喇叭扩音器需要准确地再现物理上与其它呼叫参与者一起出现情形的体验。他们需要复制的最重要的活动为双端讲话。当数字呼叫两端的人打断、询问或评论彼此发言因而同时讲话时,出现会话的自然部分即双端讲话。
使能双端讲话的技术难题
在双端讲话容易在所有参与者均物理上出现在一个房间中时出现的同时,对于许多通信设备,尤其对于喇叭扩音器,复制这样的活动是困难的技术挑战。
这是因为,喇叭扩音器设计上是开放的音频系统,其包括对空气完全开放的喇叭和传声器(或者一系列传声器)。在这具有使许多出席人员能参与同一呼叫的优点的同时,也可能产生不想要的副作用即回波,其在来自喇叭的声音被传声器拾取并传回到远端处的扬声器时出现。
回波的多种原因
在从喇叭扩音器的喇叭传播到其传声器的音频波为最常见的回波原因的同时,回波原因远远不止一个。回波可具有许多原因,实际上,许多因素可同时出现而导致回波情形。
喇叭扩音器的设计和构造可能是回波的主要贡献者。较差设计的设备或者使用低质量材料和元件构建的设备使音频波能随着振动通过喇叭扩音器主体而立即到达传声器,从而导致回波。
喇叭扩音器的大小和布局也可导致回波。一般地,随着喇叭与传声器之间的距离减小,产生回波的机会增加,因为音频波具有更短的传播路径。小的喇叭扩音器可能特别容易遭受回波,因为它们的紧凑设计限制了喇叭与传声器之间的可用空间。
局部声音环境如其中正进行呼叫的会议室同样扮演产生回波的角色。来自喇叭的音频波自然从墙壁、打开的笔记本电脑屏幕以及会议室内的其它物体和人反射。由于声音以不同的速度通过这些表面或者从这些表面反射,这些信号在不同的时间到达传声器,即结构传播的波立即到达,空气传播的波一毫秒后到达。
控制回波的策略
既然回波老是存在,怎样能够从喇叭扩音器呼叫消除呢。这是音频工程师几十年来努力解决的问题且仍然在努力以寻求完美解决。重要地,应注意,回波是经常变化的声音非自然信号,其恒定地以新的形状和形式出现。在现实中,使用目前的技术,回波不能被彻底消除。然而,其可进行控制,在许多情形下,其可高度有效地控制。
用于减轻回波的策略包括喇叭扩音器设计、构造和材料方面的、采用高度先进的回波消除特征的任何策略。
音乐厅-图书馆:量化回波消除难题
消除来自喇叭扩音器的回波是主要任务。实质上,其困难相当于将非常大声的摇滚音乐会的音量降低到安静的图书馆的音量。
喇叭扩音器的最大声声音在喇叭边缘处出现并具有约115-125dB的声压级(SPL)。该SPL应被降低到约35dB以被传声器自噪声“淹没”因而不可能产生回波。
通过设计控制回波
控制喇叭扩音器回波的第一步骤是缜密思考硬件设计和不屈不挠地注意细节。从设备的物理设计到构造时使用的材料质量均扮演减少回波的角色,从而使能自然会话并产生显著的会议体验。然而,这不是本发明的主要焦点。
一些声学设计考虑包括:
-智能底架设计。当涉及喇叭扩音器的物理设计时,没有任何细节是太小的细节而不去注意。例如,喇叭扩音器系统可与底架的其余部分隔离以避免声音经底架振动从喇叭传到传声器;
-最佳扬声器位置。由于回波风险随着喇叭更靠近传声器而增加,传声器阵列的位置尽可能远离喇叭以使回波风险最小化;
-性能-质量部件。最高质量的扬声器和传声器为线性且提供平的可预测的频率响应的部件,这有助于使经常导致回波的“惊喜”声音最小化。
本发明主要涉及通过信号处理控制回波。
由于回波以多种不同的形式出现并可源自许多来源,显著的喇叭扩音器设计独自不足以完全控制回波。因而,音频工程师采用一系列(从基本到高度先进的)数字信号-处理策略来识别和减轻回波源。
一般地,大多数回波消除策略寻求将传声器信号与喇叭信号进行比较,然后通过去除来自喇叭的所有信号分量而使传声器信号“纯净”。
信号处理策略的概览包括:
传声器停用
最基本的回波消除系统及在一些较低级喇叭扩音器中使用的系统通过在讲话端的人正讲话时使接收喇叭扩音器的传声器自动静音而起作用。当喇叭扩音器中的算法在喇叭处感测到信号时,其标示另一人正在讲话,将接收侧的传声器关闭,从而消除任何不想要的声音和消除回波的可能性。当该系统认识到扬声器处不存在信号时,其启用接收侧的传声器,从而使相应的人能响应。
这种回波消除策略的最大缺陷在于其不允许双端讲话。由于没有一人打断或确认另一人的讲话或者二人同时讲话的能力,这种方法不能实现自然会话或者不能提供积极的用户体验。
使用自适应传声器拾取模式
先进得多的回波消除策略将定向传声器包括在喇叭扩音器设计中。当喇叭处存在信号时不是完全关闭接收传声器,而是算法将传声器从全向模式切换到指向远离喇叭方向的定向拾取模式,因而使从喇叭传播到传声器的音频最小化。当该系统认识到喇叭处不存在信号时,其将传声器切换回到全向模式,坚持确保最佳的双端讲话性能。
延迟喇叭信号并将其从传声器信号减去
这种策略采用几种先进的信号处理技术来使从喇叭到传声器的轻微泄漏不起作用,无论传声器的拾取模式的质量如何,前述泄漏均会发生。喇叭信号被传回到传声器信号通路,然后被延迟和倒向,以消除可能已泄漏到传声器内的任何残余的空气传播的喇叭信号。这种对信号倒向和相位延迟并将其与原始信号组合的先进处理在促进双端讲话和消除回波风险方面高度有效。
先进的回波消除
在先前描述的回波消除策略的组合在使用喇叭扩音器时可有效控制回波的同时,已开发先进的回波消除系统。
这种超高性能的系统可包括线性和非线性信号处理的结合,其基于数千个预定义的参数不断地测量、估计和更新自身。与目前技术发展水平的能将人类话音与其它外来音频有效地分开的传声器阵列结合,根据本发明的系统可确保高质量声音和自然的会议体验而不干扰声音非自然信号。
该系统的一些组成可包括:
-参考干扰信号—模拟可能可导致回波的喇叭信号。当该信号通过喇叭以不同的音量水平进行播放时,根据音量水平,其将或多或少变得失真。该特征尽可能准确地估计干扰信号以将其有效地滤掉;
-空间环境分析—分析会议室并在会议期间识别可能的空间变化,如人移动而更靠近传声器或者人进入会议室;
-调整和去除—不断地根据变化的环境调整并去除干扰信号。
优选地,喇叭扩音器应能够再现物理上与其他呼叫参与者一起出现时的体验从而确保自然的讲话和会议环境。
在最重要的活动之中,喇叭扩音器需要复制的是双端讲话,其在数字呼叫两端的人同时讲话时出现。对于喇叭扩音器,复制该活动在技术上由于回波风险而比较困难,其中回波通常在来自喇叭的音频信号被传回到传声器然后被讲话的人时出现。
回波是持续变化的、永远不能完全消除的声音非自然信号,但其可通过优秀的设计和材料以及几种先进的回波消除策略进行控制。
为什么喇叭扩音器易有回波而耳麦没有
在喇叭扩音器易遭受回波的同时,耳麦很大程度上不受回波影响。原因在于,首先,喇叭扩音器需要播放比耳麦高的音量,这增大了回波机会。其次,与为开放音频系统的喇叭扩音器不同,耳麦很大程度上为封闭的音频系统。耳朵周围的泡沫垫防止音频波逸离从而被传声器拾取进而导致不想要的回波。
现在参考图1a和图1b,其示出了例如用于补偿回波的喇叭扩音器系统100,200,300。图1a示出了根据所有示例性方面的喇叭扩音器系统100,200,300的俯视图。图1b示出了根据所有示例性方面的喇叭扩音器系统100,200,300的截面图。
喇叭扩音器系统100,200,300包括喇叭扩音器壳体或底架17。在喇叭扩音器底架17内,设置扬声器室16。扬声器室16配置成接收扬声器单元如喇叭14,其例如利用喇叭扩音器系统100,200,300将远端用户提供的音频信息播放给电话会议的一个或多个用户或参与者。此外,喇叭扩音器系统100,200,300包括至少两个传声器,目前为第一传声器10a和第二传声器10b。第一传声器10a和第二传声器10b设置在喇叭扩音器系统100,200,300的传声器室处。第一传声器10a和第二传声器10b沿对称线SL设置,该对称线沿喇叭扩音器系统100,200,300的纵向延伸。喇叭扩音器系统100,200,300配置成执行和/或控制根据所有示例性方面的方法。喇叭扩音器系统100,200,300可包括根据第一示例性方面的设备或者可以是至少其一部分。
如图1b的截面图中所示,在传声器室与扬声器室16之间,及另外在扬声器室16与喇叭扩音器底架17左边的第三室之间,设置悬置件18,例如用于衰减振动从喇叭扩音器系统100,200,300的一室到另一室的机械传递。具体地,由扬声器室16的喇叭14引起的、可能传递到第一传声器10a和第二传声器10b的所述室的一个或多个振动被减少或避免。此外,喇叭扩音器系统100,200,300包括几个座部19-1到19-6,另外,由于图1b的截面图,另外的座部未被示出。座部19-1到19-6还可减少可由第一传声器10a和第二传声器10b收集的失真,例如通过使喇叭扩音器系统100,200,300与置放其的设施分离。在此,喇叭扩音器系统100,200,300放在桌子、地面或地板1上。
第一传声器10a和第二传声器10b可分别配置为双向传声器。这样的双向传声器具有如图2的双向传声器极坐标图2中所示的指向性。在极坐标图2中,示出了相应双向传声器的两个捕获定向拾取模式2a和2b。从这些方向到达的音频数据可被双向传声器收集(如记录)。因而,这样的双向传声器配置成拾取主要从两个方向到达的音频数据。此外,极坐标图2中示出了存在所谓的“零位面”2c。在零位面2c中,任何声源均被有效地消除。通过将图1a、1b的喇叭扩音器系统100,200,300的扬声器如喇叭14放在相应传声器(如图1a、1b的第一传声器10a和/或第二传声器10b)的零位面中,源自扬声器的音频量可明显降低或消除。然而,在该零位面2c中的所有声源均被消除,包括想要的语音。
现在参考图3,其示出了根据所有示例性方面的喇叭扩音器系统的示意性框图。一实施例可以是双通道差分回波消除器系统,如图3中所示的系统100。该系统100配置成通过使用双向传声器10a,10b消除(如抑制)回波。此外,可使用如上所述的例如补偿音频数据的数字信号处理。系统100包括两个传声器10a,10b、包含两个校准电路11a,11b(CaC)的校准模块,其配置成调节传声器10a,10b中的至少一个,例如使得传声器10a,10b相等或者至少类似。传声器10a,10b收集(如记录)源自系统100包含的喇叭14的音频数据。包含两个校准电路11a,11b的校准模块以性能为代价或者简单地由于两个传声器相等或非常相似而可省略。然而,为确保良好的性能,即输出变换器/喇叭14的高衰减,信号应被校准使得来自相应传声器的信号具有实质上相似的频率响应。此外,在该情形下,由于两个传声器的一个或多个参数跨相应传声器10a,10b的生命周期变化,如果两个传声器10a,10b具有同样或类似的年龄则有利。此外,系统100包括加法电路12,其使得来自第一和第二传声器10a,10b的信号15a,15b彼此相减。此外,系统100包括补偿电路13(Cmp),其校正(如双向)传声器10a,10b已导致的、任何不想要的对音频数据(如信号15a,15b)的影响。图3中所示的系统在传声器相对于喇叭对称地设置时性能最好,非对称性将导致性能降级。
现在参考图4,其示出了根据所有示例性方面的喇叭扩音器系统的另一示意性框图。一实施例可以是配置成通过使用两个双向传声器10a,10b的自适应设置而消除(如抑制)回波的(如听力)系统200。该系统200使能校准或匹配两个传声器10a,10b,可选的另外的声学元件未在图4中示出。系统200在两个传声器10a,10b i)生产成具有类似的性能及ii)在相应传声器10a,10b的寿命周期期间保持一样的情形下可受益。
在图4中,这些模块示意性地示出了自适应Bi-DIR的实施。相对于图4,已添加一模块,其配置成在求减之前操控传声器之一的振幅和/或相位。这可以是滤波器。滤波器优化可以是最速下降类算法,但用于优化的方法不重要。优化应使求减模块的输出处的能量在扬声器播放时最小化。这预期有效地将滤波器调整为与上述方法非常类似的方案,但能够对传声器校准和周围声学中的缺点建模,即表现优于另一方法。
可以有不同于主动扬声器/喇叭的其它调整条件。另一情形是在双端讲话期间,在此,喇叭将播放,同时使用喇叭扩音器的人也讲话。传声器将拾取两个信号。喇叭扩音器的目标是消除喇叭信号并传送用户的语音,重要的是实现用户的语音在该情形下对于调整算法被视为噪声。因此,在双端讲话期间最可能需要停止或减慢调整。
在图4中,保留了校准电路,但可省略。因为声学和老化问题,在生产时进行初始校准以确保对于无价值任务不使用自适应滤波器复杂性而是“节省”从而用于更复杂的任务可能有价值。
与结合图3公开的方法一样,结合图4公开的方法将减少整个对称面上拾取的音频能量,该对称面垂直于两个传声器和扬声器形成的平面,及保持传声器的对称性。
相比于图3的系统100,系统200还包括调节元件20。调节元件20可在加法电路(也称为求减单元)12中求减之前调节来自传声器之一在此为传声器10a的信号15a。在实施例中,调节元件20可以是或者可由滤波器表示。优化可以使加法电路的输出最小化(例如执行和/或控制的、信号15a,15b的求减)的方式进行,例如当相应调整的条件适当时。作为非限制性例子,相应的条件可以是喇叭14正播放例如由远端用户提供给喇叭扩音器系统200的音频数据。
相比于图3的系统100,保留了校准电路11a,11b,但由于调节元件20可设定传声器10a,10b中的至少一个的一个或多个参数使得两个传声器具有相等或类似的参数,校准电路可省略。这样,由相应的两个传声器10a,10b收集的第一信息和第二信息的偏差可得以消除。在实施例中,可进行两个传声器10a,10b的初始校准,例如在生产喇叭扩音器系统200时。
现在参考图5,其示出了根据所有示例性方面的喇叭扩音器系统的又一示意性框图。一实施例可以是系统300,其配置成通过使用所包含的两个(如双向)传声器10a,10b的自适应差别消除器设置而消除(如抑制)回波。该系统300不同于上面描述的、图3的系统100和图4的系统200的地方在于,系统300配置成消除相应传声器10a,10b的指向性的整个平面,例如如图2中所示的零位面。此外,系统300可延伸到可观范围的平面,例如由于系统300使能的极坐标图的形状。有效的消除角度有意义(例如相较于完全360度的可能消除角度)。
如上所述,已减少对称面中的声音拾取的补偿方法是物理上相对于扬声器重新布置传声器。这在图5中示出。可以看出,传声器现在位于来自扬声器的直线中。最靠近扬声器的传声器将接收比第二传声器明显更高的信号。事实如此,因为我们处于声源(扬声器)的声学近场中。这通常称为“平方反比律”。这表明能量随着距离的平方减小。当非常靠近声源时,其影响很明显,这在结合图5公开的方法中进行了利用。
在图5所示的配置中,具有喇叭扩音器的房间中的用户被视为“远离”传声器(相较于扬声器),由于平方反比律,传声器的振幅差相较于从扬声器体验到的差异将不明显。
图4和图5的电路基本上类似,但传声器相对于彼此和扬声器进行了重新布置。应注意,当移动传声器更靠近扬声器时,防护免遭传声器饱和很重要。
为了在消除来自扬声器的贡献时很好地进行调整,自适应滤波器应在求减之前包含明显的衰减(以确保扬声器信号的振幅相等)。由于扬声器与传声器之间的距离明显低于距想要的语音的距离,可以看出,该阵列类型实施消除“点”而不是消除面,如上所述。在文献中,这有时称为近场波束形成器,然而,在本申请中,该配置用作近场波束形成器以在喇叭扩音器应用中消除扬声器信号,这不是常见的使用。本发明包括移动传声器之一非常靠近扬声器,这与在希望从传声器信号去除或消除时移动传声器更靠近声源的直觉相反。
图5也可被描述为喇叭扩音器或者喇叭扩音器系统300,其中喇叭扩音器300包括喇叭扩音器壳体。第一输入变换器10a和第二输入变换器10b设置在喇叭扩音器壳体中。输出变换器14设置在喇叭扩音器壳体中。处理器设置成与第一传声器10a、第二传声器10b和输出变换器14通信,其中该处理器配置成从第一传声器10a和第二传声器10b接收电信号,这些电信号表示分别由第一传声器10a和第二传声器10b接收的环境声音。来自第一传声器10a的相应信号被馈给配置成提供第一校准信号的第一校准单元11a。自适应滤波器20配置成接收第一校准信号。来自第二传声器10b的信号被馈给配置成提供第二校准信号的第二校准单元11b。处理器配置成基于第一校准信号和第二校准信号建立处理后的信号。在处理后的信号中,来自输出变换器14的信号贡献被实质上消除或减少。处理器进行的处理可包括确定第一校准信号15a和第二校准信号15b之间的差别。自适应滤波器可配置成基于第一校准信号和第二校准信号之间的差别运行。
系统300的两个传声器10a,10b相对于喇叭14重新布置(相较于图3的系统100及图4的系统200使用的两个相应传声器)。两个传声器10a,10b与喇叭14位于直线SL中(例如参见图1a)。最靠近喇叭14的传声器10a将比第二传声器10b接收明显更高的信号(由传声器10a收集的相应第一或第二信息表示),第二传声器10b沿线SL相对于喇叭14设置在第一传声器10a后面。因此,为了成功消除来自喇叭14的影响(如贡献)的调整,使能校准的自适应滤波器20(或者图3的系统100和/或图4的系统200的相应校准电路如11a,11b)可包含明显的衰减。由于喇叭14与两个传声器10a,10b之间的距离明显低于距想要的语音的距离,这样的阵列类型的消除“点”相较于图3和图4中所示的设置/系统100,200明显减少,其中该平面原则上可无限扩展。图1a、1b中所示的传声器布置以及处理(例如如上所述的补偿音频数据)可使i)图5的系统300所示的布置的远场极坐标图逼近其中从所有方向(相应极坐标图的360度圆圈)到达的音频数据均可被收集(如记录)的“全向模式”。因而,在零位面(参见图2的零位面2c)内消除可能不存在。代替这样的“零位面”,系统300可能允许具有“零位点”。
图6示出了根据所有示例性方面的方法的流程图600。流程图600可由根据第一示例性方面的设备执行和/或控制。作为备选,流程图600可由根据第二示例性方面的系统(如图3、图4和/或图5的系统100,200,300;和/或图1a,1b中所示的喇叭扩音器)执行和/或控制。
在第一步骤610,例如通过从第一传声器(如传声器10a)和从第二传声器(如传声器10b)接收至少一第一信息和至少一第二信息而获取至少一第一信息和至少一第二信息。
在第二步骤620,确定差分信息。差分信息至少部分基于在步骤610中获取的至少一第一信息和至少一第二信息确定。
在第三步骤630,补偿对音频数据的影响,其中音频数据由第一信息和/或第二信息表示或包含。补偿可至少部分基于在步骤620确定的差分信息进行和/或控制。
在第四步骤640,调整由至少一第一传声器(如传声器10a)和/或至少一第二传声器(如传声器10b)收集的音频数据。调整至少一第一传声器和/或至少一第二传声器的、可能影响至少一第一传声器和/或至少一第二传声器的相应性能的一个或多个参数。这例如使能消除至少一第一传声器和至少一第二传声器的性能差异。
本发明还至少涉及下面的项目:
包括至少一处理器和包含计算机程序代码的至少一存储器的设备,至少一存储器和计算机程序代码配置成与至少一处理器一起使得所述设备至少执行:
-获取表示由至少一第一传声器(10a)收集的音频数据的至少一第一信息及表示由至少一第二传声器(10b)收集的音频数据的至少一第二信息;
-确定表示至少两个信息之间的一个或多个差别的差分信息,其中差分信息至少部分基于至少一第一信息和至少一第二信息确定;及
-补偿对音频数据的影响,其中第一信息和/或第二信息的音频数据至少部分基于确定的差分信息进行补偿。
当由对应的过程适当代替时,上面描述的、“具体实施方式”中详细描述的及权利要求中限定的装置的结构特征可与本发明方法的步骤结合。
除非明确指出,在此所用的单数形式“一”、“该”的含义均包括复数形式(即具有“至少一”的意思)。应当进一步理解,说明书中使用的术语“具有”、“包括”和/或“包含”表明存在所述的特征、整数、步骤、操作、元件和/或部件,但不排除存在或增加一个或多个其他特征、整数、步骤、操作、元件、部件和/或其组合。应当理解,除非明确指出,当元件被称为“连接”或“耦合”到另一元件时,可以是直接连接或耦合到其他元件,也可以存在中间插入元件。如在此所用的术语“和/或”包括一个或多个列举的相关项目的任何及所有组合。除非明确指出,在此公开的任何方法的步骤不必须精确按所公开的顺序执行。
应意识到,本说明书中提及“一实施例”或“实施例”或“方面”或者“可”包括的特征意为结合该实施例描述的特定特征、结构或特性包括在本发明的至少一实施方式中。此外,特定特征、结构或特性可在本发明的一个或多个实施方式中适当组合。提供前面的描述是为了使本领域技术人员能够实施在此描述的各个方面。各种修改对本领域技术人员将显而易见,及在此定义的一般原理可应用于其他方面。除非明确指出,以单数形式提及的元件不意指“一个及只有一个”,而是指“一个或多个”。除非明确指出,术语“一些”指一个或多个。
因而,本发明的范围应依据权利要求进行判断。
Claims (15)
1.一种喇叭扩音器,包括:
喇叭扩音器壳体;
设置在喇叭扩音器壳体中的第一输入变换器和第二输入变换器;
设置在喇叭扩音器壳体中的输出变换器;
与第一传声器、第二传声器和输出变换器通信的处理器,其中处理器配置成从第一传声器和第二传声器接收电信号,所述电信号表示分别由第一传声器和第二传声器接收的环境声音;
第一校准单元,其中来自第一传声器的信号被馈给配置成提供第一校准信号的第一校准单元;
配置成接收第一校准信号的自适应滤波器,所述自适应滤波器基于所接收的第一校准信号提供第一滤波后的输出信号;
第二校准单元,其中来自第二传声器的信号被馈给配置成提供第二校准信号的第二校准单元;
其中处理器配置成基于第一滤波后的输出信号和第二校准信号建立处理后的信号,其中在处理后的信号中,来自输出变换器的信号贡献被实质上消除。
2.根据权利要求1所述的喇叭扩音器,其中,所述处理器设置在所述喇叭扩音器壳体中或者配置成与喇叭扩音器有线或无线通信的远程设备中。
3.根据权利要求1所述的喇叭扩音器,其中,所述处理器进行的处理包括确定第一滤波后的输出信号和第二校准信号之间的差别。
4.根据权利要求1所述的喇叭扩音器,其中,自适应滤波器配置成基于第一滤波后的输出信号和第二校准信号之间的差别运行。
5.根据权利要求1所述的喇叭扩音器,其中,所述差分信息通过将第一滤波后的输出信号从第二校准信号减去或者通过将第二校准信号从第一滤波后的输出信号减去而进行确定。
6.根据权利要求1所述的喇叭扩音器,其中,音频处理中的一个或多个参数基于至少一第一传声器和/或至少一第二传声器的确定的当前老化状态进行调节,使得导致至少一第一传声器和/或至少一第二传声器收集的音频数据改变的老化影响被补偿。
7.根据权利要求6所述的喇叭扩音器,其中,所述当前老化状态包括或者是当前降级状态的确定。
8.根据权利要求1所述的喇叭扩音器,其中,在喇叭扩音器壳体中,当从喇叭扩音器壳体的顶表面看时,第一传声器、第二传声器和输出变换器设置在轴或线上。
9.根据权利要求1所述的喇叭扩音器,其中,在喇叭扩音器壳体中,当从喇叭扩音器壳体的顶表面看时,第一传声器、第二传声器和输出变换器相对于轴或线偏离设置,自适应滤波器提供补偿这些部件对齐的非对称性的输出信号。
10.根据权利要求1所述的喇叭扩音器,其中,由于所述自适应滤波器,自适应波束形成器基于第一传声器信号和第二传声器信号建立以消除来自输出变换器的信号。
11.根据权利要求1所述的喇叭扩音器,其中,一个或多个悬置件设置在所述喇叭扩音器壳体中所述输出变换器处和/或所述输出变换器与第一传声器之间和/或所述输出变换器与第二传声器之间。
12.一种系统,包括:
根据权利要求1-11任一所述的喇叭扩音器;及
配置成与所述喇叭扩音器通信的外部传声器,所述喇叭扩音器配置成通过包括来自所述外部传声器的信号而建立处理后的信号。
13.根据权利要求12所述的系统,其中所述喇叭扩音器配置成消除可由所述喇叭扩音器的远端用户感知的至少一回波。
14.一种方法,其由根据权利要求1-11任一所述的喇叭扩音器或者根据权利要求12或13所述的系统执行,所述方法包括:
获取表示由至少一第一传声器收集的音频数据的至少一第一信息;
获取表示由至少一第二传声器收集的音频数据的至少一第二信息;
确定差分信息,其中差分信息至少部分基于至少一第一信息和至少一第二信息确定;及
补偿对音频数据的影响,其中第一信息和/或第二信息的音频数据至少部分基于确定的差分信息进行补偿。
15.根据权利要求14所述的方法,还包括:
调整由至少一第一传声器和/或至少一第二传声器收集的音频数据,其中在处理中补偿影响至少一第一传声器和/或至少一第二传声器的性能的一个或多个参数,使得至少一第一传声器和至少一第二传声器之间的性能差异被消除。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20186704 | 2020-07-20 | ||
EP20186704.1 | 2020-07-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113965856A true CN113965856A (zh) | 2022-01-21 |
Family
ID=71728629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110821689.4A Pending CN113965856A (zh) | 2020-07-20 | 2021-07-20 | 差分音频数据补偿 |
Country Status (3)
Country | Link |
---|---|
US (2) | US11700485B2 (zh) |
EP (1) | EP3944601A1 (zh) |
CN (1) | CN113965856A (zh) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9538285B2 (en) * | 2012-06-22 | 2017-01-03 | Verisilicon Holdings Co., Ltd. | Real-time microphone array with robust beamformer and postfilter for speech enhancement and method of operation thereof |
US9479627B1 (en) * | 2015-12-29 | 2016-10-25 | Gn Audio A/S | Desktop speakerphone |
EP3273608B1 (en) * | 2016-07-20 | 2022-01-12 | Sennheiser Electronic GmbH & Co. KG | An adaptive filter unit for being used as an echo canceller |
-
2021
- 2021-07-19 EP EP21186421.0A patent/EP3944601A1/en active Pending
- 2021-07-20 US US17/380,987 patent/US11700485B2/en active Active
- 2021-07-20 CN CN202110821689.4A patent/CN113965856A/zh active Pending
-
2023
- 2023-05-25 US US18/323,579 patent/US20230300528A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3944601A1 (en) | 2022-01-26 |
US20220021971A1 (en) | 2022-01-20 |
US11700485B2 (en) | 2023-07-11 |
US20230300528A1 (en) | 2023-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10438605B1 (en) | Echo control in binaural adaptive noise cancellation systems in headsets | |
CN107636758B (zh) | 声学回声消除系统和方法 | |
CN106416290B (zh) | 基于换能器状态的检测来提高音频换能器的性能的系统及方法 | |
EP3081006B1 (en) | Systems and methods for providing adaptive playback equalization in an audio device | |
CN105074814B (zh) | 个人音频装置的低时延多驱动器自适应消噪(anc)系统 | |
US20140294182A1 (en) | Systems and methods for locating an error microphone to minimize or reduce obstruction of an acoustic transducer wave path | |
US7889872B2 (en) | Device and method for integrating sound effect processing and active noise control | |
US11373665B2 (en) | Voice isolation system | |
CN111131947A (zh) | 耳机信号处理方法、系统和耳机 | |
JP6197930B2 (ja) | 耳孔装着型収音装置、信号処理装置、収音方法 | |
US11335315B2 (en) | Wearable electronic device with low frequency noise reduction | |
US11862138B2 (en) | Hearing device comprising an active emission canceller | |
US11700485B2 (en) | Differential audio data compensation | |
CN115398934A (zh) | 再现音频信号时主动抑制闭塞效应的方法、装置、耳机及计算机程序 | |
US20230231946A1 (en) | Device with output transducer and input transducer | |
US11979520B2 (en) | Method for optimizing speech pickup in a communication device | |
US20240005902A1 (en) | Headphone Speech Listening | |
JP6953984B2 (ja) | イヤホンおよびイヤホンの信号処理方法 | |
US10264116B2 (en) | Virtual duplex operation | |
JP2015220482A (ja) | 送受話端末、エコー消去システム、エコー消去方法、プログラム | |
JPH09107316A (ja) | 反響消去装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |