CN102421050A - 使用麦克风的非均匀布局来增强音频质量的设备和方法 - Google Patents
使用麦克风的非均匀布局来增强音频质量的设备和方法 Download PDFInfo
- Publication number
- CN102421050A CN102421050A CN2011102886776A CN201110288677A CN102421050A CN 102421050 A CN102421050 A CN 102421050A CN 2011102886776 A CN2011102886776 A CN 2011102886776A CN 201110288677 A CN201110288677 A CN 201110288677A CN 102421050 A CN102421050 A CN 102421050A
- Authority
- CN
- China
- Prior art keywords
- acoustic signal
- frequency
- microphones
- interval
- frequency band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000002708 enhancing effect Effects 0.000 title claims abstract description 5
- 238000006243 chemical reaction Methods 0.000 claims abstract description 27
- 238000007493 shaping process Methods 0.000 claims description 47
- 230000009977 dual effect Effects 0.000 claims description 38
- 230000009466 transformation Effects 0.000 claims description 17
- 230000009467 reduction Effects 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 10
- 238000005192 partition Methods 0.000 claims description 8
- 210000004027 cell Anatomy 0.000 description 26
- 230000006870 function Effects 0.000 description 24
- 238000012545 processing Methods 0.000 description 14
- 230000008859 change Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 101100173585 Schizosaccharomyces pombe (strain 972 / ATCC 24843) fft1 gene Proteins 0.000 description 1
- 101100173586 Schizosaccharomyces pombe (strain 972 / ATCC 24843) fft2 gene Proteins 0.000 description 1
- 101100173587 Schizosaccharomyces pombe (strain 972 / ATCC 24843) fft3 gene Proteins 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000010977 unit operation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/22—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only
- H04R1/227—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only using transducers reproducing the same frequency band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R9/00—Transducers of moving-coil, moving-strip, or moving-wire type
- H04R9/08—Microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2205/00—Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
- H04R2205/022—Plurality of transducers corresponding to a plurality of sound channels in each earpiece of headphones or in a single enclosure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
提供了一种使用麦克风的非均匀布局来增强音频质量的设备和方法。因此,即使当麦克风阵列相对较小时,也在包括较高频带和较低频带的宽频率范围中获得期望的方向的波束图。音频质量增强设备包括:至少三个麦克风,以非均匀布局被布置;频率变换单元,被配置为将从所述至少三个麦克风输入的声学信号变换为频域的声学信号;频带划分与合并单元,被配置为基于所述至少三个麦克风之间的间隔将变换的声学信号的频率划分为频带,并基于划分的频带将频域中的声学信号合并为两个声道的信号;双声道波束成形单元,被配置为通过对两个声道的信号执行波束成形来降低包括来自目标声音的方向以外的方向的输入的信号的噪声,并输出噪声降低的信号。
Description
本申请要求于2010年9月17日提交的第10-2010-0091920号韩国专利申请的权益,该申请的公开通过引用全部包含于此,以用于各种目的。
技术领域
以下描述涉及声学信号处理,更具体地讲,涉及通过使用麦克风的非均匀布局减轻噪声以增强音频质量的设备和方法。
背景技术
随着包括高科技医疗设备(诸如高精度助听器)、移动电话、超级移动个人计算机(UMPC)、摄录机等的移动汇聚终端(mobile convergence terminal)现今变得越来越普遍,对使用麦克风阵列的产品的需求已增加。麦克风阵列包括多个麦克风,其中,所述多个麦克风被布置为用于获得声音和声音的补充特征(诸如方向性(例如,声音的方向或声源的位置))。方向性可被用于通过使用声源信号在组成麦克风阵列的多个麦克风中的每一个麦克风处的到达时间之间的差来提高对从位于预定方向的音源所发出的信号的灵敏度。通过使用麦克风阵列的方向性的原理来获得音源信号,从预定方向输入的声源信号可被增强或抑制。
最近的研究集中于:通过定向噪声消除来提高语音呼叫质量和记录质量的方法;能够自动估计和追踪发言人的位置的电话会议系统和智能会议记录系统;用于追踪目标声音的机器人技术。
基于波束成形算法的噪声消除是一种应用于大多数麦克风阵列算法的技术。作为波束成形噪声消除方法的示例,固定波束成形技术被用于不受输入信号的特性影响的波束成形。根据固定波束成形技术,波束图依据麦克风阵列的大小以及包括在所述麦克风阵列中的元件或麦克风的数量而变化。可使用较大的麦克风阵列来获得期望的较低频带的波束图,但是当使用较小的麦克风阵列时,波束图变为全方向的。然而,当使用较大的麦克风阵列时,伴随较高频带而出现旁瓣或栅瓣。结果,不需要的方向上的声音被获得。
传统的麦克风阵列使用至少十个麦克风来形成期望的波束图。然而,这增加了制造麦克风阵列的成本以及麦克风阵列的声学信号处理的应用。
发明内容
在一个方面,提供了一种用于增强具有非均匀布局的麦克风阵列的音频质量的设备和方法,因此即使当麦克风阵列较小时,也可在包括较高频带和较低频带的宽频率范围中获得期望的方向的波束图。
在一个总体方面,一种用于增强音频质量的设备包括:至少三个麦克风、频率变换单元、频带划分与合并单元以及双声道波束成形单元。所述至少三个麦克风以非均匀布局被布置。所述频率变换单元被配置为将从所述至少三个麦克风输入的声学信号变换为频域的声学信号。所述频带划分与合并单元被配置为基于所述至少三个麦克风之间的间隔将变换的声学信号的频率划分为频带,以及基于划分的频带将频域中的声学信号合并为两个声道的信号。所述双声道波束成形单元被配置为通过对所述两个声道的信号执行波束成形来降低包括来自目标声音的方向以外的方向的输入的信号的噪声,并输出噪声降低的信号。
可根据最小冗余线性阵列布局来布置所述至少三个麦克风,其中,所述最小冗余线性阵列布局使针对所述至少三个麦克风之间的间隔的冗余分量最小化。
频带划分与合并单元可基于所述至少三个麦克风的各个间隔,针对变换后的声学信号将频率划分为频带。可使用对于所述至少三个麦克风的每个对应间隔不引起空间假频(spatial aliasing)的最大频率值来分配所述频带。
频带划分与合并单元可将频带的最大频率值(f0)确定为小于通过将声速(c)除以对应麦克风之间的间隔(d)的两倍而获得的值。
由频带划分与合并单元配置的频带的数量可被确定为与所述至少三个麦克风的各成对麦克风的间隔的数量对应。
频带划分与合并单元还被配置为对于所述至少三个麦克风的间隔的所有集合提取每个频带的频域中的声学信号并将提取的声学信号合并为两个声道的声学信号,其中,所述频域中的声学信号从形成间隔的所述至少三个麦克风中的两个麦克风的集合输入。
所述设备还可包括频率反变换单元,其中,所述频率反变换单元被配置为将输出的噪声降低的信号变换为时域的声学信号。
在另一总体方面,一种用于增强音频质量的设备包括:至少三个麦克风、滤波单元、频率变换单元、双声道波束成形单元、合并单元以及频率反变换单元。所述至少三个麦克风以非均匀布局被布置。滤波单元包括多个带通滤波器,其中,所述多个带通滤波器被配置为允许从所述至少三个麦克风输入的声学信号通过所述多个带通滤波器的各个频带,其中,基于所述至少三个麦克风之间的间隔确定对应于每个带通滤波器的频率范围。频率变换单元被配置为将已通过滤波单元的声学信号变换为频域的声学信号。双声道波束成形单元被配置为针对每个频带,降低从两个声道的声学信号的目标声音的方向以外的方向输入的噪声,其中,所述声学信号已通过所述多个带通滤波器之中的相同带通滤波器。合并单元被配置为合并针对每个频带输出的噪声降低的声学信号。频率反变换单元被配置为将合并的信号变换为时域的声学信号。
可根据最小冗余线性阵列来配置所述至少三个麦克风,以使针对所述至少三个麦克风的间隔的冗余分量最小化。
可通过使用对于所述至少三个麦克风的每个对应间隔不引起空间假频的最大频率值,确定与包括在滤波单元中的每个带通滤波器对应的频率范围。
在又一总体方面,一种增强声学阵列的音频质量的方法包括:将从以非均匀布局布置的至少三个麦克风输入的声学信号变换为频域的声学信号;基于所述麦克风之间的间隔将频域的声学信号的频率范围划分为频带;基于所述频带将频域的声学信号合并为双声道信号;通过使用所述双声道信号,降低从目标声音的方向以外的方向输入的声学信号的噪声;以及输出噪声降低的信号。
变换从以非均匀布局布置的至少三个麦克风输入的声学信号的步骤可包括:根据最小冗余线性阵列布局来布置所述至少三个麦克风,以使针对所述麦克风之间的间隔的冗余分量最小化。
基于所述麦克风之间的间隔将频域的声学信号的频率范围划分为频带的步骤还可包括:通过使用对于所述麦克风的每个对应间隔不引起空间假频的最大频率值,确定所述频带。
通过使用对于所述麦克风的每个对应间隔不引起空间假频的最大频率值来确定所述频带的步骤可包括:将频带的最大频率值(f0)确定为小于通过将声速(c)除以麦克风的对应间隔(d)的两倍而获得的值。
基于所述麦克风之间的间隔将频域的声学信号的频率范围划分为频带的步骤可包括:将频率的频率范围划分为与麦克风的间隔的数量对应的频带。
将频域的声学信号合并为双声道信号的步骤可包括:对于至少三个麦克风的间隔的所有集合,提取每个频带的频域中的声学信号并将提取的声学信号合并为两个声道的声学信号,其中,所述频域中的声学信号从形成间隔的所述至少三个麦克风中的两个麦克风的集合输入。
所述方法还可包括:将输出的噪声降低的信号变换为时域的声学信号。
在又一总体方面,一种增强包括以非均匀布局布置的至少三个麦克风的声学阵列的音频质量的方法包括:允许从所述至少三个麦克风输入的声学信号通过多个带通滤波器的各个频带,其中,基于所述至少三个麦克风之间的间隔来确定对应于每个带通滤波器的频率范围;将所述声学信号变换为频域的声学信号;针对每个频带,降低从两个声道的声学信号的目标声音的方向以外的方向输入的噪声,其中,所述声学信号已通过所述多个带通滤波器之中的相同带通滤波器;合并针对每个频带输出的噪声降低的声学信号;以及将合并的噪声降低的声学信号变换为时域的声学信号。
可根据最小冗余线性阵列来配置所述至少三个麦克风,以使针对所述至少三个麦克风的间隔的冗余分量最小化。
允许声学信号通过各个频带的步骤可包括:使所述声学信号通过使用对于所述至少三个麦克风的每个对应间隔不引起空间假频的最大频率值而确定的各个频带。
通过以下结合附图公开本发明的示例性实施例的详细描述,其他特征对于本领域技术人员而言将变得清楚。
附图说明
图1示出用于增强音频质量的设备的配置的示例
图2示出最小冗余阵列布局的示例。
图3示出在没有空间假频(spatial aliasing)的情况下为麦克风间隔分配的频率区域的示例。
图4示出图1的用于增强音频质量的设备的频带划分与合并单元的操作的示例。
图5示出用于增强音频质量的另一设备的示例。
图6示出增强音频质量的方法的示例。
图7示出增强音频质量的另一方法的示例。
图8示出根据增强音频质量的设备和方法产生的波束图的示例。
贯穿附图和详细描述,相同的元件、特征和结构由相同的标号指示,并且为了清楚和方便,在附图中一些元件的大小和比例可被夸大。
具体实施方式
提供以下详细描述以帮助读者全面理解在此描述的方法、设备和/或系统。在此描述的系统、设备和/或方法的各种改变、修改和等同物将被建议给本领域的普通技术人员。公知功能和结构的描述被省略以提高清楚性和简洁性。
在下文中,将参照附图详细描述示例。
图1是示出用于增强音频质量的设备的配置的示例的示图。
音频质量增强设备100包括:麦克风阵列101、频率变换单元110、频带划分与合并单元120、双声道波束成形单元130以及频率反变换单元140,其中,所述麦克风阵列101包括多个麦克风10、20、30和40。可使用各种类型的电子设备(诸如作为示例的个人计算机、服务器计算机、手持或膝上型装置、移动或智能电话、多处理器系统、微处理器系统或机顶盒)来实现音频质量增强设备100。
可使用至少三个麦克风来实现麦克风阵列101。每个麦克风可包括用于放大声学信号的声音放大器以及用于将输入的声学信号转换为电信号的模拟/数字转换器。图1中示出的音频质量增强设备100的示例包括四个麦克风,但是麦克风的数量不限于此;然而,音频质量增强设备100应该包括至少三个麦克风。
以非均匀布局来布置麦克风10、20、30和40。另外,可根据最小冗余线性阵列布局来布置麦克风10、20、30和40,以使针对麦克风10、20、30和40的间隔的冗余分量最小化。麦克风阵列的非均匀布局可被用于避免由于与较高频率区域相关的栅瓣引起的空间假频的缺点。另一方面,当麦克风之间的间隔减小并且麦克风阵列的大小较小时,波形图通常丧失了与较低频率区域相关的单向特性。然而,还可根据在此提供的详细描述来避免这样的缺点。以下参照图2描述最小冗余线性阵列布局的进一步的细节。
麦克风10、20、30和40可被布置在音频质量增强设备100的相同平面上。例如,所有的麦克风10、20、30和40可被布置在音频质量增强设备100的正面平面或侧面平面上。
频率变换单元110从各个麦克风10、20、30和40接收时域的声学信号并将接收的时域的声学信号变换为频域的声学信号。例如,频率变换单元110可通过使用离散傅里叶变换(DFT)或快速傅里叶变换(FFT)将时域的声学信号变换为频域的声学信号。
频率变换单元110可将声学信号组合成帧,并将以帧为单位的声学信号变换为频域的声学信号。成帧的单位可依据可变因素(诸如采样频率和应用的类型)而变化。
频带划分与合并单元120基于麦克风10、20、30和40的间隔将变换的声学信号的频率范围划分为频带,并基于变换的声学信号落入所划分的频带内的何处,将变换的声学信号合并为双声道信号。当基于麦克风的各个间隔针对变换后的声学信号划分频带时,频带划分与合并单元120可基于对于麦克风的每个间隔不引起空间假频的最大频率值来将所述频率范围划分为频带。
频带划分与合并单元120将范围的最大频率值(f0)确定为小于通过将声速(c)除以麦克风之间的间隔(d)的两倍而确定的值另外,当基于麦克风的各个间隔将变换的声学信号的频率划分为频带时,频带划分与合并单元120可分配所述频带以与麦克风的间隔的数量一致。在麦克风的间隔的所有组合中,频带划分与合并单元120根据依据麦克风的对应间隔而分配的频带,从形成阵列的间隔的两个麦克风的频域输入提取声学信号。然后,频带划分与合并单元120将提取的声学信号合并为双声道信号以下参照图3和图4更详细地描述频带划分与合并单元120的操作的细节。
双声道波束成形单元130通过使用双声道波束成形,在不抑制来自目标声源的方向的声音的情况下减轻来自不需要的方向的输入噪声,来输出噪声降低的信号。通过使用从频带划分与合并单元120合并和输入的双声道信号来执行双声道波束成形。双声道波束成形单元130可通过使用双声道信号之间的相差来形成波束图。
当双声道声学信号包括第一信号x1(t,r)和第二信号x2(t,r)时,第一信号x1(t,r)和第二信号x2(t,r)之间的相差(ΔP)可表示为如等式1所示。
【等式1】
这里,c是声波的速度(330m/s),f是声波的频率,d是所述阵列的两个麦克风之间的距离,θt是声源的方向角。
假设声源的方向角θt与目标声音的方向角θt对应,并且目标声音的方向角θt已知,则针对每个频率的相差(phase difference)可被预测。从具有方向角θt的预定位置引入的声学信号的相差(ΔP)可依据每个频率而变化。
同时,可考虑噪声的影响来设置包括目标声音的方向角θt的目标声音的允许角度范围θΔ(或允许目标声音的方向角)。例如,如果目标声音的方向角θt是π/2,则考虑噪声的影响将目标声音的允许角度范围θ设置为约5π/12至7π/12。如果目标声音的方向角θt已知且目标声音的允许角度范围θΔ被确定,则使用等式1计算目标声音的允许相差范围。
目标声音的允许相差范围的下限阈值ThL(m)和上限阈值ThH(m)分别如等式2和等式3中所定义。
【等式2】
【等式3】
这里,m表示频率索引,d表示麦克风之间的间隔。因此,目标声音的允许相差范围的下限阈值ThL(m)和上限阈值ThH(m)可依据频率(f),麦克风之间的间隔(d)以及目标声音的允许角度范围θ而变化。
目标声音的方向角θt可被从外部调整(诸如使用用户通过用户接口装置输入的信号来从外部调整目标声音的方向角θt)。另外,包括目标声音的方向角的目标声音的允许角度范围也可被调整。
考虑到目标声音的允许角度范围与目标声音的允许相差范围之间的关系,如果在输入的声学信号的预定频率的相差ΔP存在于目标声音的允许相差范围内,则确定目标声音存在于所述预定频率。如果在当前输入的声学信号的预定频率的相差ΔP不存在于目标声音的允许相差范围内,则确定目标声音不存在于所述预定频率。
双声道波束成形单元130可提取表示在确定频率分量的相差包括在目标声音的允许相差范围中的程度的特征值。可通过使用针对目标声音的允许相差范围内的频率分量的相差的数量来计算所述特征值。例如,所述特征值表示为平均有效频率分量数量,其中,通过将针对每个频率分量在目标声音的允许相差范围内的频率分量的数量之和除以频率分量的总数量(M)来确定所述平均有效频率分量数量。
如上所述,如果目标声音的方向角θt和目标声音的允许角度范围θΔ被输入,则在双声道波束成形单元130中计算目标声音的允许相差范围。可选地,双声道波束成形单元130设置有预定的存储空间,以存储表示目标声音的每个允许角度以及针对目标声音的每个方向角度的目标声音的允许相差范围的一些信息。
如果确定在将被处理的帧中,目标声音存在于预定频率,则双声道波束成形单元130放大并输出对应的频率分量。如果确定在将被处理的帧中,目标声音不存在于预定频率,则双声道波束成形单元130衰减并输出对应的频率分量。例如,双声道波束成形单元130针对将被分析的帧的每个频率分量估计目标声音的幅度。针对每个频率分量估计的目标声音的幅度与特征值相乘。所述特征值表示每个确定频率分量的相差存在于目标声音的允许相差范围内的程度。从针对确定频率分量的目标声音的估计幅度衰减掉确定为不包括目标声音的频率分量。结果,噪声被减轻或消除。可选地,双声道波束成形单元130可通过经由本领域通常公知的其他各种类型的方法执行双声道波束成形来减轻噪声。
频率反变换单元140将双声道波束成形单元130的输出信号变换为时域的声学信号。变换的信号可被存储在存储介质(未示出)中或通过扬声器(未示出)被输出。
尽管该示例可避免由于较高频率区域处的栅瓣引起的空间假频的缺点,但是当麦克风之间的间隔减小且麦克风阵列的大小较小时,用于较低频率区域的波束图丧失了单向特性。然而,如果麦克风的数量增加,则与波束成形的数据处理相关的成本增加。因此,即使麦克风的数量增加,上述双声道波束成形也提供了性价比高的波束成形。根据上述的频带划分与合并,输入到非均匀布局的麦克风的至少三个声学信号被有效地变换为用于双声道波束成形的两个声学信号,同时仍避免了由于与较高频率区域相关的栅瓣引起的空间假频。
图2是示出最小冗余阵列布局的示例的示图。
最小冗余线性阵列是源于雷达天线的结构的技术。最小冗余线性阵列表示元件按照使针对阵列元件之间的间隔的冗余分量最小化的方式被布置的非均匀布局的阵列结构。例如,当阵列结构包括四个阵列元件时,获得六个空间灵敏度。
图2示出当麦克风阵列101包括四个麦克风10、20、30和40时获得的最小冗余阵列布局。如图2中所示,麦克风10和麦克风20彼此相隔最小间隔。所述最小间隔可被称为基本间隔。在该示例中,如图2中所示,麦克风30与麦克风40之间的间隔是基本间隔的两倍,麦克风20与麦克风30之间的间隔是基本间隔的三倍,麦克风10与麦克风30之间的间隔是基本间隔的四倍,麦克风20与麦克风40之间的间隔是基本间隔的五倍,麦克风10与麦克风40之间的间隔是基本间隔的六倍。结果,图2中示出的麦克风阵列的麦克风10、20、30和40之间的间隔可在基本间隔的一倍到六倍范围内变化。
如上所述,尽管避免了由于较高频率区域处的栅瓣引起的空间假频,但是当麦克风之间的间隔减小并且麦克风阵列的大小较小时,使用固定的波束成形,用于较低频率区域的波束图丧失了单向特性。然而,最小冗余线性阵列的最小间隔可被用于避免与较高频带相关的空间假频的缺点,并且对于最小冗余线性阵列,容易获得能够在较低频带进行无失真波束成形的最大间隔。因此,如以下更详细地解释的,依据麦克风的数量和排列,最小冗余线性阵列可以按各种布局来构造。
图3是示出在不引起空间假频的情况下针对麦克风间隔而分配的频率区域的示例的示图。
对于从麦克风10、20、30和40输入的声学信号,频带划分与合并单元120将频带分配给麦克风10、20、30和40之间的每个间隔,使得它们不引起空间假频。当麦克风之间的预定间隔是d时,如等式4所示,最大频率值(f0)被确定为小于通过将声速(c)除以麦克风之间的预定间隔(d)的两倍而获得的值。
【等式4】
例如,如果麦克风间隔(d)是10cm且声速(c)是340m/s,则在具有1700Hz或更小的频率(f0)的信号不会出现假频。根据图2中示出的间隔,最大间隔(例如,两个最外侧的麦克风之间的间隔)适合于较低频率,麦克风之间的最小间隔适合于较高频率。因此,频带划分与合并单元120按照通过形成最大间隔的麦克风获得的声学信号被分配最低频率区域,通过形成第二大间隔的麦克风获得的声学信号被分配第二低频率区域等诸如此类的方式来分配频带。当麦克风之间的最小间隔是2cm且麦克风的数量是四个时,如图3所示分配频带。
例如,根据图2和图3,形成最大间隔的麦克风10和40被配置为与具有1400Hz或更低的频率的信号对应。形成第二大间隔的麦克风20和40被配置为与具有频率1417Hz至1700Hz的信号对应。形成第三大间隔的麦克风10和30被配置为与具有1700Hz至2125Hz的频率的信号对应。形成第四大间隔的麦克风20和30被配置为与具有2125Hz至2833Hz的频率的信号对应。形成第五大间隔的麦克风30和40被配置为与具有2833Hz至4250Hz的频率的信号对应。形成最小间隔的麦克风10和20被配置为与具有4250Hz至8500Hz的频率的信号对应。
当然,当麦克风的基本间隔改变时,分配给每个间隔的频带将被改变。如上所述,最大频率值被确定为不引起空间假频的最大值,因此形成每个间隔的麦克风可被分配小于确定的最大频率的频率。例如,具有最大间隔的两个最外侧的麦克风10和40可被配置为与0Hz至1000Hz而非0Hz至1400Hz对应,具有第二大间隔的两个麦克风20和40可被配置为与1000Hz至1690Hz而非1407Hz至1700Hz对应,等等。按这种方式,频带划分与合并单元120(见图1)为麦克风阵列的麦克风的各个间隔分配频带。
图4是示出与图1的用于增强音频质量的设备的频带划分与合并单元相关的数据流的示例的示图。
在图4中,如图1和图2中所示,四个麦克风10、20、30和40以最小冗余线性阵列布局被布置。
通过将从四个麦克风10、20、30和40中的各个麦克风获得的频域的四个声学信号(例如,Ch1、Ch2、Ch3和Ch4)映射到图4的右部分中示出的两个声学信号(例如,Ch11和Ch12),来合并所述四个声学信号。频域的两个声学信号Ch11和Ch12是输入到双声道波束成形单元130的信号。
当以最小冗余线性阵列布局来布置四个麦克风10、20、30和40时,基于麦克风10、20、30和40的间隔将频率划分为六个频带。针对如图4的左部分中所示的四个声学信号Ch1、Ch2、Ch3和Ch4中的每一个以及如图4的右部分中所示的两个声学信号Ch11和Ch12中的每一个来表示所述六个频带。
根据麦克风10和麦克风20之间的基本间隔,4220Hz到8500Hz的频带被分配给基本间隔。2810Hz至4220Hz的频带与是基本间隔的两倍的麦克风间隔对应。2090Hz至2810Hz的频带与是基本间隔的三倍的麦克风间隔对应。1690Hz至2090Hz的频带与是基本间隔的四倍的麦克风间隔对应。1400Hz至1690Hz的频带与是基本间隔的五倍的麦克风间隔对应。0Hz至1400Hz的频带与是基本间隔的六倍的麦克风间隔对应。
图5是示出用于增强音频质量的设备的另一示例的示图。
音频质量增强设备500包括:包括多个麦克风10、20、30和40的麦克风阵列、滤波单元510、频率变换单元520、双声道波束成形单元530、合并单元540以及频率反变换单元550。与图1中示出的对频域中的声学信号执行频带划分与合并操作的音频质量增强设备100不同,图5的音频质量增强设备500对时域中的声学信号执行频带划分操作,并且对频域中的声学信号执行频带合并操作。
与图1中示出的麦克风阵列相似,音频质量增强设备500的麦克风阵列501包括至少三个麦克风。在该示例中,以非均匀布局来布置四个麦克风10、20、30和40。所述至少三个麦克风可按照使针对麦克风10、20、30和40之间的间隔的冗余分量最小化的方式被布置。
滤波单元510包括允许从麦克风10、20、30和40输入的声学信号通过基于麦克风10、20、30和40的间隔而划分的各个频带的多个带通滤波器。包括在滤波单元510中的带通滤波器被配置为使按照最大频率值所确定划分的各个频带的声学信号通过,其中,所述最大频率值对于麦克风10、20、30和40之间的每个间隔不引起空间假频。
如果音频质量增强设备500的四个麦克风10、20、30和40以最小冗余线性阵列布局被布置,则滤波单元510可包括六个带通滤波器BPF1、BPF2、BPF3、BPF4、BPF5和BPF6。
所述六个带通滤波器BPF1、BPF2、BPF3、BPF4、BPF5和BPF6被配置为允许信号通过基于麦克风10、20、30和40之间的间隔而划分的六个频带中的每一个。详细地讲,带通滤波器BPF1可被配置为允许4220Hz至8500Hz频带中的从麦克风10输入的第一声学信号以及从麦克风20输入的第二声学信号通过。带通滤波器BPF2可被配置为允许2810Hz至4220Hz频带中的从麦克风30输入的第三声学信号以及从麦克风40输入的第四声学信号通过。带通滤波器BPF3可被配置为允许2090Hz至2810Hz频带中的第二声学信号以及第三声学信号通过。带通滤波器BPF4可被配置为允许1690z至2090Hz频带中的第一声学信号以及第三声学信号通过。带通滤波器BPF5可被配置为允许1400z至1690Hz频带中的第二声学信号以及第四声学信号通过。带通滤波器BPF6可被配置为允许0Hz至1400Hz频带中的第一声学信号以及第四声学信号通过。
频率变换单元520将通过滤波单元510的声学信号变换为频域的声学信号。当处理从四个麦克风10、20、30和40输入的声学信号时,频率变换单元520从滤波单元510接收十二个声学信号,并将接收的十二个声学信号变换为频域的声学信号。例如,成对的声学信号被提供给六个快速傅里叶变换器(例如,FFT1、FFT2、FFT3、FFT4、FFT5、FFT6),以使用快速傅里叶变换将成对的声学信号变换到频域。
双声道波束成形单元530对每个频带的两个声学信号执行双声道波束成形。所述两个声学信号均通过多个带通滤波器中的相同带通滤波器,从而对于每个频带,来自所述两个信号的从不需要的方向(即,目标声音的方向以外的方向)输入的噪声被减轻,由此输出噪声降低的信号。双声道波束成形单元530可包括六个波束成形器BF1、BF2、BF3、BF4、BF5和BF6。
波束成形器BF1可使用来自4220Hz至8500Hz频带的第一声学信号和第二声学信号执行双声道波束成形。波束成形器BF2可使用来自2810Hz至4220Hz频带的第三声学信号和第四声学信号执行双声道波束成形。波束成形器BF3可使用来自2090Hz至2810Hz频带的第二声学信号和第三声学信号执行双声道波束成形。波束成形器BF4可使用来自1690Hz至2090Hz频带的第一声学信号和第三声学信号执行双声道波束成形。波束成形器BF5可使用来自1400Hz至1690Hz频带的第二声学信号和第四声学信号执行双声道波束成形。波束成形器BF6可使用来自0Hz至1400Hz频带的第一声学信号和第四声学信号执行双声道波束成形。
合并单元540合并所产生的与每个频带的声学信号对应的噪声降低的信号中的每一个。根据该示例,合并单元540合并从波束成形单元530输出的六个声学信号(已针对每个频带对其执行了双声道波束成形)以获得针对0Hz至8500Hz的所有频率的声学信号。
频率反变换单元550将合并的信号变换为时域的声学信号。
图6是示出增强音频质量的方法的示例的流程图。
如图1和图6中所示,音频质量增强设备100将从以非均匀布局布置的至少三个麦克风输入的声学信号变换为频域的声学信号(610)。所述至少三个麦克风可被布置以使针对麦克风的间隔的冗余分量最小化。
音频质量增强设备100基于麦克风之间的间隔,针对变换后声学信号将频率划分为频带(620)。音频质量增强设备100可通过使用对于麦克风的每个间隔不引起空间假频的最大频率值来将频率划分为频带。音频质量增强设备100将所述最大频率值(f0)确定为小于通过将声速(c)除以两个麦克风之间的间隔(d)的两倍而确定的值。另外,音频质量增强设备100将频带的数量确定为与麦克风的间隔的数量对应。
音频质量增强设备100基于划分的频带将频域的声学信号合并为双声道信号(630)。对于麦克风之间的间隔的所有集合,音频质量增强设备100提取从形成间隔的两个麦克风输入的每个频带的声学信号,并将提取的声学信号合并为两个声道的声学信号。
音频质量增强设备100使用所述两个声道的信号来执行双声道波束成形,以衰减从不需要的方向(即,目标声音的方向以外的方向)输入的噪声,从而输出噪声降低的信号(640)。
图7是示出增强音频质量的方法的另一示例的流程图
如图5和图7中所示,音频质量增强设备500允许从以非均匀布局布置的至少三个麦克风输入的声学信号通过基于麦克风之间的间隔而分配的各个频带(710)。音频质量增强设备500使声学信号通过各个频带。通过使用对于非均匀布局的麦克风之间的每个分别的间隔不引起空间假频的最大频率值来确定所述频带。
音频质量增强设备500将通过每个频带的声学信号变换为频域的声学信号(720)。
音频质量增强设备500通过对每个频带的声学信号执行双声道波束成形来输出噪声降低的信号。在操作710,声学信号通过相同的带通滤波器。从以非均匀布局布置的至少三个麦克风输入的声学信号通过基于麦克风的间隔而划分的各个频带。针对每个频带的声学信号的双声道波束成形减轻从不需要的方向(即,目标声音的方向以外的方向)输入的噪声(730)。
音频质量增强设备500将对应于每个频带的声学信号而产生的噪声降低的信号合并(740)。
音频质量增强设备500将合并的声学信号变换为时域的声学信号(750)。
图8是示出根据增强音频质量的设备和方法而产生的波束图的示例的示图。
如图8中所示,根据用于增强音频质量的设备和方法的示例,在避免较低频带处的全向特性或由于较高频带处的空间假频引起的栅瓣的同时,在宽频区域(诸如1200Hz至2000Hz、3000Hz至4000Hz以及6200Hz至7200Hz的频带)平均地形成波束图。如上所述,通过使用以非均匀布局布置的麦克风阵列,即使提供大小较小的麦克风阵列,也可在包括较高频带和较低频带的宽频率范围获得具有期望的方向的波束图。
在此描述的单元可使用硬件组件和软件组件来实现。例如,麦克风、放大器、带通滤波器、模拟至数字转换器以及处理装置。可使用一个或多个通用或专用计算机(诸如作为示例的处理器、控制器和运算逻辑单元、数字信号处理器、微计算机、现场可编程阵列、可编程逻辑单元、微处理器或能够以限定的方式响应于指令并执行指令的任何其他装置)来实现处理装置。处理装置可运行操作系统(OS)以及在OS上运行的一个或多个软件应用,所述处理装置还可响应于软件的执行来访问、存储、操纵、处理和创建数据。为了简洁的目的,按照单数来使用对处理装置的描述;然而,本领域技术人员将理解,所述处理装置可包括多个处理元件以及多种类型的处理元件。例如,处理装置可包括多个处理器或一处理器和一控制器。另外,不同的处理配置是可行的,诸如并行处理器。如在此所使用的,被配置为实现功能A的处理装置包括被编程以运行特定软件的处理器。另外,被配置为实现功能A、功能B和功能C的处理装置可包括以下配置,诸如作为示例的被配置为实现全部的功能A、功能B和功能C的处理器;被配置为实现功能A的第一处理器以及被配置为实现功能B和功能C的第二处理器;用于实现功能A的第一处理器、被配置为实现功能B的第二处理器以及被配置为实现功能C的第三处理器;被配置为实现功能A的第一处理器以及被配置为实现功能B和功能C的第二处理器;被配置为实现功能A、功能B、功能C的第一处理器和被配置为实现功能A、功能B和功能C的第二处理器等等。
所述软件可包括计算机程序、代码段、指令或计算机程序、代码段、指令的一些组合,以独立地或共同地指示或配置处理装置来如期望的进行操作。软件和数据可永久地或临时地包含在在任何类型的机器、组件、物理或虚拟设备、计算机存储介质或装置,或包含在能够提供指令或数据的或能够被处理装置解释的传播信号波中。所述软件还可分布于联网的计算机系统上,从而所述软件以分布形式被存储和执行。具体地,可由一个或多个计算机可读记录介质来存储所述软件和数据。计算机可读记录介质可包括可存储其后可由计算机系统或处理装置读出的数据的任何数据存储装置。计算机可读记录介质的示例包括:只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光数据存储装置。
此外,本发明所属领域的编程人员基于并使用在此提供的附图的流程图和框图及其对应的描述,可容易地理解用于完成本发明的功能程序、代码、代码段。以上已描述了多个示例性实施例。然而,将理解的是,可做出各种修改。例如,如果以不同的顺序执行描述的技术和/或如果描述的系统、架构、装置或电路中的组件以不同的方式组合和/或被其他组件或其等同物所替代或补充,则也可实现合适的结果。因此,其他实施方案在权利要求的范围内。
Claims (15)
1.一种用于增强音频质量的设备,所述设备包括:
至少三个麦克风,以非均匀布局被布置;
频率变换单元,被配置为将从所述至少三个麦克风输入的声学信号变换为频域的声学信号;
频带划分与合并单元,被配置为基于所述至少三个麦克风之间的间隔将变换的声学信号的频率划分为频带,以及基于划分的频带将频域中的声学信号合并为两个声道的信号;以及
双声道波束成形单元,被配置为通过对所述两个声道的信号执行波束成形来降低包括来自目标声音的方向以外的方向的输入的信号的噪声,并输出噪声降低的信号。
2.如权利要求1所述的设备,其中,所述至少三个麦克风根据最小冗余线性阵列布局被布置,其中,所述最小冗余线性阵列布局使针对所述至少三个麦克风之间的间隔的冗余分量最小化。
3.如权利要求1所述的设备,其中,当频带划分与合并单元基于所述至少三个麦克风的各个间隔针对变换后声学信号将频率划分为频带时,使用对于所述至少三个麦克风的每个对应间隔不引起空间假频的最大频率值来分配所述频带。
4.如权利要求3所述的设备,其中,频带划分与合并单元将频带的最大频率值(f0)确定为小于通过将声速(c)除以对应麦克风之间的间隔(d)的两倍而获得的值。
5.如权利要求1所述的设备,其中,由频带划分与合并单元配置的频带的数量被确定为与所述至少三个麦克风的各成对麦克风的间隔的数量对应。
6.如权利要求1所述的设备,其中,频带划分与合并单元还被配置为对于所述至少三个麦克风的间隔的所有集合,提取每个频带的频域中的声学信号,并将提取的声学信号合并为两个声道的声学信号,其中,所述频域中的声学信号从形成间隔的所述至少三个麦克风中的两个麦克风的集合输入。
7.如权利要求1所述的设备,还包括:频率反变换单元,被配置为将输出的噪声降低的信号变换为时域的声学信号。
8.一种用于增强音频质量的设备,所述设备包括:
至少三个麦克风,以非均匀布局被布置;
滤波单元,包括多个带通滤波器,其中,所述多个带通滤波器被配置为允许从所述至少三个麦克风输入的声学信号通过所述多个带通滤波器的各个频带,其中,基于所述至少三个麦克风之间的间隔来确定对应于每个带通滤波器的频率范围;
频率变换单元,被配置为将已通过滤波单元的声学信号变换为频域的声学信号;
双声道波束成形单元,被配置为针对每个频带,降低从两个声道的声学信号的目标声音的方向以外的方向的输入的噪声,其中,所述声学信号已通过所述多个带通滤波器之中的相同带通滤波器;
合并单元,被配置为合并针对每个频带输出的噪声降低的声学信号;以及
频率反变换单元,被配置为将合并的信号变换为时域的声学信号。
9.如权利要求8所述的设备,其中,所述至少三个麦克风根据最小冗余线性阵列被配置,以使针对所述至少三个麦克风的间隔的冗余分量最小化。
10.如权利要求8所述的设备,其中,通过使用对于所述至少三个麦克风的每个对应间隔不引起空间假频的最大频率值,确定与包括在滤波单元中的每个带通滤波器对应的频率范围。
11.一种增强声学阵列的音频质量的方法,所述方法包括:
将从以非均匀布局布置的至少三个麦克风输入的声学信号变换为频域的声学信号;
基于所述麦克风之间的间隔将频域的声学信号的频率范围划分为频带;
基于所述频带将频域的声学信号合并为双声道信号;
通过使用所述双声道信号,降低从目标声音的方向以外的方向输入的声学信号的噪声;以及
输出噪声降低的信号。
12.如权利要求11所述的方法,其中,变换从以非均匀布局布置的至少三个麦克风输入的声学信号的步骤包括:根据最小冗余线性阵列布局来布置所述至少三个麦克风,以使针对所述麦克风之间的间隔的冗余分量最小化,其中,基于所述麦克风之间的间隔将频域的声学信号的频率范围划分为频带的步骤还包括:通过使用对于所述麦克风的每个对应间隔不引起空间假频的最大频率值来确定所述频带,其中,通过使用对于所述麦克风的每个对应间隔不引起空间假频的最大频率值来确定所述频带的步骤包括:将频带的最大频率值(f0)确定为小于通过将声速(c)除以麦克风的对应间隔(d)的两倍而获得的值。
13.如权利要求11所述的方法,其中,基于所述麦克风之间的间隔将频域的声学信号的频率范围划分为频带的步骤包括:将频率的频率范围划分为与所述麦克风的间隔的数量对应的频带,其中,将频域的声学信号合并为双声道信号的步骤包括:
对于所述至少三个麦克风的间隔的所有集合,提取每个频带的频域中的声学信号,其中,所述频域中的声学信号从形成间隔的所述至少三个麦克风中的两个麦克风的集合输入;以及
将提取的声学信号合并为两个声道的声学信号。
14.一种增强包括以非均匀布局布置的至少三个麦克风的声学阵列的音频质量的方法,所述方法包括:
允许从所述至少三个麦克风输入的声学信号通过多个带通滤波器的各个频带,其中,基于所述至少三个麦克风之间的间隔确定对应于每个带通滤波器的频率范围;
将所述声学信号变换为频域的声学信号;
针对每个频带,降低从两个声道的声学信号的目标声音的方向以外的方向输入的噪声,其中,所述声学信号已通过所述多个带通滤波器之中的相同带通滤波器;
合并针对每个频带输出的噪声降低的声学信号;以及
将合并的噪声降低的声学信号变换为时域的声学信号。
15.如权利要求14所述的方法,其中,所述至少三个麦克风根据最小冗余线性阵列被配置,以使针对所述至少三个麦克风的间隔的冗余分量最小化,以及其中,允许声学信号通过各个频带的步骤包括:
使所述声学信号通过使用对于所述至少三个麦克风的每个对应间隔不引起空间假频的最大频率值而确定的各个频带。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2010-0091920 | 2010-09-17 | ||
KR1020100091920A KR101782050B1 (ko) | 2010-09-17 | 2010-09-17 | 비등간격으로 배치된 마이크로폰을 이용한 음질 향상 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102421050A true CN102421050A (zh) | 2012-04-18 |
CN102421050B CN102421050B (zh) | 2017-04-12 |
Family
ID=44905397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110288677.6A Expired - Fee Related CN102421050B (zh) | 2010-09-17 | 2011-09-19 | 使用麦克风的非均匀布局来增强音频质量的设备和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8965002B2 (zh) |
EP (1) | EP2431973B1 (zh) |
KR (1) | KR101782050B1 (zh) |
CN (1) | CN102421050B (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104065798A (zh) * | 2013-03-21 | 2014-09-24 | 华为技术有限公司 | 声音信号处理方法及设备 |
CN104980865A (zh) * | 2014-04-03 | 2015-10-14 | 奥迪康有限公司 | 包括双耳降噪的双耳助听系统 |
CN105898662A (zh) * | 2015-02-13 | 2016-08-24 | 奥迪康有限公司 | 配对传声器单元和包括配对传声器单元的听力系统 |
CN106105261A (zh) * | 2014-03-12 | 2016-11-09 | 索尼公司 | 声场声音拾取装置和方法、声场再现装置和方法以及程序 |
WO2016192277A1 (zh) * | 2015-05-29 | 2016-12-08 | 京东方科技集团股份有限公司 | 骨导声音传播装置和方法 |
CN106251877A (zh) * | 2016-08-11 | 2016-12-21 | 珠海全志科技股份有限公司 | 语音声源方向估计方法及装置 |
CN107017000A (zh) * | 2016-01-27 | 2017-08-04 | 诺基亚技术有限公司 | 用于编码和解码音频信号的装置、方法和计算机程序 |
CN109040884A (zh) * | 2018-08-31 | 2018-12-18 | 上海联影医疗科技有限公司 | 基于医疗设备的语音系统 |
CN109358317A (zh) * | 2018-09-30 | 2019-02-19 | 科大讯飞股份有限公司 | 一种鸣笛信号检测方法、装置、设备及可读存储介质 |
CN109791769A (zh) * | 2016-09-28 | 2019-05-21 | 诺基亚技术有限公司 | 使用自适应捕捉从麦克风阵列生成空间音频信号格式 |
CN111385685A (zh) * | 2019-06-28 | 2020-07-07 | 深圳国威电子有限公司 | 一种具有拾音器排列矩阵呈非线性的无线通讯装置 |
CN112399304A (zh) * | 2019-08-15 | 2021-02-23 | 纬创资通股份有限公司 | 麦克风装置、电子装置及其音频信号处理方法 |
CN113411698A (zh) * | 2021-06-21 | 2021-09-17 | 歌尔科技有限公司 | 音频信号处理方法及智能音箱 |
CN115452141A (zh) * | 2022-11-08 | 2022-12-09 | 杭州兆华电子股份有限公司 | 一种非均匀声学成像方法 |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101782050B1 (ko) * | 2010-09-17 | 2017-09-28 | 삼성전자주식회사 | 비등간격으로 배치된 마이크로폰을 이용한 음질 향상 장치 및 방법 |
CN102306496B (zh) * | 2011-09-05 | 2014-07-09 | 歌尔声学股份有限公司 | 一种多麦克风阵列噪声消除方法、装置及系统 |
DE102012204877B3 (de) | 2012-03-27 | 2013-04-18 | Siemens Medical Instruments Pte. Ltd. | Hörvorrichtung für eine binaurale Versorgung und Verfahren zum Bereitstellen einer binauralen Versorgung |
FR2992459B1 (fr) * | 2012-06-26 | 2014-08-15 | Parrot | Procede de debruitage d'un signal acoustique pour un dispositif audio multi-microphone operant dans un milieu bruite. |
JP6107151B2 (ja) | 2013-01-15 | 2017-04-05 | 富士通株式会社 | 雑音抑圧装置、方法、及びプログラム |
DE102013217367A1 (de) * | 2013-05-31 | 2014-12-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und verfahren zur raumselektiven audiowiedergabe |
CN104751853B (zh) * | 2013-12-31 | 2019-01-04 | 辰芯科技有限公司 | 双麦克风噪声抑制方法及系统 |
JP6411780B2 (ja) * | 2014-06-09 | 2018-10-24 | ローム株式会社 | オーディオ信号処理回路、その方法、それを用いた電子機器 |
US10609475B2 (en) | 2014-12-05 | 2020-03-31 | Stages Llc | Active noise control and customized audio system |
KR101713748B1 (ko) * | 2015-12-09 | 2017-03-08 | 현대자동차주식회사 | 마이크로폰 및 그 제조 방법 |
US10945080B2 (en) | 2016-11-18 | 2021-03-09 | Stages Llc | Audio analysis and processing system |
US9980075B1 (en) | 2016-11-18 | 2018-05-22 | Stages Llc | Audio source spatialization relative to orientation sensor and output |
US9980042B1 (en) * | 2016-11-18 | 2018-05-22 | Stages Llc | Beamformer direction of arrival and orientation analysis system |
US10334360B2 (en) * | 2017-06-12 | 2019-06-25 | Revolabs, Inc | Method for accurately calculating the direction of arrival of sound at a microphone array |
EP4236359A3 (en) | 2017-12-13 | 2023-10-25 | Oticon A/s | A hearing device and a binaural hearing system comprising a binaural noise reduction system |
WO2019231632A1 (en) | 2018-06-01 | 2019-12-05 | Shure Acquisition Holdings, Inc. | Pattern-forming microphone array |
US11297423B2 (en) * | 2018-06-15 | 2022-04-05 | Shure Acquisition Holdings, Inc. | Endfire linear array microphone |
US10887467B2 (en) | 2018-11-20 | 2021-01-05 | Shure Acquisition Holdings, Inc. | System and method for distributed call processing and audio reinforcement in conferencing environments |
WO2020191380A1 (en) | 2019-03-21 | 2020-09-24 | Shure Acquisition Holdings,Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality |
TW202101422A (zh) | 2019-05-23 | 2021-01-01 | 美商舒爾獲得控股公司 | 可操縱揚聲器陣列、系統及其方法 |
WO2020241050A1 (ja) * | 2019-05-28 | 2020-12-03 | ソニー株式会社 | 音声処理装置、音声処理方法およびプログラム |
JP2022545113A (ja) | 2019-08-23 | 2022-10-25 | シュアー アクイジッション ホールディングス インコーポレイテッド | 指向性が改善された一次元アレイマイクロホン |
CN116918351A (zh) | 2021-01-28 | 2023-10-20 | 舒尔获得控股公司 | 混合音频波束成形系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1851806A (zh) * | 2006-05-30 | 2006-10-25 | 北京中星微电子有限公司 | 一种自适应麦克阵列系统及其语音信号处理方法 |
CN101140760A (zh) * | 2006-09-08 | 2008-03-12 | 联想移动通信科技有限公司 | 一种声音信号采集处理系统及方法 |
CN101263734A (zh) * | 2005-09-02 | 2008-09-10 | 丰田自动车株式会社 | 麦克风阵列用后置滤波器 |
US20090103749A1 (en) * | 2007-05-17 | 2009-04-23 | Creative Technology Ltd | Microphone Array Processor Based on Spatial Analysis |
CN101604012A (zh) * | 2008-06-11 | 2009-12-16 | 索尼株式会社 | 信号处理装置、信号处理方法以及程序 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7099821B2 (en) | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
GB0405455D0 (en) * | 2004-03-11 | 2004-04-21 | Mitel Networks Corp | High precision beamsteerer based on fixed beamforming approach beampatterns |
ATE405925T1 (de) | 2004-09-23 | 2008-09-15 | Harman Becker Automotive Sys | Mehrkanalige adaptive sprachsignalverarbeitung mit rauschunterdrückung |
US7464029B2 (en) | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
KR20090098426A (ko) | 2008-03-14 | 2009-09-17 | (주)엘리더스 | 적응 필터를 이용한 마이크로폰 어레이 시스템에서 음원 방향 자동추출 방법 |
JP2010091912A (ja) | 2008-10-10 | 2010-04-22 | Equos Research Co Ltd | 音声強調システム |
KR101475864B1 (ko) | 2008-11-13 | 2014-12-23 | 삼성전자 주식회사 | 잡음 제거 장치 및 잡음 제거 방법 |
WO2010092568A1 (en) * | 2009-02-09 | 2010-08-19 | Waves Audio Ltd. | Multiple microphone based directional sound filter |
KR101782050B1 (ko) * | 2010-09-17 | 2017-09-28 | 삼성전자주식회사 | 비등간격으로 배치된 마이크로폰을 이용한 음질 향상 장치 및 방법 |
-
2010
- 2010-09-17 KR KR1020100091920A patent/KR101782050B1/ko active IP Right Grant
-
2011
- 2011-05-24 US US13/114,746 patent/US8965002B2/en active Active
- 2011-09-16 EP EP11181569.2A patent/EP2431973B1/en not_active Not-in-force
- 2011-09-19 CN CN201110288677.6A patent/CN102421050B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101263734A (zh) * | 2005-09-02 | 2008-09-10 | 丰田自动车株式会社 | 麦克风阵列用后置滤波器 |
CN1851806A (zh) * | 2006-05-30 | 2006-10-25 | 北京中星微电子有限公司 | 一种自适应麦克阵列系统及其语音信号处理方法 |
CN101140760A (zh) * | 2006-09-08 | 2008-03-12 | 联想移动通信科技有限公司 | 一种声音信号采集处理系统及方法 |
US20090103749A1 (en) * | 2007-05-17 | 2009-04-23 | Creative Technology Ltd | Microphone Array Processor Based on Spatial Analysis |
CN101604012A (zh) * | 2008-06-11 | 2009-12-16 | 索尼株式会社 | 信号处理装置、信号处理方法以及程序 |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014146547A1 (zh) * | 2013-03-21 | 2014-09-25 | 华为技术有限公司 | 声音信号处理方法及设备 |
CN104065798B (zh) * | 2013-03-21 | 2016-08-03 | 华为技术有限公司 | 声音信号处理方法及设备 |
CN104065798A (zh) * | 2013-03-21 | 2014-09-24 | 华为技术有限公司 | 声音信号处理方法及设备 |
CN106105261B (zh) * | 2014-03-12 | 2019-11-05 | 索尼公司 | 声场声音拾取装置和方法、声场再现装置和方法以及程序 |
CN106105261A (zh) * | 2014-03-12 | 2016-11-09 | 索尼公司 | 声场声音拾取装置和方法、声场再现装置和方法以及程序 |
CN104980865A (zh) * | 2014-04-03 | 2015-10-14 | 奥迪康有限公司 | 包括双耳降噪的双耳助听系统 |
CN104980865B (zh) * | 2014-04-03 | 2020-05-12 | 奥迪康有限公司 | 包括双耳降噪的双耳助听系统 |
CN105898662A (zh) * | 2015-02-13 | 2016-08-24 | 奥迪康有限公司 | 配对传声器单元和包括配对传声器单元的听力系统 |
CN105898662B (zh) * | 2015-02-13 | 2020-07-17 | 奥迪康有限公司 | 配对传声器单元和包括配对传声器单元的听力系统 |
WO2016192277A1 (zh) * | 2015-05-29 | 2016-12-08 | 京东方科技集团股份有限公司 | 骨导声音传播装置和方法 |
US9986334B2 (en) | 2015-05-29 | 2018-05-29 | Boe Technology Group Co., Ltd | Bone-conduction sound transmission device and method |
US10783896B2 (en) | 2016-01-27 | 2020-09-22 | Nokia Technologies Oy | Apparatus, methods and computer programs for encoding and decoding audio signals |
CN107017000A (zh) * | 2016-01-27 | 2017-08-04 | 诺基亚技术有限公司 | 用于编码和解码音频信号的装置、方法和计算机程序 |
CN106251877A (zh) * | 2016-08-11 | 2016-12-21 | 珠海全志科技股份有限公司 | 语音声源方向估计方法及装置 |
CN106251877B (zh) * | 2016-08-11 | 2019-09-06 | 珠海全志科技股份有限公司 | 语音声源方向估计方法及装置 |
CN109791769B (zh) * | 2016-09-28 | 2024-05-07 | 诺基亚技术有限公司 | 使用自适应捕捉从麦克风阵列生成空间音频信号格式 |
CN109791769A (zh) * | 2016-09-28 | 2019-05-21 | 诺基亚技术有限公司 | 使用自适应捕捉从麦克风阵列生成空间音频信号格式 |
US11671781B2 (en) | 2016-09-28 | 2023-06-06 | Nokia Technologies Oy | Spatial audio signal format generation from a microphone array using adaptive capture |
CN109040884A (zh) * | 2018-08-31 | 2018-12-18 | 上海联影医疗科技有限公司 | 基于医疗设备的语音系统 |
CN109358317B (zh) * | 2018-09-30 | 2021-06-08 | 科大讯飞股份有限公司 | 一种鸣笛信号检测方法、装置、设备及可读存储介质 |
CN109358317A (zh) * | 2018-09-30 | 2019-02-19 | 科大讯飞股份有限公司 | 一种鸣笛信号检测方法、装置、设备及可读存储介质 |
CN111385685A (zh) * | 2019-06-28 | 2020-07-07 | 深圳国威电子有限公司 | 一种具有拾音器排列矩阵呈非线性的无线通讯装置 |
CN112399304A (zh) * | 2019-08-15 | 2021-02-23 | 纬创资通股份有限公司 | 麦克风装置、电子装置及其音频信号处理方法 |
US11109153B2 (en) | 2019-08-15 | 2021-08-31 | Wistron Corp. | Microphone apparatus and electronic device having linear microphone array with non-uniform configuration and method of processing sound signal |
CN112399304B (zh) * | 2019-08-15 | 2022-09-20 | 纬创资通股份有限公司 | 麦克风装置、电子装置及其音频信号处理方法 |
CN113411698A (zh) * | 2021-06-21 | 2021-09-17 | 歌尔科技有限公司 | 音频信号处理方法及智能音箱 |
CN115452141A (zh) * | 2022-11-08 | 2022-12-09 | 杭州兆华电子股份有限公司 | 一种非均匀声学成像方法 |
Also Published As
Publication number | Publication date |
---|---|
KR101782050B1 (ko) | 2017-09-28 |
EP2431973A1 (en) | 2012-03-21 |
US8965002B2 (en) | 2015-02-24 |
EP2431973B1 (en) | 2015-11-25 |
KR20120029839A (ko) | 2012-03-27 |
US20120070015A1 (en) | 2012-03-22 |
CN102421050B (zh) | 2017-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102421050A (zh) | 使用麦克风的非均匀布局来增强音频质量的设备和方法 | |
CN109102822B (zh) | 一种基于固定波束形成的滤波方法及装置 | |
JP7011075B2 (ja) | マイク・アレイに基づく対象音声取得方法及び装置 | |
US9641929B2 (en) | Audio signal processing method and apparatus and differential beamforming method and apparatus | |
US10123113B2 (en) | Selective audio source enhancement | |
US8654990B2 (en) | Multiple microphone based directional sound filter | |
AU2015292238B2 (en) | Planar sensor array | |
US8160270B2 (en) | Method and apparatus for acquiring multi-channel sound by using microphone array | |
US7991166B2 (en) | Microphone apparatus | |
US10818302B2 (en) | Audio source separation | |
CN105355210A (zh) | 用于远场语音识别的预处理方法和装置 | |
CN109285557B (zh) | 一种定向拾音方法、装置及电子设备 | |
CN110428851B (zh) | 基于麦克风阵列的波束形成方法和装置、存储介质 | |
CN111435598B (zh) | 语音信号处理方法、装置、计算机可读介质及电子设备 | |
WO2016056410A1 (ja) | 音声処理装置および方法、並びにプログラム | |
US9966081B2 (en) | Method and apparatus for synthesizing separated sound source | |
CN108717495A (zh) | 多波束波束成形的方法、装置及电子设备 | |
CN115457971A (zh) | 一种降噪方法、电子设备及存储介质 | |
CN113223552B (zh) | 语音增强方法、装置、设备、存储介质及程序 | |
JP7405758B2 (ja) | 音響オブジェクト抽出装置及び音響オブジェクト抽出方法 | |
CN112735461B (zh) | 拾音方法以及相关装置、设备 | |
Jiang et al. | A Complex Neural Network Adaptive Beamforming for Multi-channel Speech Enhancement in Time Domain | |
CN117711418A (zh) | 一种定向拾音方法、系统、设备及存储介质 | |
CN116017230A (zh) | 麦克风阵列及其信号处理方法、装置、设备及介质 | |
WO2019223650A1 (zh) | 一种波束成形方法、多波束成形方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170412 Termination date: 20180919 |