CN101502129A - 声音收集设备 - Google Patents
声音收集设备 Download PDFInfo
- Publication number
- CN101502129A CN101502129A CNA2007800294126A CN200780029412A CN101502129A CN 101502129 A CN101502129 A CN 101502129A CN A2007800294126 A CNA2007800294126 A CN A2007800294126A CN 200780029412 A CN200780029412 A CN 200780029412A CN 101502129 A CN101502129 A CN 101502129A
- Authority
- CN
- China
- Prior art keywords
- sound
- bundle
- picks
- signal
- pick
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000035945 sensitivity Effects 0.000 claims abstract description 50
- 238000012545 processing Methods 0.000 claims description 44
- 230000005236 sound signal Effects 0.000 claims description 23
- 230000008859 change Effects 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 2
- 230000006835 compression Effects 0.000 description 15
- 238000007906 compression Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 6
- 230000005764 inhibitory process Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 3
- 230000003139 buffering effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/403—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
本发明公开了一种声音收集设备。其中A/D转换器将声音收集信号设置为低灵敏度,并且将该信号输入到声音收集束生成单元。A/D转换器将声音收集信号设置为高灵敏度,并且将该信号输入到声音收集束生成单元。声音检测器根据声音收集束来判断是否存在声音,从而判断是否存在限幅。控制单元输入声音检测器的判断结果。当高电平声音收集束信号被限幅时,对编码器进行设置以便低电平声音收集束信号被输出到外部。
Description
技术领域
本发明涉及一种声音拾取设备,该声音拾取设备用在会议中用来拾取会议中的参与者的语音。
背景技术
最近,IP电话等已经配备了作为用于检测声音存在/不存在的功能的VAD(语音行为检测)。很多电话配备了作为用于在无声期间不发射声音信息的功能的DTX(不连续发射)(例如,参见非专利文献1和非专利文献2)。通过采用在无声期间不发射声音信息的结构(以下称为“无声抑制”),可以降低要发射的信息量(平均的比特率)。然而,无声抑制的执行产生了一个问题:当出现从无声到有声的转变时,在声音开始时会出现中断。
因此,已经建议了一种声音压缩方法,用于当出现从无声到有声的变化时,将拾取到的声音临时存储在存储器中,以及从存储器中读取过去的声音,并且发射以此方式读取的声音,从而防止了在声音中出现中断,否则在开始时将会引起声音中断(例如,参见专利文献1)。
非专利文献1:ITU-T G.711Appendix II to RecommendationG.711(02/2000)
非专利文献2:RFC3389 Real-time Transport Protocol(RTP)Payload for Comfort Noise(CN)
专利文献1:JP-A-2005-266411
发明内容
本发明所要解决的问题
然而,关于专利文献1所描述的方法面临一个问题,即当由于麦克风灵敏度低的原因而不能获得合适的音频信号时,难以检测到开始时的声音。同时,当增加麦克风灵敏度来检测开始时的声音时,可能会错误地将无声阶段认为是有声阶段。而且,当增加麦克风的灵敏度并且当在开始时输入大的声音时,出现了一个问题:声音超过容许输入极限(发生限幅)。
本发明旨在提供一种声音拾取设备,当执行无声抑制时,该声音拾取设备能准确地检测到开始时的声音,并且当在开始时输入大的声音时,该声音拾取设备未能引起限幅。
解决该问题的手段
本发明的声音拾取设备的特征在于包括:
麦克风阵列,其由多个麦克风的排列形成;
信号分配装置,其输入由多个麦克风拾取到的音频信号,并且分配地输出音频信号;
第一声音拾取信号处理装置和第二声音拾取信号处理装置,用于根据由信号分配装置分配地输出的音频信号来分别产生朝同一个区域显示出指向性的第一声音拾取束和第二声音拾取束;
电平设置装置,用于将由第一声音拾取信号处理装置所产生的第一声音拾取束设置为高电平灵敏度,并且将由第二声音拾取信号处理装置所产生的第二声音拾取束设置为低电平灵敏度;
第一存储器和第二存储器,用于分别存储由第一声音拾取信号处理装置所产生的第一声音拾取束和由第二声音拾取信号处理装置所产生的第二声音拾取束;
声音判断单元,用于对由第一声音拾取信号处理装置所产生的第一声音拾取束的信号电平和由第二声音拾取信号处理装置所产生的第二声音拾取束的信号电平进行检测,并用于根据经检测的信号电平来判断是否存在声音,并且检测第一声音拾取束是否超过容许输入极限;
选择器,用于读取存储在第一存储器和第二存储器中的声音拾取束,并且选择性地输出任何一个声音拾取束;以及
控制单元,其进行设置,以便当声音判断单元没有检测到第一声音拾取束超过容许输入极限时,在判断从无声切换到有声的时刻将存储在第一存储器中的高灵敏度声音拾取束输出到选择器,并且以便当声音判断单元检测到第一声音拾取束超过容许输入极限时,在判断从无声变化到有声的时刻将存储在第二存储器中的第二声音拾取束输出到选择器。
在这种配置中,信号分配装置将由多个麦克风拾取到的音频信号分配地输出到第一声音拾取信号处理装置和第二声音拾取信号处理装置。第一声音拾取信号处理装置和第二声音拾取信号处理装置分别产生第一声音拾取束和第二声音拾取束,并且这些声音拾取束被分别设置为高灵敏度和低灵敏度。在存储器中分别存储高灵敏度声音拾取束和低灵敏度声音拾取束。选择器在控制单元指定时从较早的起依次读取存储在存储器中的任何一个声音拾取束,并且输出以此方式读取的声音拾取束。声音判断单元检测声音拾取束中是否存在声音,并检测超过容许输入极限(引起限幅)的声音拾取束。控制单元输入来自声音判断单元的判断结果。在声音拾取束没有被限幅的情况下,当输入了显示判断从无声到有声变化的结果时,控制单元对选择器进行设置,以便选择并读取高灵敏度的声音拾取束。而且,在声音拾取束被限幅的情况下,当输入了显示判断从无声到有声变化的结果时,控制单元对选择器进行设置,以便选择并读取低灵密度的声音拾取束。
而且,本发明的声音拾取设备的特征在于,当声音判断单元将显示声音存在的判断保持了一段预定的时间或更长时间时,控制单元执行正常的输出处理,以命令信号分配装置将所有麦克风所拾取到的音频信号输出到单个声音拾取信号处理装置;命令电平设置装置将由声音拾取信号处理装置所产生的声音拾取束设置为高灵敏度;并且命令选择器输出高灵敏度的声音拾取束。
在该配置中,当在一段给定的时间或更长时间内稳定地输入显示声音存在的判断结果时,执行正常的输出处理,以从所有麦克风所拾取到的声音来产生单个高灵敏度的声音拾取束,并且输出该声音拾取束。因此,当声音被稳定地判断为存在时,语音声音被可靠地输出。
本发明的声音拾取设备的特征在于,当声音判断单元将判断从有声改变到无声时,控制单元将处理从正常输出处理变为检测模式,以命令信号分配装置将音频信号分配地输出到第一信号处理装置和第二信号处理装置;命令电平设置装置将由第一声音拾取信号处理装置所产生的声音拾取束的灵敏度设置为高灵敏度,并将由第二声音拾取信号处理装置所产生的声音拾取束的灵敏度设置为低灵敏度;并且对选择器进行设置,以便当声音判断单元没有检测到超过容许输入极限的声音拾取束时,在判断从无声变化到有声的时刻输出高灵敏度的声音拾取束,并且当声音判断单元检测到超过容许输入极限的声音拾取束时,在判断从无声变化到有声的时刻输出低灵敏度的声音拾取束。
在这种配置中,当在显示声音存在的判断结果被稳定地输入了一段给定的时间或更长时间的状态下输入了显示无声的判断结果时,会引起从正常输出处理到检测模式的变化,其中检测模式使用高灵敏度声音拾取束和低灵敏度声音拾取束来检测从无声到有声的变化。
本发明的声音拾取设备的特征在于,电平设置装置改变由多个麦克风所拾取到的音频信号的电平并且将音频信号输入到声音拾取信号处理装置,由此将声音拾取束设置为高灵敏度或低灵敏度。
本发明的声音拾取设备的特征还在于,电平设置装置改变声音拾取信号处理装置的每一个的输入电平与输出电平的比率,由此将声音拾取束分别设置为高灵敏度或低灵敏度。
本发明的优点
根据本发明,设置了低灵敏度声音拾取束和高灵敏度声音拾取束,并且通过高灵敏度声音拾取束可靠地检测到了从无声变化到有声的时刻。当高灵敏度的声音拾取束被限幅时,输出被切换到低灵敏度的声音拾取束,从而准确地检测到了开始时的声音。即使在开始时输入了大的声音时,也不会出现限幅。
附图说明
图1是示出一个实施例的声音拾取设备中的麦克风布局的视图。
图2是示出该实施例的声音拾取设备的结构框图。
图3是示出麦克风数量和布局的概念描述。
图4是示出其中通过麦克风阵列来拾取声音的声音拾取区域的视图。
101:外壳,11至18:麦克风,21:输入和输入I/F,22:声音拾取放大器,23:A/D转换器,24:数字音频接线,25A,25B:声音拾取束生成单元,26A,26B:FIFO存储器,27:声音检测器,28:控制单元,29:编码器
具体实施方式
本发明的实施例的声音拾取设备将多个麦克风所拾取的音频信号延迟一段给定的时间,并且将以此方式被延迟的信号结合起来,从而生成了将具有高灵敏度的特定区域中的声音聚集而成的声音拾取束(信号)。通过监测该声音拾取束的信号电平来检测有声或无声(语音的存在或不存在)。当声音的存在在一段预定的时间内或更长的时间内被稳定地检测到时通过所有麦克风将声音聚集成的音频信号被延迟一段给定的时间并被结合起来,从而生成声音拾取束(这被视为正常模式)。同时,当没有拾取到语音时,各个麦克风所拾取的音频信号被分配输入到信号处理单元,这些信号处理单元(按照功能)被分为两个单元,各个信号处理单元生成与单个声音拾取区域相关的灵敏度不同的声音拾取束。在这种情况下,通过高灵敏度的声音拾取束来检测声音从无到有的转变。当高灵敏度声音拾取束的信号电平被限幅时,低灵敏度声音拾取束被输出到下一级(这被视为VAD模式)。
以下将参考附图描述本发明的实施例的声音拾取设备。
图1是示出本实施例的声音拾取设备的麦克风布局的视图。
本实施例的声音拾取设备具有在外壳101中设有的多个麦克风11至18。
外壳101采取了在一个方向上伸长的基本上为长方体的形状。在以下描述中,在外壳101的四个侧表面中,伸长的表面被称为长表面,较短的表面被称为短表面。
在外壳101的一个长表面上设有相同规格的麦克风11至18。沿长方向以给定的间隔直线地布置麦克风11至18,从而构建了麦克风阵列。
虽然在本实施例中,麦克风阵列中的麦克风数量被设置为8,但是麦克风的数量并不限于8个。更好地是,根据规格来改变麦克风的数量。而且,麦克风阵列中麦克风间的间隔也可以不是恒定的。例如,还可以存在一种沿纵向在中心处紧密放置以及朝两端零散放置的形式。
由麦克风11至18组成的麦克风阵列产生朝特定区域201至204具有高指向性的声音拾取束。本实施例的声音拾取设备在各个预定时段内对麦克风阵列中各个麦克风所拾取的声音进行延迟,并且将以此方式被延迟的信号结合起来,从而生成与特定区域201至204相关的多个声音拾取束。后面将提供详细的描述。
图2是示出本实施例的声音拾取设备的结构框图。图2所示的框图示出了用于处理多个声音拾取束中的一个声音拾取束的声道。如图2所示,本实施例的声音拾取设备具有麦克风11至18;输入/输出I/F21;多个前端放大器22(图中是8个);8通道A/D转换器23;数字音频接线24;声音拾取束生成单元25(25A和25B);FIFO存储器(26A和26B);声音检测器27;控制单元28和编码器29。在正常模式下,每个声音拾取束生成单元25和FIFO存储器26作为单个组成元件来操作;然而,在VAD模式下,它们中的每个按功能被划分为两个子部分,这些子部分分别操作从而处理不同的声音拾取束。控制单元28提供用于在正常模式和VAD模式之间进行切换的指令。
输入/输出I/F21向外部输出声音拾取设备所拾取的音频信号。输入/输出I/F21在将信号转换为符合网络的数据格式(协议)之后还能向外部输出音频信号,当然也能向外部输出未经修改形式的数字音频信号。必要时,输入/输出I/F21具有内置的D/A转换器,并且能向外部输出模拟音频信号。
麦克风阵列中的各个麦克风11至18还可以是全向的或是指向性的。然而,期望的是,麦克风是指向性的,以及麦克风从声音拾取设备的外部拾取声音,并且将声音拾取信号S1至S8输出到各个放大器22。
各个放大器22通过AMP 22来放大声音拾取信号S1至S8,并且向A/D转换器23提供信号。A/D转换器23对声音拾取信号S1至S8进行数字转换,并且将数字信号输出到数字音频接线24。A/D转换器23能为每个声音拾取信号设置单独的增益(输出模拟信号电平与输出数字信号电平的比率),每个声音拾取信号的增益由控制单元28来设置。
在正常模式下,如图3B所示,数字音频接线24将声音拾取信号S1至S8输出到声音拾取束生成单元25。在VAD模式下,如图3A所示,数字音频接线24将从A/D转换器23输入的声音拾取信号S1至S8分配地输出到各个声音拾取束生成单元25A和25B。数字音频接线24能改变被分配地输出到各个声音拾取束生成单元25A和25B的声音拾取信号的数量(从0至8)。控制单元28设置将要被输出的声音拾取信号的数量以及声音拾取信号的组合。特别地,数字音频接线24能自由地改变麦克风阵列中的麦克风的布局和麦克风数量。
声音拾取束生成单元25对从数字音频接线24输出的声音拾取信号进行预定的延迟处理,从而生成声音拾取束信号MB,该声音拾取束信号MB对于外壳101周围的预定方向(区域201至204中的任何一个区域)显示出高指向性。
例如,假设声波从前面同时到达所有的麦克风,则从各个麦克风输出的声音拾取信号经过结合被加强。同时,当声波从前面之外的其它方向到达麦克风时,从各个麦克风输出的声音拾取信号在相位上彼此不同,因此,声音拾取信号经过结合被减弱。因此,麦克风阵列的灵敏度被缩小在声束分布图上,从而仅在向前的方向上产生声音拾取束。
声音拾取束生成单元25赋予每个声音拾取信号一段预定的延迟时间,从而能使声音拾取束的方向倾斜。当声音拾取束被倾斜时,以下列方式进行设置:每当置于一端的麦克风经过一段预定的时间后,音频信号就从下一个麦克风顺序输出。当声源处于麦克风阵列的一端的前方时,声波来自最接近声源的那端,并且最终到达另一端。然而,声音拾取束生成单元25向来自各个麦克风的声音拾取信号赋予一个延迟时间,以校正传播时间上的差异,随后将这些信号结合起来。控制单元28保持着与各个声音拾取信号对应的麦克风的位置的相关信息,并且单独地控制各个声音拾取信号的延迟时间。因此,通过结合增强了在特定方向上获取的音频信号。如上所述,从一端到另一端顺序地延迟从成行布置的麦克风输出的音频信号,从而根据延迟时间来使声音拾取束倾斜。
在VAD模式下,声音拾取束生成单元25按照功能被划分为声音拾取束生成单元25A和25B。声音拾取束生成单元25A和25B对从数字音频接线24输出的声音拾取信号进行预定的延迟处理,从而产生声音拾取束信号MB1和MB2,信号MB1和MB2朝外壳101周围的预定方向(区域201至204中的任何一个)表现出高指向性。通过将同一区域的处于不同灵敏度水平的声音进行收集来产生声音拾取束信号MB1和MB2。在正常模式和VAD模式下均对同一区域(区域201至204中的任何一个)的声音进行拾取;因此,不管当前的模式是正常模式还是VAD模式,赋予每个声音拾取信号的延迟量假定为相等的。
在正常模式下,声音拾取束生成单元25将声音拾取束信号MB输出到FIFO存储器26和声音检测器27。在VAD模式下实现的声音拾取束生成单元25A和25B将声音拾取束信号MB1和MB2输出给按功能划分的FIFO存储器26A和26B。而且,声音拾取束生成单元25A和25B将声音拾取束信号MB1和MB2输出到声音检测器27。
FIFO存储器26顺序地存储输入的声音拾取束信号MB。FIFO存储器26从较早的起依次向编码器29输出所存储的声音拾取束信号MB。输出定时(周期)由控制单元28来指定。声音拾取束信号MB因此在FIFO存储器26中被缓冲了一段给定的时间。在VAD模式下实现的FIFO存储器26A和26B顺序地存储输入的声音拾取束信号MB1和MB2,并且从较早的起依次向编码器29输出所存储的声音拾取束信号MB1和MB2。甚至在这种情况下,输出定时(周期)也由控制单元28来指定。声音拾取束信号MB1和MB2因此在FIFO存储器26A和26B中被缓冲了一段给定的时间。
声音检测器27对输入的声音拾取束信号MB的信号电平进行检测。基于所检测到的信号电平,声音检测器27判断声音是否存在。特别地,当声音拾取束信号的信号电平从一个小于预定阈值的电平变为一个等于或大于阈值的电平时(当信号电平变为等于或大于阈值时),声音检测器27判断发生了从无声到有声的变化。同时,在声音拾取束信号的信号电平从等于或大于预定阈值的电平变为小于阈值的电平的情况下,仅当信号电平在小于阈值的电平保持一段预定时间或更长时,声音检测器27才会判断发生了从有声到无声的变化。当信号电平变为小于阈值时的时间段小于预定的时间段时,判断声音的存在是连续的。判断结果被输出至控制单元28。
声音检测器27分别对在VAD模式下输入的声音拾取束信号MB1和MB2的信号电平进行检测。声音检测器27基于高灵敏度声音拾取束信号MB1的信号电平来判断是否存在声音。判断结果被输出至控制单元28。
编码器29在正常模式下对从FIFO存储器26输入的声音拾取束信号MB进行压缩,并且将以此方式被压缩的信号输出到输入/输出I/F21。声音压缩方案还可以基于任何方案,例如ITU-T G.711。
在VAD模式下,编码器29对从FIFO存储器26A和26B输入的声音拾取束信号MB1和MB2中的任何一个进行声音压缩,并且将以此方式被压缩的信号输入到输入/输出I/F 21。控制单元28对声音拾取束信号MB1和MB2被压缩后哪一个被输出进行设置。控制单元28对编码器29是否执行声音压缩进行设置。特别地,控制单元28从声音检测器27接收是否存在声音的判断。当判断不存在声音时,控制单元28进行设置,使得编码器29不执行声音压缩并且将压缩的声音输出到输入/输出I/F 21。
声音拾取束信号MB1和MB2在FIFO存储器26A和26B中被缓冲一段预定的时间。因此,当控制单元28从声音检测器27接收到判断从无声到有声变化的结果而向编码器29发送命令来执行切换到有声压缩时,最初获得的声音不产生中断。
然而,当所有麦克风的灵敏度水平都低,并且当声音拾取束信号MB1和MB2的信号电平也低时,声音检测器27不能判断从无声到有声的变化。如果使得用于判断有声和无声的阈值更小的话,即使当最初应该给出显示无声的判断时,也将给出显示有声的判断。同时,当麦克风的灵敏度水平高,并且当声音拾取束信号MB1和MB2的信号电平也高时,就超过了容许输入极限(限幅出现)。
因此,在本实施例的声音拾取设备中,在VAD模式下,数字音频接线24改变麦克风阵列中麦克风的布局和数量,从而对高灵敏度声音拾取束生成单元和低灵敏度声音拾取束生成单元进行设置。从而,在确定无疑地检测到从无声变化到有声的同时,防止了当在从无声到有声的变化期间输入大的声音时而引起的限幅发生。
将描述声音拾取设备的特定操作。图3是示出麦克风的数量和布局的概念描述,以及图4是示出其中麦克风阵列拾取声音的声音拾取区域的视图。图3A是示出VAD模式的处理声道的视图;声音拾取信号S1、S3、S5和S7被输入到声音拾取束生成单元25B;并且声音拾取信号S2、S4、S6和S8被输入到声音拾取束生成单元25A。图3B是示出正常模式的处理声道和图示一个其中所有的声音拾取信号S1至S8被输入到声音拾取束生成单元25示例的视图。当(在一段预定时间或更长时间内)从声音检测器27稳定地输入显示声音存在的判断结果而没有引起限幅时,控制单元28对图3B中的正常模式进行设置。
在正常的模式下,数字音频接线24以麦克风11至18的所有输入线都与声音拾取束生成单元25连接的方式进行设置。A/D转换器23设置麦克风11至18的所有输入声道为高增益,并且输出高电平的声音拾取信号S1至S8。这些设置由控制单元28来控制。
声音拾取束生成单元25将高电平的声音拾取信号S1至S8结合起来,从而产生高电平的声音拾取束信号MB。在这个实施例中,例如,如图4B所示,声音拾取束信号MB对应于区域202中的声音的收集。声音拾取束信号MB被输入到FIFO存储器26。控制单元28设置FIFO存储器26的输出定时,并且将在FIFO存储器26中缓冲的声音拾取束信号MB输出到编码器29。
声音拾取束信号MB被输入到声音检测器27。声音检测器27对输入的声音拾取束信号MB的信号电平进行检测,从而判断是否存在声音。是否存在声音的判断结果被输入到控制单元28。
当被提供了从声音检测器27输入的显示存在声音的判断结果时,控制单元28设置编码器29,以便在将声音拾取束信号MB进行声音压缩之后将其输出。在正常模式下,当被提供了从声音检测器27输入的显示判断从有声到无声变化的结果时,控制单元28转变至VAD模式;将声音拾取束生成单元25和FIFO存储器26中的每个均划分为两个子部分;并且控制A/D转换器23和数字音频接线24来执行如下所述的设置。
数字音频接线24进行设置,从而将麦克风11、麦克风13、麦克风15和麦克风17的输入线连接至声音拾取束生成单元25B,并且将麦克风12、麦克风14、麦克风16和麦克风18的输入线连接至声音拾取束生成单元25A。
A/D转换器23将麦克风11、麦克风13、麦克风15和麦克风17的输入线设置为低增益,并且输出低电平的声音拾取信号S1、S3、S5和S7。而且,A/D转换器23将麦克风12、麦克风14、麦克风16和麦克风18的输入线设置为高增益,并且输出高电平的声音拾取信号S2、S4、S6和S8。
声音拾取束生成单元25A将高电平的声音拾取信号S2、S4、S6和S8结合起来,从而产生高电平的声音拾取束信号MB1。声音拾取束生成单元25B将低电平的声音拾取信号S1、S3、S5和S7结合起来,从而产生低电平的声音拾取束信号MB2。如图4(A)所示,声音拾取束信号MB1和声音拾取束信号MB2对应于同一区域(该图中的区域202)中的声音的收集。
声音拾取束信号MB1被输入到FIFO存储器26A,而声音拾取束信号MB2被输入到FIFO存储器26B。控制单元28设置FIFO存储器26A和FIFO存储器26B的输出定时,并且FIFO存储器26A和FIFO存储器26B将缓冲的声音拾取束信号MB1和缓冲的声音拾取束信号MB2输出到编码器29。
声音拾取束信号MB1和声音拾取束信号MB2被输入到声音检测器27。如前所述,声音检测器27对输入的声音拾取束信号MB1的信号电平和输入的声音拾取束信号MB2的信号电平进行检测,从而判断声音是否存在,并且判断结果被输出到控制单元28。在正常模式时,声音检测器27基于高电平的声音拾取束信号MB1的信号电平来判断声音是否存在。当高电平的声音拾取束信号的信号电平被限幅时(当超过容许输入极限时),显示发生限幅的结果被输出到控制单元28。
当从声音检测器27输入显示无声的判断结果时,控制单元28设置编码器29不输出压缩的声音,无需执行声音压缩。同时,当从声音检测器27输入显示声音存在的判断结果而没有引起限幅时,控制单元28设置编码器29,以便将高电平的声音拾取束信号MB1进行声音压缩,并且输出以此方式被压缩的信号。当从声音检测器27输入显示存在声音的判断结果并且具有限幅时,控制单元28对编码器29进行设置,以便将低电平的声音拾取束信号MB2进行声音压缩,并且输出以此方式被压缩的信号。而且,当(在一段预定的时间或更长时间内)从声音检测器27稳定地输入显示声音存在的判断结果,而没有引起限幅时,控制单元28从VAD模式转变到正常模式。
如上所述,声音检测器27基于高电平声音拾取束信号MB1的信号电平能可靠地检测从无声到有声的变化。当从无声到有声的变化期间输入大的声音时,控制单元28设置编码器29,以便将低电平的声音拾取束信号MB2进行声音压缩,并且输出以此方式被压缩的信号;因此,没有失真等的声音被输出到外部。当然,由于声音拾取束信号MB1和声音拾取束信号MB2在FIFO存储器26A和FIFO存储器26B中进行缓冲,因此不会出现开始时声音中断的发生,当控制单元28接收到显示判断从无声到有声变化的结果并且控制编码器29切换到有声压缩时将会引起这种中断的发生。
当声音检测器27(在一段预定的时间或更长时间内)稳定地输出显示存在声音的判断结果,而没有引起限幅时,转变到正常模式,并且声音拾取束是采用所有的麦克风11至18产生的。因此,改善了声音质量,并且能确定无疑地拾取到扬声器的语音。当声音检测器27输出显示判断从有声到无声变化的结果时,控制单元28转变到VAD模式。因此,当执行无声抑制时,在通过高电平的声音拾取束信号和低电平的声音拾取束信号确定无疑地进行从无声到有声变化的判断的同时,能防止限幅的发生。当执行有声压缩时,通过声音质量高的声音拾取束信号,能从所有的麦克风确定无疑地拾取到扬声器的语音,并且能输出以此方式被拾取到的语音。
上述实施例提供了一个示例,其中控制单元28通过单独地设置A/D转换器23的各个输入/输出线的增益来产生高电平声音拾取束信号和低电平声音拾取束信号;然而,还可以为A/D转换器23的所有线路设置单个增益。在这种情况下,基本要求是:进行设置,以使声音拾取束生成单元25A和声音拾取束生成单元25B在增益(输出信号电平与每个声音拾取信号的电平的比率)上彼此不同。基本要求是:即使输入了相同电平的声音拾取信号时,声音拾取束生成单元25A也应该输出高电平声音拾取束信号,而且声音拾取束生成单元25B也应该输出低电平声音拾取束信号。
Claims (5)
1.一种声音拾取设备,其包括:
麦克风阵列,其由多个麦克风的排列形成;
信号分配装置,其输入由多个麦克风拾取到的音频信号,并且分配地输出音频信号;
第一声音拾取信号处理装置和第二声音拾取信号处理装置,用于根据由信号分配装置分配地输出的音频信号来分别产生朝同一个区域表现出指向性的第一声音拾取束和第二声音拾取束;
电平设置装置,用于将由第一声音拾取信号处理装置所产生的第一声音拾取束设置为高电平灵敏度,并且将由第二声音拾取信号处理装置所产生的第二声音拾取束设置为低电平灵敏度;
第一存储器和第二存储器,用于分别存储由第一声音拾取信号处理装置所产生的第一声音拾取束和由第二声音拾取信号处理装置所产生的第二声音拾取束;
声音判断单元,用于对由第一声音拾取信号处理装置所产生的第一声音拾取束的信号电平和由第二声音拾取信号处理装置所产生的第二声音拾取束的信号电平进行检测;根据经检测的信号电平来判断是否存在声音;并且检测第一声音拾取束是否超过容许输入极限;
选择器,用于读取存储在第一存储器和第二存储器中的声音拾取束,并且选择性地输出任何一个声音拾取束;以及
控制单元,其进行设置以便当声音判断单元检测到第一声音拾取束没有超过容许输入极限时,在判断从无声到有声变化的时刻将存储在第一存储器中的高灵敏度声音拾取束输出到选择器,并且以便当声音判断单元检测到第一声音拾取束超过容许输入极限时,在判断从无声到有声变化的时刻将存储在第二存储器中的第二声音拾取束输出到选择器。
2.根据权利要求1所述的声音拾取设备,其中,
当声音判断单元将显示声音存在的判断保持了一段预定时间或更长时间时,控制单元执行正常的输出处理,用以:
命令信号分配装置将由所有麦克风所拾取到的音频信号输出到单个声音拾取信号处理装置;
命令电平设置装置将由声音拾取信号处理装置所产生的声音拾取束设置为高灵敏度;以及
命令选择器输出高灵敏度的声音拾取束。
3.根据权利要求2所述的声音拾取设备,其中,
当声音判断单元将判断从有声改变到无声时,控制单元将处理从正常输出处理改变为检测模式,用以:
命令信号分配装置将音频信号分配地输出到第一信号处理装置和第二信号处理装置;
命令电平设置装置将由第一声音拾取信号处理装置所产生的第一声音拾取束的灵敏度设置为高灵敏度,并且将由第二声音拾取信号处理装置所产生的第二声音拾取束的灵敏度设置为低灵敏度;以及
对选择器进行设置,以便
当声音判断单元没有检测到第一声音拾取束超过容许输入极限时,在判断从无声变化到有声的时刻输出第一声音拾取束,以及
当声音判断单元检测到第一声音拾取束超过容许输入极限时,在判断从无声变化到有声的时刻输出第二声音拾取束。
4.根据权利要求1或2或3所述的声音拾取设备,其中电平设置装置改变由多个麦克风所拾取到的音频信号的电平并且将音频信号输入到声音拾取信号处理装置,从而将第一声音拾取束和第二声音拾取束设置为高灵敏度或低灵敏度。
5.根据权利要求1或2或3所述的声音拾取设备,其中电平设置装置改变第一声音拾取信号处理装置和第二声音拾取信号处理装置中每一个的输入电平与输出电平的比率,从而将第一声音拾取束和第二声音拾取束分别设置为高灵敏度或低灵敏度。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP214691/2006 | 2006-08-07 | ||
JP2006214691A JP4893146B2 (ja) | 2006-08-07 | 2006-08-07 | 収音装置 |
PCT/JP2007/065173 WO2008018362A1 (fr) | 2006-08-07 | 2007-08-02 | dispositif de collecte sonore |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101502129A true CN101502129A (zh) | 2009-08-05 |
CN101502129B CN101502129B (zh) | 2012-11-14 |
Family
ID=39032894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800294126A Active CN101502129B (zh) | 2006-08-07 | 2007-08-02 | 声音收集设备 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8103018B2 (zh) |
EP (1) | EP2059065A1 (zh) |
JP (1) | JP4893146B2 (zh) |
CN (1) | CN101502129B (zh) |
WO (1) | WO2008018362A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103873998B (zh) * | 2012-12-17 | 2018-07-03 | 联想(北京)有限公司 | 电子设备和声音采集方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010245657A (ja) * | 2009-04-02 | 2010-10-28 | Sony Corp | 信号処理装置及び方法、並びにプログラム |
US9813262B2 (en) | 2012-12-03 | 2017-11-07 | Google Technology Holdings LLC | Method and apparatus for selectively transmitting data using spatial diversity |
US9591508B2 (en) | 2012-12-20 | 2017-03-07 | Google Technology Holdings LLC | Methods and apparatus for transmitting data between different peer-to-peer communication groups |
US9979531B2 (en) | 2013-01-03 | 2018-05-22 | Google Technology Holdings LLC | Method and apparatus for tuning a communication device for multi band operation |
US10229697B2 (en) * | 2013-03-12 | 2019-03-12 | Google Technology Holdings LLC | Apparatus and method for beamforming to obtain voice and noise signals |
CN104066036A (zh) * | 2014-06-19 | 2014-09-24 | 华为技术有限公司 | 拾音装置及拾音方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5335011A (en) * | 1993-01-12 | 1994-08-02 | Bell Communications Research, Inc. | Sound localization system for teleconferencing using self-steering microphone arrays |
JPH10116099A (ja) * | 1996-10-11 | 1998-05-06 | Olympus Optical Co Ltd | 音声起動録音装置 |
JP4248636B2 (ja) * | 1998-10-30 | 2009-04-02 | オリンパス株式会社 | 音声録音装置 |
KR100637563B1 (ko) * | 1999-12-13 | 2006-10-20 | 가부시키가이샤 캔우드 | 광학식 음향전기 변환장치 |
US20030161485A1 (en) * | 2002-02-27 | 2003-08-28 | Shure Incorporated | Multiple beam automatic mixing microphone array processing via speech detection |
KR100493172B1 (ko) * | 2003-03-06 | 2005-06-02 | 삼성전자주식회사 | 마이크로폰 어레이 구조, 이를 이용한 일정한 지향성을갖는 빔 형성방법 및 장치와 음원방향 추정방법 및 장치 |
US7190775B2 (en) * | 2003-10-29 | 2007-03-13 | Broadcom Corporation | High quality audio conferencing with adaptive beamforming |
JP2005266411A (ja) | 2004-03-19 | 2005-09-29 | Matsushita Electric Ind Co Ltd | 音声圧縮方法および電話器 |
US7991167B2 (en) * | 2005-04-29 | 2011-08-02 | Lifesize Communications, Inc. | Forming beams with nulls directed at noise sources |
JP4747949B2 (ja) * | 2006-05-25 | 2011-08-17 | ヤマハ株式会社 | 音声会議装置 |
JP2008154056A (ja) * | 2006-12-19 | 2008-07-03 | Yamaha Corp | 音声会議装置および音声会議システム |
-
2006
- 2006-08-07 JP JP2006214691A patent/JP4893146B2/ja active Active
-
2007
- 2007-08-02 WO PCT/JP2007/065173 patent/WO2008018362A1/ja active Application Filing
- 2007-08-02 US US12/376,682 patent/US8103018B2/en active Active
- 2007-08-02 CN CN2007800294126A patent/CN101502129B/zh active Active
- 2007-08-02 EP EP07805894A patent/EP2059065A1/en not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103873998B (zh) * | 2012-12-17 | 2018-07-03 | 联想(北京)有限公司 | 电子设备和声音采集方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4893146B2 (ja) | 2012-03-07 |
US8103018B2 (en) | 2012-01-24 |
WO2008018362A1 (fr) | 2008-02-14 |
EP2059065A1 (en) | 2009-05-13 |
CN101502129B (zh) | 2012-11-14 |
US20100046763A1 (en) | 2010-02-25 |
JP2008042549A (ja) | 2008-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101502129B (zh) | 声音收集设备 | |
JP6299895B2 (ja) | マイクユニット、ホスト装置、および信号処理システム | |
JP5003531B2 (ja) | 音声会議システム | |
CN1728892B (zh) | 声场校正设备及其方法 | |
AU604444B2 (en) | Frame relay type data switching apparatus | |
CN110166882A (zh) | 远场拾音设备、及远场拾音设备中采集人声信号的方法 | |
JPWO2007013180A1 (ja) | 会議用音声システム | |
CN101455093A (zh) | 语音会议装置 | |
EP1160772A3 (en) | Multisensor based acoustic signal processing | |
US8054999B2 (en) | Audio system with varying time delay and method for processing audio signals | |
CN100382591C (zh) | 在多媒体接收器中缓冲音讯的方法与相关装置 | |
JP2008060675A (ja) | 音声再生装置、音声再生方法 | |
CN102484757A (zh) | 用于会议音频系统的延迟单元、用于延迟音频输入信号的方法、计算机程序以及会议音频系统 | |
CN216852325U (zh) | 用于拾音和回音消除的电路系统和语音装置 | |
JPH0683257B2 (ja) | パケット通信方式 | |
JP2720800B2 (ja) | 雑音挿入方法および装置 | |
KR100720337B1 (ko) | 비선형 증폭기를 이용한 음성처리 시스템 | |
JP5024010B2 (ja) | 音声会議用システム | |
JP2008294600A (ja) | 放収音装置、および放収音システム | |
JPH02260751A (ja) | 多地点会議システムにおける議事内容蓄積方式 | |
JP2010210807A (ja) | 信号切り換え装置および信号切り換え装置におけるsdi信号処理方法 | |
JP2512136B2 (ja) | 音声パケット再生装置 | |
KR960012985B1 (ko) | 메모리를 이용한 음원 지연회로 | |
JPH0715260A (ja) | デジタル音声回路 | |
JP2003316382A (ja) | 音声入力装置、音声入力方法及びそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |