CN102637437A - 音频处理设备及其控制方法 - Google Patents

音频处理设备及其控制方法 Download PDF

Info

Publication number
CN102637437A
CN102637437A CN201210030365XA CN201210030365A CN102637437A CN 102637437 A CN102637437 A CN 102637437A CN 201210030365X A CN201210030365X A CN 201210030365XA CN 201210030365 A CN201210030365 A CN 201210030365A CN 102637437 A CN102637437 A CN 102637437A
Authority
CN
China
Prior art keywords
frequency
audio
signal
output signal
wind noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210030365XA
Other languages
English (en)
Inventor
木村正史
梶村文裕
鹫巢晃一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN102637437A publication Critical patent/CN102637437A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/22Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only 
    • H04R1/24Structural combinations of separate transducers or of two parts of the same transducer and responsive respectively to two or more frequency ranges
    • H04R1/245Structural combinations of separate transducers or of two parts of the same transducer and responsive respectively to two or more frequency ranges of microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/07Mechanical or electrical reduction of wind noise generated by wind passing a microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Abstract

本发明提供一种音频处理设备及其控制方法。音频处理设备包括第一音频拾取单元和第二音频拾取单元。第二音频拾取部件包括被设置成覆盖声音接收部的音频抵抗器,以使得在使外部音频通过的同时抑制外部风传入。第一滤波器衰减具有低于第一A/D转换器的输出信号的第一截止频率的频率的信号。第二滤波器衰减具有高于第二A/D转换器的输出信号的第二截止频率的频率的信号。在第一音频拾取单元和第一A/D转换器之间设置第三滤波器,以衰减具有低于用于抑制风噪声的第三截止频率的频率的信号。

Description

音频处理设备及其控制方法
技术领域
本发明涉及一种音频处理设备及其控制方法。
背景技术
作为音频处理设备通常已知摄像机和IC记录器等。在这些音频处理设备中,通过麦克风获取的音频信号可能包含由风的影响引起的噪声。作为对策,一些设备在A/D转换器之前设置增益控制器,以防止通过A/D转换器的音频信号饱和,并且还消除低频成分以降低通过A/D转换器的音频信号中的风噪声。例如,日本特开2008-129107公开了一种通过在A/D转换器之前设置增益控制器、并且还在用于风噪声处理的低频消除单元之后设置增益控制器来获得高质量音频的方法。
然而,在日本特开2008-129107公开的传统技术中,在风噪声处理之后的增益控制时,量化误差可能变大。例如,根据日本特开2008-129107的方法,当增益控制器增大增益时,上述A/D转换器的量化误差变大。
发明内容
本发明通过抑制由于风噪声处理之后的增益控制而引起的量化误差的增大来提供高质量音频。
根据本发明的一个方面,一种音频处理设备,包括:第一音频拾取部件;第二音频拾取部件,其包括被设置成覆盖声音接收部的音频抵抗器,以使得在使外部音频通过的同时抑制外部风传入;第一A/D转换部件,用于对从所述第一音频拾取部件的输出信号进行数字化;第二A/D转换部件,用于对从所述第二音频拾取部件的输出信号进行数字化;电平控制部件,用于控制所述第一A/D转换部件的输出信号的信号电平和所述第二A/D转换部件的输出信号的信号电平中的至少一个;第一低频衰减部件,用于使所述第一A/D转换部件的输出信号中频率低于第一截止频率的信号衰减;高频衰减部件,用于使所述第二A/D转换部件的输出信号中频率高于第二截止频率的信号衰减;加法部件,用于将所述第一低频衰减部件的输出信号和所述高频衰减部件的输出信号相加,以输出降低了风噪声的音频;以及第二低频衰减部件,其被设置在所述第一音频拾取部件和所述第一A/D转换部件之间,并用于使频率低于第三截止频率的信号衰减,从而抑制风噪声。
根据本发明的另一方面,一种音频处理设备的控制方法,所述音频处理设备包括:第一音频拾取部件;第二音频拾取部件,其包括被设置成覆盖声音接收部的音频抵抗器,以使得在使外部音频通过的同时抑制外部风传入;第一A/D转换部件,用于对从所述第一音频拾取部件的输出信号进行数字化;第二A/D转换部件,用于对从所述第二音频拾取部件的输出信号进行数字化;电平控制部件,用于控制所述第一A/D转换部件的输出信号的信号电平和所述第二A/D转换部件的输出信号的信号电平中的至少一个;第一低频衰减部件,用于使所述第一A/D转换部件的输出信号中频率低于第一截止频率的信号衰减;高频衰减部件,用于使所述第二A/D转换部件的输出信号中频率高于第二截止频率的信号衰减;加法部件,用于将所述第一低频衰减部件的输出信号和所述高频衰减部件的输出信号相加,以输出降低了风噪声的音频;以及第二低频衰减部件,其被设置在所述第一音频拾取部件和所述第一A/D转换部件之间,并用于使频率低于第三截止频率的信号衰减,从而抑制风噪声,所述控制方法包括以下步骤:控制所述第一A/D转换部件的输出信号的信号电平和所述第二A/D转换部件的输出信号的信号电平中的至少一个;以及混合如下两个成分:信号电平被控制了的所述第一A/D转换部件的输出信号中频率高于所述第一截止频率的高频成分;以及信号电平被控制了的所述第二A/D转换部件的输出信号中频率低于所述第二截止频率的低频成分。
根据本发明,可以通过抑制由于风噪声处理之后的增益控制而引起的量化误差的增大来提供高质量音频。
通过以下参考附图对典型实施例的详细说明,本发明的其它特征和方面将显而易见。
附图说明
包含在说明书中并构成说明书的一部分的附图,示出本发明的典型实施例、特征和方面,并与说明书一起用来解释本发明的原理。
图1是示出根据实施例的音频记录器的结构的框图;
图2A和2B是分别示出摄像装置的立体图和断面图;
图3A~3F是示出麦克风的频率特性的例子的图;
图4A~4D是用于说明麦克风的安装结构的图;
图5是示出混响抑制器的结构的框图;
图6A~6D是示出风检测器根据风噪声的操作的时序图;
图7A~7D是示出混合器的结构和操作的图;
图8A~8D是示出开关、可变滤波器和可变增益的操作序列的图;
图9是用于说明在不存在HPF时的风噪声处理的时序图;
图10是用于说明在存在HPF时的风噪声处理的时序图;
图11A和11B是示出音频处理设备的其它例子的框图;
图12是示出根据第二实施例的摄像装置的立体图;以及
图13是示出根据第二实施例的音频处理设备的结构的框图。
具体实施方式
下面将参考附图详细说明本发明的各种典型实施例、特征和方面。
第一实施例
下面将参考图1~11A和11B说明根据本发明第一实施例的用作音频处理设备的音频记录器和包括该音频记录器的摄像装置。
图1是示出根据本实施例的音频记录器的结构的框图。图2A和2B是分别示出包括图1所示的音频记录器的摄像装置(照相机)的立体图和断面图。附图标记1表示摄像装置,附图标记2表示装配至摄像装置1的镜头,附图标记3表示摄像装置1的机体,附图标记4表示镜头的光轴,附图标记5表示拍摄光学系统,并且附图标记6表示图像传感器。附图标记30表示释放按钮,并且附图标记31表示操作按钮。在摄像装置1中设置第一麦克风7a和第二麦克风7b。在机体3上设置分别用于麦克风7a和7b的开口部32a和32b。用于在使外部音频通过的同时抑制风传入的音频抵抗器41被粘贴至开口部32b,以覆盖麦克风7b的声音接收部。还可以通过使机体3具有不均匀厚度或者使用额外的部件来形成音频抵抗器41,如后面所述。摄像装置1可以使用麦克风7a和7b,在进行图像获取的同时进行音频记录。
将说明摄像装置1的运动图像拍摄操作。当用户在运动图像拍摄之前按下实时取景按钮(未示出)时,将图像传感器6上的图像实时显示在摄像装置1中所设置的显示装置上。与运动图像拍摄按钮的操作同步,摄像装置1以所设置的帧频从图像传感器6获得被摄体信息,同时从麦克风7a和7b获得音频信息,并且将这些信息同步记录在存储器(未示出)中。与运动图像拍摄按钮的操作同步结束拍摄。
将参考图1说明音频处理设备51的结构。附图标记52表示能够改变截止频率的模拟高通滤波器(HPF),附图标记53表示由例如混响抑制自适应滤波器所形成的混响抑制器,附图标记54a和54b表示对从麦克风所输出的信号进行数字化的第一A/D转换器(ADC),附图标记55表示第一延迟装置(DL)55,并且附图标记56a和56b表示DC成分截止HPF。
附图标记61表示自动电平控制器(ALC)。ALC 61包括用于电平控制的可变增益62a和62b以及电平控制器63。
混合器71混合第一麦克风7a的信号和第二麦克风7b的信号。混合器71包括低通滤波器(LPF)72、能够改变截止频率的HPF 73、增益乘法器74和加法器75。
附图标记81表示风检测器。风检测器81包括带通滤波器(BPF)82a和82b、减法器83、第二A/D转换器(ADC)84、第二延迟装置85和电平检测器86。
附图标记87表示控制混响抑制器53的开关,附图标记88表示控制混合器71的开关,并且附图标记89表示模式切换操作单元。
不用说,高通滤波器衰减具有低于预定频率的频率的信号,但是不衰减具有高于预定频率的频率的信号。因此,与具有高于预定频率的频率的信号成分相比,高通滤波器更多衰减输入信号中的具有低于预定频率的频率的信号成分。将该预定频率称为截止频率。类似地,低通滤波器衰减具有高于预定频率的频率的信号,但是不衰减具有低于预定频率的频率的信号。因此,与具有低于预定频率的频率的信号成分相比,低通滤波器更多衰减输入信号中的具有高于预定频率的频率的信号成分。将该预定频率称为截止频率。带通滤波器衰减预定频率范围外的信号,但是不衰减预定频率范围内的信号。因此,与预定频率范围内的信号相比,带通滤波器更多衰减预定频率范围外的信号。换句话说,这些滤波器提取具有想要的频率的信号。
参考图1、2A和2B,将用于麦克风的开口部32a和32b设置在机体3中。将覆盖第二麦克风7b的音频抵抗器41设置在开口部32b上,以遮蔽从设备外部到第二麦克风7b的空气的移动。另一方面,不向开口部32a设置这样的音频抵抗器,从而使得第一麦克风7a可以忠实地获取被摄体声音。将音频抵抗器41设置成与机体3紧密接触。这里假定空气的移动是通过风的空气移动。例如,还可以使用诸如多孔PTFE等材料作为音频抵抗器,其中,多孔PTFE允许空气比风移动的空气更慢地移动,但是不允许风通过。
在音频处理设备51中,HPF 52处理来自第一麦克风7a的信号,然后对其进行ADC 54a的模拟/数字转换(A/D转换)。第一延迟装置55使来自ADC 54a的输出延迟适当量。另一方面,在音频处理设备51中,通过ADC 54b对来自第二麦克风7b的信号进行A/D转换,然后对其进行混响抑制器53的混响抑制。后面将说明混响抑制器53的操作和如何使第一延迟装置55施加延迟。
DC成分截止HPF 56a和56b分别处理来自第一延迟装置55和ADC 54b的输出。HPF 56a和56b旨在消除模拟部的偏移,并且仅需要从DC消除可听范围以下的成分。为此,将HPF 56a和56b的截止频率设置成例如约10Hz。
将来自HPF 56a和56b的输出输入至ALC 61,并且对其进行可变增益62a和62b的增益控制。此时,控制可变增益62a和62b中至少一个的增益,以使得例如作为低于HPF 56的频率的频率的2kHz的两个信号电平变得一致。电平控制器63接收来自可变增益62a和62b的输出,适当控制电平以使得在不会导致饱和的情况下有效使用动态范围。此时,电平控制器63进行电平控制以不会导致来自可变增益62a和62b的输出中较大的一个饱和。
将来自可变增益62a和62b的输出输入至混合器71。使来自可变增益62a的输出通过HPF 73,并且将其发送给加法器75。另一方面,经由LPF 72和可变增益74将来自可变增益62b的输出发送给加法器75。输出加法器75所混合得到的输出作为风噪声处理之后的音频。
将来自第一麦克风7a的输出和来自混响抑制器53的输出分别输入至风检测器81的BPF 82a和82b。BPF 82a和82b旨在使在可以由第二麦克风7b忠实地获取被摄体声音的范围内的成分通过。因此,将通带设置成例如约30Hz~1kHz。然而,可以根据音频抵抗器41的结构等改变频率的上限设置值。后面将与第二麦克风7b的频率特性一起进行详细说明。
第二ADC 84对来自BPF 82a的输出进行A/D转换,并且将其发送给第二延迟装置85。后面将与混响抑制器53的操作一起,对如何使第二延迟装置85施加延迟进行说明。
减法器83计算来自第二延迟装置85的输出和来自BPF 82b的输出之间的差,并且将结果发送给电平检测器86。后面将说明电平检测器86的操作。电平检测器86判断风的强度,并且控制开关87以切换对混响抑制器53的反馈。还使用电平检测器86的检测结果来控制用于控制混合器71的开关88。当用户将模式切换操作单元89设置成“关闭”时,开关88工作以始终选择后面将说明的无风状态下的处理。当用户将模式切换操作单元89设置成“自动”时,开关88工作以根据通过电平检测器86所确定的风强度,改变HPF 52和HPF 73的截止频率和可变增益74。后面将详细说明该处理。
将参考图1、3A~3F以及4A~4D说明音频抵抗器41的效果和期望的特性以及风噪声降低。图3A~3F是示意性示出麦克风的频率特性的图。横坐标表示频率,并且纵坐标表示增益。图3A示出第一麦克风7a的被摄体声音获取特性。图3B示出第二麦克风7b的被摄体声音获取特性。图3C示出第一麦克风7a的风噪声获取特性。图3D示出第二麦克风7b的风噪声获取特性。图3E示出混合器71的输出的被摄体声音获取特性。图3F示出混合器71的输出的风噪声获取特性。为阐明第一麦克风7a和第二麦克风7b之间的特性差异,在图3B和3D中以虚线表示第一麦克风7a的特性。在图3A和3B中,f0表示音频抵抗器41的结构截止频率,并且f1表示图1所示的混合器71中的LPF 72和HPF 73的截止频率。
如图3A所示,第一麦克风7a的被摄体声音获取特性在可听范围中优选是平坦的。这允许忠实地获取被摄体声音。如图3B所示,由于设置了音频抵抗器41以遮蔽来自被摄体的空气移动,所以第二麦克风7b具有不同的特性。第二麦克风7b相对忠实地使频率低于音频抵抗器41的截止频率的音频信号通过。这是因为,作为空气的压缩波的声音激励音频抵抗器41,由此音频抵抗器41以相同方式激励设备中的空气。另一方面,第二麦克风7b遮蔽频率高于音频抵抗器41的截止频率的音频信号。这是因为,尽管作为空气的压缩波的声音激励音频抵抗器41,但是在音频抵抗器41开始振动之前,密度反转,并且空气不能移动。因此,音频抵抗器41抑制风噪声,并且用作为用于除风噪声以外的音频的结构低通滤波器。将结构截止开始的频率f0称为音频抵抗器41的截止频率。
已知风噪声的能量集中在低频范围。例如,对于第一麦克风7a中的风噪声的能量,在许多情况下获得从约1kHz向低频侧升高的特性,如图3C所示。即使形状与图3C所示的不同,低频成分(等于或小于500Hz)在风噪声中也占主导。如图3D所示,在第二麦克风7b中,风噪声的低频成分的升高小。在第一麦克风7a附近,由于湍流等而容易生成大的气压差。然而,对于第二麦克风7b,由于设置了音频抵抗器41以遮蔽来自被摄体的空气的移动,所以不会由湍流等引起这样的大的气压差。这是为什么在第二麦克风7b的输出中风噪声的低频成分小的原因。
考虑混合器71对这些信号的处理。如以上参考图1所述,HPF 73处理第一麦克风7a的信号。这对应于截取图3A中的部分91和图3C中的部分93。LPF 72处理第二麦克风7b的信号。这对应于截取图3B中的部分92和图3D中的部分94。当通过加法器75时,获得如图3E所示的被摄体声音特性,并且获得如图3F所示的风噪声特性。在图3E和3F所示的部分91a、92a、93a、94a处,部分91、92、93和94占主导。注意,由于对应部分因LPF 72和HPF 73的特性而并非必然为0,所以使用表述“占主导”。通过图3E和3F显而易见,混合器71的输出在可听范围中具有平坦的被摄体声音特性,并且风噪声特性等于设置有音频抵抗器41的麦克风的特性。
图4A~4D示出麦克风的安装结构的例子。参考图4A~4D,附图标记33a和33b分别表示第一麦克风7a和第二麦克风7b的保持弹性体,并且附图标记34表示保持第二麦克风7b和音频抵抗器41的套筒。
图4A示出将音频抵抗器41粘贴在机体3外部的例子。在图4A的例子中,可以在组装了设备之后粘贴音频抵抗器41。这使得能够提高组装效率。
图4B示出将音频抵抗器41粘贴在机体3内部的例子。在图4B的例子中,由于音频抵抗器41不暴露于机体3的外部,所以可以获得精美外观。
图4C示出机体3的一部分还发挥音频抵抗器41的功能的例子。在图4C的例子中,使得机体3的用作音频抵抗器41的部分薄得可以通过声波振动。在图4C的例子中,由于不需要向机体3粘贴音频抵抗器41,并且可以减少部件的数量,所以可以获得精美外观。然而,在图4C的例子中,由于机体3和音频抵抗器41是一体的,所以设计的自由度通常降低(机体3的强度可能由于形成音频抵抗器41的部分的厚度而受到限制,结果导致难以同时满足这两个要求)。
图4D示出足够刚性的套筒34保持第二麦克风7b和音频抵抗器41的例子。套筒34优选具有足够高于第二麦克风7b要获取的频带的一次谐振频率(这意味着套筒34的谐振频率高于图3A和3B中的f0)。在图4D的例子中,将音频抵抗器41安装到高刚性的套筒34。因此,在不会受到安装结构的不必要的谐振的影响的情况下,可以获得通带中(图3A和3B中低于f0的频率处)期望的音频信号。
接着参考图1和5说明混响抑制器53。由于音频抵抗器41覆盖第二麦克风7b,所以在封闭空间中可能发生混响。在本实施例中,设置混响抑制器53来抑制这类混响。
图5示出混响抑制器53的详细结构。由自适应滤波器形成混响抑制器53。该自适应滤波器估计并学习滤波系数以最小化减法器83的输出,即表示风噪声的水平的、第一麦克风7a的输出信号和第二麦克风7b的输出信号之间的差,如下面详细所述。这样抑制在音频抵抗器41和第二麦克风7b之间的封闭空间中所生成的、包含在第二麦克风7b的输出信号中的混响成分。使用这类自适应滤波器,使得即使混响生成状态由于用户的照相机把持状态的变化或温度的变化而改变,也能够适当进行处理。
将简要说明混响抑制的原理。假定s是被摄体声音,g1是第一麦克风7a的被摄体声音获取特性,g2是第二麦克风7b的被摄体声音获取特性,并且r是混响的影响。被摄体声音获取特性g1和g2等于图3A~3F所示的频率空间的特性的逆傅立叶变换结果。如下给出在第二麦克风7b中具有混响的环境下所获得的第一麦克风7a的信号x1和第二麦克风7b的信号x2:
x1=s*g1
x2=s*g2*r    ...(1)
其中,*是表示卷积的运算符号。如参考图3A~3F所述,在低于f0的频率处,第一麦克风7a和第二麦克风7b可以获取相同的被摄体声音。如图1所示,BPF 82a和82b仅提取适当频带的成分。因此,BPF使可听范围内低于图3A~3F中的f0的频率通过。由于人的听觉特性,人的听觉对50Hz以下的频带表现出非常低的灵敏度。更详细地,参考A特性曲线等。因此,将BPF 82a和82b设计成使例如30Hz~1kHz的频率通过。假定BPF为BPF 82a和82b,并且x1_BPF和x2_BPF是通过BPF的信号,则下面的公式成立:
x1_BPF=s*g1*BPF
x2_BPF=s*g2*r*BPF    ...(2)
g1*BPF=g2*BPF
保持g 1≠g2和g 1*BPF≠g2*BPF,这相当于允许第一麦克风7a和第二麦克风7b在低于f0的频率处获取相同被摄体声音。通过公式(2)显而易见,当不存在混响的影响r时,向图1中的减法器83输入相同的信号。通过公式(2)可知,通过使用x1_BPF=d作为期望的响应和x2_BPF=u作为输入来操作自适应滤波器,可以降低混响的影响。
当将混响抑制器53的滤波器表示为h时,如下给出自适应滤波器输出y:
y ( n ) = h * u = Σ i = 0 M h n ( i ) u ( n - i ) = Σ i = 0 M h n ( i ) x 2 _ BPF ( n - i ) . . . ( 3 )
其中,n表示第n个样本的信号,M是混响抑制器53的滤波器阶数,并且h的下标表示第n个样本的滤波器h的值。作为输入u,使用x2_BPF。
另外,使用x1_BPF=d作为期望的响应。因此,如下表示误差信号e:
e ( n ) = d ( n ) - y ( n ) = x 1 _ BPF ( n ) - Σ i = 0 M h n ( i ) x 2 _ BPF ( n - i ) . . . ( 4 )
已经提出了各种自适应算法。例如,如下给出利用LMS算法的h的更新公式:
hn+1(i)=hn(i)+μe(n)u(n-i)  (i=0,1,...M)    ...(5)
其中,μ是步长参数。根据上述方法,使用公式(5)给出和更新适当的初始值h,从而使得u更接近d。因此,降低了影响r,并且x1_BPF=x2_BPF差不多成立。此时,在BPF的通带中,|h*r|=1成立。然而,在风噪声占主导的环境下,没有正确进行公式(5)的更新。因此,通过开关87停止自适应滤波器的估计学习。后面将与风检测器81的操作一起说明开关87的控制序列。
如上所述,混响抑制器53抑制混响。在混响抑制器53中,通过图5显而易见,信号根据自适应滤波器的阶数而延迟。为对此进行补偿,图1中的音频处理设备包括第一延迟装置55和第二延迟装置85。通常,给出混响抑制器53的滤波器阶数的1/2(=M/2)的延迟(当M为奇数时,可使用邻近值)。此时,例如,设置h(M/2)=1,并且将所有其它值h初始化成0。这允许自适应算法在无混响状态下使用初始值来运行。如果将用于混响抑制的适当初始值存储在存储器中,则在将h初始化成该值之后可以开始该操作。例如,可以以下面的方式设置初始值。可以基于诸如麦克风7a和7b周围的尺寸和结构的材料等的设计值而一定程度地估计滤波器系数。因此,可以将根据设计值所获得的滤波器系数设置为初始值。可选地,可以将关断音频记录器的电源时的滤波器系数存储在存储器中,并且将其设置为下一次启动音频记录器时的初始值。另外,可以通过在音频记录器的生产过程中生成预定基准声音来计算滤波器系数,将其存储在存储器中,并且使用其作为启动音频记录器时的初始值。
接着说明ALC 61的操作。设置ALC以在抑制音频信号的饱和的同时有效利用动态范围。由于音频信号表现出基于时间的大的能量变化,所以需要适当控制电平。设置在ALC 61中的电平控制器63监视来自可变增益62a和62b的输出。
首先将说明起始操作。在判断为较高电平的信号超过了预定电平时,将增益降低预定步长。以预定周期重复该操作。将该操作称为起始操作。该起始操作使得能够防止饱和。
接着将说明恢复操作。如果在预定时间内较高电平的信号没有超过预定电平,则将增益增大预定步长。以预定周期重复该操作。将该操作称为恢复操作。恢复操作使得能够获得安静环境下的声音。
ALC 61中的可变增益62a和62b同步工作。因此,当通过起始操作减小可变增益62a的增益时,也将可变增益62b的增益减小同样的量。利用该操作,消除信号通道之间的电平差,并且在混合器71混合通道的信号时,降低了不协调感觉。
接着说明风检测器81。假定w1是第一麦克风7a所拾取的风噪声,并且w2是第二麦克风7b所拾取的风噪声。由于风噪声的能量集中于低频范围,所以BPF 82a和82b不遮蔽风噪声,如以上参考图3A~3F所述。因此,获得表示第一麦克风7a的输出信号和第二麦克风7b的输出信号之间的电平差的(w1-w2),作为减法器83的输出。注意,假定上述混响的影响是可忽略的。同样,在实际环境下,由于比风噪声小很多,所以混响的影响是可忽略的。
电平检测器86进行减法器83的输出的绝对值计算,然后适当进行LPF处理。基于风检测器的稳定性和检测速度确定LPF的截止频率,并且约0.5Hz就足够了。LPF工作以对遮蔽范围中的信号进行积分,并且使通带中的信号直接通过。结果,可以获得与积分运算+HPF的效果相同的效果。为此,当绝对值计算保持高电平持续预定时间(该时间根据上述截止频率而改变)时,输出变大。也就是说,这等于在适当时间内监视∑|w1-w2|。
图6A~6D示出根据风强度而变化的风检测器81的输出信号的例子。图6A、6B和6C是示出通过第一麦克风7a和第二麦克风7b所获得的信号的图。横坐标表示时间,并且纵坐标表示信号电平。参考图6A、6B和6C,信号电平+1表示正方向上的信号饱和时的电平。图6A示出无风状态下的信号,图6B示出风弱时的信号,并且图6C示出风强时的信号。显而易见,随着风强度增大,第一麦克风7a的信号电平升高,并且生成风噪声。另一方面,可以看出,与第一麦克风7a的信号电平相比,第二麦克风7b的信号电平没有那么显著增大。这表示通过音频抵抗器41的作用降低了风噪声。
图6D示出通过上述风检测器81的处理所获得的结果。在图6D中,如图6A、6B和6C一样,横坐标表示时间,并且纵坐标表示风检测器的输出。注意,BPF 82a和82b的通带为30Hz~1kHz,并且电平检测器86中的LPF的截止频率为0.5Hz。显然,风检测器81的输出在无风状态下几乎保持为0,并且随着风变强其值增大。在图6D中,由于升高因电平检测器86中的LPF的影响而延迟,所以0秒附近的信号小。在检测到风之前,在图6D的信号的前沿发生所示的延迟。当使得该延迟小时,风检测器容易受到风的波动的影响。在本实施例中,在具有如图6D所示的延迟的情况下进行风检测。
对于上述混响抑制器53的开关87,使用风检测器81的输出,并且还使用该输出来切换后述的HPF 52和切换混合器71中的混合处理。
接着将参考图7A~7D说明混合器71的操作。已参考图1说明了基于风检测器81的输出而改变可变增益74和HPF 73的截止频率。将参考图7A~7D详细说明改变方法。
图7A和7C示出混合器71的结构的例子。图7B和7D是分别示出用于改变图7A和7C中的可变部的方法的图。
将说明图7A所示的结构。图7A所示的混合器71具有与图1的相同的结构。参考图7A,HPF 73的截止频率(第一截止频率)是可变的,而将LPF 72的截止频率(第二截止频率)固定成例如1kHz。图7B的上图示意性表示可变增益74的增益,并且下图示意性表示HPF 73的截止频率。图7B的横坐标是这两个图共用的。Wn1、Wn2和Wn3是表示风噪声的水平的阈值,并且表示风噪声按Wn1、Wn2和Wn3的顺序依次变强。
如图7B所示,当风噪声小于第一阈值Wn1时,风处理是不必要的。因此,将可变增益74的增益设置成第一下限值(例如,0),并且将HPF 73的截止频率设置成第二下限值(例如,50Hz)。结果,经由图7A所示的电路完全遮蔽来自第二麦克风7b的信号,并且可以仅从第一麦克风7a获得可听范围(其中,高于HPF73的截止频率、即50Hz的频率是声音的主要成分)的信号。由于无需使用设置有音频抵抗器41的第二麦克风7b的信号,所以假定忠实地获得被摄体声音。
将说明风噪声水平落在从第一阈值Wn1(包含)到第二阈值Wn2(不包含)的范围内的情况。在该范围内,随着风噪声水平增大,可变增益74增大,并且HPF 73的截止频率升高。进行上述控制以在低频音频信号中逐渐增大来自设置有音频抵抗器41的第二麦克风7b的信号的比。风噪声大大地影响来自第一麦克风7a的信号。然而,通过升高HPF 73的截止频率降低风噪声。
将说明风噪声水平落在从第二阈值Wn2(包含)到第三阈值Wn3(不包含)的范围内的情况。此时,将可变增益74的值固定成预定上限值(例如,1),并且随着风噪声水平增大,HPF 73的截止频率升高。尽管丢失了存在于从LPF 72的截止频率到HPF 73的截止频率的音频,但是进行上述控制以允许进一步降低风噪声。由于如果HPF 73的截止频率过分升高,则被摄体声音劣化太严重,所以HPF 73的截止频率不会升高超过适当值。在图7B的例子中,当风噪声水平等于或高于第三阈值Wn3时,将HPF 73的截止频率固定成2kHz,并且不会再改变。
将说明作为另一例子的图7C所示的结构。代替固定LPF 72和可变增益74,图7C所示的混合器71包括可变LPF 76。图7D的上图示意性表示可变LPF 76的截止频率,并且下图示意性表示HPF 73的截止频率。图7D的横坐标是这两个图共用的。Wn1、Wn2和Wn3是表示风噪声的水平的阈值,并且表示风噪声按Wn1、Wn2和Wn3的顺序依次变强。
如图7D所示,当风噪声水平小于第一阈值Wn1时,风处理是不必要的。因此,将可变LPF 76和HPF 73的截止频率设置成50Hz。结果,经由图7C所示的电路几乎完全遮蔽来自第二麦克风7b的信号,并且可以仅从第一麦克风7a获得可听范围(其中,高于HPF 73的截止频率、即50Hz的频率是声音的主要成分)中的信号。由于无需使用设置有音频抵抗器41的第二麦克风7b的信号,所以假定忠实地获得被摄体声音。
将说明风噪声水平落在从第一阈值Wn1(包含)到第二阈值Wn2(不包含)的范围内的情况。在该范围内,随着风噪声水平增大,可变LPF 76和HPF 73的截止频率在例如保持一致的同时升高。进行上述控制以逐渐使用来自设置有音频抵抗器41的第二麦克风7b的信号作为低频音频信号。风噪声大大地影响来自第一麦克风7a的信号。然而,通过升高HPF 73的截止频率降低风噪声。
将说明风噪声水平落在从第二阈值Wn2(包含)到第三阈值Wn3(不包含)的范围内的情况。此时,将可变LPF 76的截止频率固定成预定值(例如,1kHz),而随着风噪声水平增大,HPF 73的截止频率升高。尽管丢失了存在于从可变LPF 76的截止频率到HPF 73的截止频率的音频,但是进行上述控制以进一步降低风噪声。由于如果HPF 73的截止频率过分升高,则被摄体声音劣化太严重,所以HPF 73的截止频率不会升高超过适当值。在图7D例子中,当风噪声水平等于或高于第三阈值Wn3时,将HPF73的截止频率固定成2kHz,并且不会再改变。
以上说明了在比可变增益74和可变LPF 76的操作的范围更宽的范围中操作HPF 73的例子。显然,通过设置Wn2=Wn3,可以仅在与可变增益74和可变LPF 76的操作的范围相同的范围中操作HPF 73。当限制该操作时,尽管风噪声降低效果变小,但是可以忠实地获取被摄体声音。另一方面,在风吹得非常大时在第一麦克风7a中所生成的风噪声的水平根据麦克风的安装结构等而改变。通过比较例如风噪声降低的必要性和忠实获取被摄体声音的必要性,调整Wn1、Wn2和Wn3的设置。
以上详细说明了在图7A~7D所示的混合器71的例子中改变可变HPF或LPF的截止频率的范围。将简要说明截止频率可改变范围和滤波器结构的例子。
本实施例的混合器71混合通过多个麦克风7a和7b所获取的音频。在用于对分开的频带的信号进行混合的处理中,特别地,这多个麦克风的信号优选在重叠频带中在各自的路径上具有相同相位。如果相位由于多个路径中的处理而偏移,则由于波形没有精确匹配,所以可能相互抵消。为充分满足该要求,优选由相同阶数的FIR滤波器形成HPF 73和LPF 72。使用FIR滤波器,使得即使在适当地获得所谓的群延迟、并且对各频带进行处理时也能够始终如一地混合信号。如果FIR滤波器的截止频率非常低(准确地说,如果在利用相对于采样频率的比进行标准化时,该比非常低),则需要非常高阶数的滤波器以获得充分的滤波器性能。这基于下面的事实:为了获得遮蔽/通过对象的频率的波,需要大量样本。由于滤波器的阶数不能无限增大,因而确定截止频率可改变范围的下限。在图7C所示的结构中,LPF和HPF是可变的。因此,如果截止频率非常低,则可变LPF 76和HPF 73的阶数变得非常高。为此,在图7A~7D所示的例子中,将频率的下限设置成50Hz,以使得不会大地影响可听范围中的信号。如上所述,频率不局限于50Hz,并且可以根据计算资源进行适当设置。在图7A所示的例子中,仅HPF是可变的。因此,仅一个如上所述的高阶数的滤波器就足够了。该结构在减少计算量方面优于图7C的结构。
另一方面,根据设置有音频抵抗器41的第二麦克风7b确定可改变范围的上限。如图3B示意性所示,由于音频抵抗器41的影响,将第二麦克风7b可获取的被摄体的频带限制在f0。超过该频带,不会获得被摄体声音。因此,在图7A~7D所示的例子中,应该将可变LPF 76和HPF 73的截止频率设置得更低。在图3A~3F中,该频率为f1,并且显然应该满足f1<f0。
将参考图1、3A~3F、6A~6D、8A~8D至11A和11B说明HPF 52的效果和可变操作。如以上参考图3A~3F和6A~6D所述,风噪声集中于低频范围,并且以显著不同的方式影响第一麦克风7a和第二麦克风7b。因此,即使弱风在第一麦克风7a中也生成大的风噪声。由此引起的问题是ADC 54a的饱和以及ALC 61的不适当操作。ADC 54a的饱和容易理解,并且省略对其的说明。将说明风噪声生成时的ALC 61的操作的问题。
如果不存在HPF 52,则在第一麦克风7a中生成大的风噪声,如图6A~6D所示。即使风噪声和被摄体声音叠加,也假定风噪声占主导。在这类环境下,ALC 61通过参考第一麦克风7a的风噪声水平进行电平控制。然后,当混合器71中的HPF 73处理风噪声时,音频信号的电平大大降低。结果,加法器75的输出非常小。因此,信号电平是不适当的。
为解决诸如ADC的饱和以及不适当信号电平等的上述问题,例如,可以采用专利文献1的技术。然而,根据相关技术,由于在两个部处进行ALC操作,所以电路规模变大,并且量化误差也可能增大。
考虑作为用于抑制风噪声的第二高通滤波器的图1所示的HPF 52。当适当设置HPF 52的截止频率(第三截止频率)时,可以消除风噪声的主成分。这使得能够防止ADC 54a的饱和,并且允许ALC 61适当控制增益(由于在ALC 61的时点,被摄体声音未埋没在风噪声中,因而可以进行根据被摄体声音的水平的ALC操作)。
将参考图8A~8D说明HPF 52的截止频率控制序列的例子。图8A示出开关87的操作序列。图8B示出HPF 52的操作序列。图8C示出可变增益74的操作序列。图8D示出作为用于仅使ALC61的输出信号的高频成分通过的第一高频滤波器的HPF 73的操作序列。表示风噪声的水平的横坐标对图8A~8D是共用的。Wn1、Wn2和Wn3是表示风噪声的水平的阈值,并且表示风噪声按Wn1、Wn2和Wn3的顺序依次变强。图8C和8D中的操作与图7B中的相同,并且不再重复对其的说明。
当风噪声水平小于第一阈值Wn1时,风处理是不必要的。因此,接通开关87,并且进行上述混响抑制器53的自适应操作。将HPF 52的截止频率设置成0Hz(=在不进行HPF操作的情况下通过)。由于无需使用设置有音频抵抗器41的第二麦克风7b的信号,所以假定忠实地获得被摄体声音。
当风噪声水平等于或高于第一阈值Wn1时,生成风噪声。因此,关断开关87,并且停止上述混响抑制器53的自适应操作。该控制允许抑制不适当的自适应操作。
将说明风噪声水平落在从第一阈值Wn1(包含)到第二阈值Wn2(不包含)的范围内的情况。此时,随着风噪声水平增大,HPF 52的截止频率在低于HPF 73的截止频率的值处逐步升高。进行上述控制使得能够降低在第一麦克风7a中所生成的风噪声。当进行该控制以不会超过HPF 73的截止频率时,HPF 52的截止频率对HPF 73的输出影响不大。
将说明通过该结构所获得的效果。HPF 52被设置在音频处理设备51的模拟部(ADC之前),因此通常由IIR滤波器(由RC电路所形成的HPF)形成。此时,HPF 52不能满足群延迟特性。另一方面,即使在IIR滤波器中,相位延迟在通带中也小。为此,即使不满足群延迟特性,相位延迟也没有影响。如上所述控制HPF 52和73的截止频率,使得可以降低由IIR滤波器所引起的相位延迟的影响。如上所述,在用于对分开的频带的信号进行混合的处理中,特别地,这多个麦克风的信号优选在重叠的频带中在各自的路径上具有相同的相位。然而,即使不满足该条件,也可以降低影响。另外,将HPF 52设置在音频处理设备51的模拟部中。然而,如果将HPF 52配置成在模拟电路中连续改变截止频率,则电路规模变大。当形成适于参考图8A~8D所述的控制序列的电路时,可以通过简单的结构实现HPF。
图9和10示出通过上述电路处理后的信号的例子。图9示出没有设置HPF 52的情况。图10示出设置了HPF 52的情况。在从图1的结构去除HPF 52的状态下,处理图9中的信号。如图所示,从上侧开始,该图依次分别表示增益62a的输出、增益62b的输出、HPF 73的输出、LPF 72的输出和加法器75的输出。横坐标表示时间,并且是所有图共用的。图9和10所示的例子表示被摄体在2.5秒附近开始说话(人语音是要收集的声音)。假定风噪声水平为图8A~8D中的Wn2,处理图9和10所示的信号。
在2.5秒之前仅存在风噪声,如图6A~6D的图所示。仅注意这一部分,图10与图9相比,增益62a的输出显然更大。这是因为,实际上通过ALC 61增大了增益。根据2.5秒之后的部分,显然该输出被叠加在被摄体声音上。
注意2.5秒之后的增益62b的输出,与图10中的信号的信号电平相比,图9中的信号显然具有较低的信号电平。这是因为,增益由于ALC 61对在第一麦克风7a中所生成的风噪声所进行的电平控制而变小,因此获得非常小的被摄体声音。另一方面,在图10所示的信号中,通过HPF 52的效果降低了第一麦克风7a中所生成的风噪声,并且与图9的状态相比,ALC 61的增益保持高。
注意图9中的HPF 73的输出,通过适当处理HPF 73的截止频率而大大降低了风噪声。然而,通过观察可知,由于HPF 73的输出的信号电平比增益62a的输出的信号电平低很多,所以从加法器75的最终输出的信号电平非常低。
另一方面,即使在图10中,显然,通过适当处理HPF 73的截止频率大大降低了风噪声。另外,通过观察可知,由于LPF 72的输出保持大,所以从加法器75的最终输出的信号电平也保持在充分的电平。
如上所述,当将HPF 52配置在比ADC和ALC更靠近麦克风的一侧时,可以获得高质量的音频。
图11A和11B示出本实施例的电路结构的另一例子。图11A示出将ALC配置在模拟部分中的例子。图11B示出将ALC 61配置在混合器71之后的例子。即使这样的结构也使得能够获得本实施例中所述的效果。
如上所述,根据本实施例,可以通过利用简单电路结构抑制风噪声来获得高质量音频。
第二实施例
下面将参考图12和13说明根据本发明第二实施例的音频记录器和包括该音频记录器的摄像装置。在第二实施例中,与第一实施例中相同的附图标记表示进行相同操作的部。
图12是示出摄像装置的立体图。尽管图12中的设备与图2A中的类似,但是添加了用于麦克风的开口部32c。将麦克风7c(未示出)设置在开口部32c后面。
图13是用于说明与图12所示的设备相对应的音频处理设备51的主要部分的框图。在图13中,基于图11A所示的根据第一实施例在模拟部分中包括ALC的电路,将该结构扩展成立体声系统。简化/改变混响抑制器53和电平检测器86的说明。不同于第一实施例,将第一麦克风7a扩展成两个麦克风。麦克风7a和7c分别构成立体声系统的左声道和右声道,并且被设计成具有相同特性。另一方面,第二麦克风7b设置有音频抵抗器41,并且具有与第一实施例中的相同的特性。
图13中扩展的HPF 52b、增益62c、ADC 54c、DC成分截止HPF 56c和HPF 73b分别进行与第一实施例中所述的HPF 52、增益62a、ADC 54a、DC成分截止HPF 56a和HPF 73的相同操作。这里将说明操作改变了的延迟装置55a和55b、新设置的相位比较器57、加法器58和增益59。
在立体声音频记录器中,信号利用音频信号之间的相位差产生立体声效果。在图12所示的结构中,将第二麦克风7b配置在第一麦克风7a和7c之间。在该结构中,当考虑麦克风7a和7c之间的相位差时,第二麦克风7b的信号的相位存在于它们之间。例如,当将第二麦克风7b恰好配置在与麦克风7a和7c等距离的中间点时,该相位也存在于该中间点。在图13所示的电路中,计算麦克风7a和7c之间的相位差,并且通过延迟装置55a和55b给出与其相对应的延迟。
例如,检查麦克风7c的信号相对于麦克风7a的信号延迟的情况。此时,控制混响抑制器以符合中间信号,如后面所述。当与麦克风7a的信号混合时,使相位提前。当与麦克风7c的信号混合时,使相位延迟以混合信号。在第一实施例中,给出混响抑制器53的滤波器阶数的1/2(=M/2)的延迟。延迟装置55a给出较小延迟,并且延迟装置55b给出较大延迟。绝对值根据麦克风的位置而改变。例如,当第二麦克风7b位于第一麦克风7a和7c之间的中间点时,如上所述,各相位偏移由相位比较器57所计算出的相位差的1/2。进行上述处理,允许在不会降低立体声效果的情况下获得音频信号。
将说明加法器58和增益59。加法器58相加麦克风7a和7c的信号。增益59使加法器58的输出减少一半。结果,增益59的输出是麦克风7a和7c的平均数。这样所获得的音频信号具有麦克风7a和7c的信号之间的中间相位。另一方面,BPF 82a仅使约30Hz~1kHz的频带通过,如以上第一实施例所述。将音频处理设备51配置成获取甚至比BPF的通带还高的频率的音频信号。对于此时可获取的音频信号,将麦克风7a和7c配置成在它们的信号之间不会发生相位反转。当仅在BPF 82a的通带中观察时,麦克风7a和7c的信号之间的相位差小。因此,可以认为差不多相加了BPF 82a的通带中的信号的电平。为此,当增益59使输出减小一半时,可以获得信号电平差不多等于第一麦克风7a和7c的信号电平且具有中间点处的相位的信号。在本实施例中,操作混响抑制器53以符合上述增益59的输出。
利用上述结构,本发明在不会降低立体声效果的情况下,同样容易地适用于立体声音频记录器。
在本实施例中,说明了立体声设备(包括用于获取高频范围的两个第一麦克风)。该结构可容易地被扩展成包括更多麦克风的音频记录器。
其它实施例
还可以利用读出并执行记录在存储器装置上的程序以进行上述实施例的功能的系统或设备的计算机(或者CPU或MPU等装置)和通过下面的方法实现本发明的各方面,其中,利用系统或设备的计算机通过例如读出并执行记录在存储器装置上的程序以进行上述实施例的功能来进行上述方法的各步骤。为此,例如,通过网络或者通过用作存储器装置的各种类型的记录介质(例如,计算机可读介质)将该程序提供给计算机。
尽管参考典型实施例说明了本发明,但是应该理解,本发明不局限于所公开的典型实施例。所附权利要求书的范围符合最宽的解释,以包含所有修改、等同结构和功能。

Claims (11)

1.一种音频处理设备,包括:
第一音频拾取部件;
第二音频拾取部件,其包括被设置成覆盖声音接收部的音频抵抗器,以使得在使外部音频通过的同时抑制外部风传入;
第一A/D转换部件,用于对从所述第一音频拾取部件的输出信号进行数字化;
第二A/D转换部件,用于对从所述第二音频拾取部件的输出信号进行数字化;
电平控制部件,用于控制所述第一A/D转换部件的输出信号的信号电平和所述第二A/D转换部件的输出信号的信号电平中的至少一个;
第一低频衰减部件,用于使所述第一A/D转换部件的输出信号中频率低于第一截止频率的信号衰减;
高频衰减部件,用于使所述第二A/D转换部件的输出信号中频率高于第二截止频率的信号衰减;
加法部件,用于将所述第一低频衰减部件的输出信号和所述高频衰减部件的输出信号相加,以输出降低了风噪声的音频;以及
第二低频衰减部件,其被设置在所述第一音频拾取部件和所述第一A/D转换部件之间,并用于使频率低于第三截止频率的信号衰减,从而抑制风噪声。
2.根据权利要求1所述的音频处理设备,其特征在于,所述第三截止频率低于所述第一截止频率。
3.根据权利要求1所述的音频处理设备,其特征在于,所述音频抵抗器抑制风噪声,并且用作针对除风噪声以外的音频的结构低通滤波器,以及所述第一截止频率低于所述结构低通滤波器的截止频率。
4.根据权利要求1所述的音频处理设备,其特征在于,
所述第一低频衰减部件能够改变所述第一截止频率,以及
所述音频处理设备还包括:
检测部件,用于基于所述第一音频拾取部件的输出信号和所述第二音频拾取部件的输出信号之间的电平差来检测风噪声水平;
放大部件,其被设置在所述高频衰减部件和所述加法部件之间,并用于放大所述高频衰减部件的输出信号;以及
控制部件,用于基于所述检测部件所检测到的风噪声水平,控制所述第一低频衰减部件的所述第一截止频率和所述放大部件的放大因数。
5.根据权利要求1所述的音频处理设备,其特征在于,
所述第一低频衰减部件能够改变所述第一截止频率,所述高频衰减部件能够改变所述第二截止频率,以及
所述音频处理设备还包括:
检测部件,用于基于所述第一音频拾取部件的输出信号和所述第二音频拾取部件的输出信号之间的电平差来检测风噪声水平;以及
控制部件,用于基于所述检测部件所检测到的风噪声水平,控制所述第一低频衰减部件的所述第一截止频率和所述高频衰减部件的所述第二截止频率。
6.根据权利要求4所述的音频处理设备,其特征在于,当所述检测部件所检测到的风噪声水平落在预定范围内时,随着所述风噪声水平增大,所述控制部件增大所述放大因数,并且增大所述第一低频衰减部件的所述第一截止频率。
7.根据权利要求5所述的音频处理设备,其特征在于,当所述检测部件所检测到的风噪声水平落在预定范围内时,随着所述风噪声水平增大,所述控制部件增大所述第一低频衰减部件的所述第一截止频率和所述高频衰减部件的所述第二截止频率。
8.根据权利要求6所述的音频处理设备,其特征在于,
所述第二低频衰减部件能够改变所述第三截止频率,以及
当所述检测部件所检测到的风噪声水平落在所述预定范围内时,随着所述风噪声水平增大,所述控制部件还在低于所述第一低频衰减部件的所述第一截止频率的值处,逐步增大所述第二低频衰减部件的所述第三截止频率。
9.根据权利要求7所述的音频处理设备,其特征在于,
所述第二低频衰减部件能够改变所述第三截止频率,以及
当所述检测部件所检测到的风噪声水平落在所述预定范围内时,随着所述风噪声水平增大,所述控制部件还在低于所述第一低频衰减部件的所述第一截止频率的值处,逐步增大所述第二低频衰减部件的所述第三截止频率。
10.根据权利要求1~8中任一项所述的音频处理设备,其特征在于,还包括混响抑制部件,所述混响抑制部件用于估计和学习滤波器系数以使所述第一音频拾取部件的输出信号和所述第二音频拾取部件的输出信号之间的差最小化,从而抑制所述第二音频拾取部件的输出信号中所包含的、在所述音频抵抗器和所述第二音频拾取部件之间的封闭空间中所生成的混响成分。
11.一种音频处理设备的控制方法,所述音频处理设备包括:
第一音频拾取部件;
第二音频拾取部件,其包括被设置成覆盖声音接收部的音频抵抗器,以使得在使外部音频通过的同时抑制外部风传入;
第一A/D转换部件,用于对从所述第一音频拾取部件的输出信号进行数字化;
第二A/D转换部件,用于对从所述第二音频拾取部件的输出信号进行数字化;
电平控制部件,用于控制所述第一A/D转换部件的输出信号的信号电平和所述第二A/D转换部件的输出信号的信号电平中的至少一个;
第一低频衰减部件,用于使所述第一A/D转换部件的输出信号中频率低于第一截止频率的信号衰减;
高频衰减部件,用于使所述第二A/D转换部件的输出信号中频率高于第二截止频率的信号衰减;
加法部件,用于将所述第一低频衰减部件的输出信号和所述高频衰减部件的输出信号相加,以输出降低了风噪声的音频;以及
第二低频衰减部件,其被设置在所述第一音频拾取部件和所述第一A/D转换部件之间,并用于使频率低于第三截止频率的信号衰减,从而抑制风噪声,
所述控制方法包括以下步骤:
控制所述第一A/D转换部件的输出信号的信号电平和所述第二A/D转换部件的输出信号的信号电平中的至少一个;以及
混合如下两个成分:信号电平被控制了的所述第一A/D转换部件的输出信号中频率高于所述第一截止频率的高频成分;以及信号电平被控制了的所述第二A/D转换部件的输出信号中频率低于所述第二截止频率的低频成分。
CN201210030365XA 2011-02-10 2012-02-10 音频处理设备及其控制方法 Pending CN102637437A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011027843A JP5926490B2 (ja) 2011-02-10 2011-02-10 音声処理装置
JP2011-027843 2011-02-10

Publications (1)

Publication Number Publication Date
CN102637437A true CN102637437A (zh) 2012-08-15

Family

ID=46621806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210030365XA Pending CN102637437A (zh) 2011-02-10 2012-02-10 音频处理设备及其控制方法

Country Status (3)

Country Link
US (1) US8995681B2 (zh)
JP (1) JP5926490B2 (zh)
CN (1) CN102637437A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103856868A (zh) * 2012-11-30 2014-06-11 Gn瑞声达A/S 具有模拟滤波的听力装置和关联的方法
CN105745942A (zh) * 2013-11-26 2016-07-06 高通股份有限公司 用于提供宽带频率响应的系统和方法
CN107924686A (zh) * 2015-09-16 2018-04-17 株式会社东芝 语音处理装置、语音处理方法以及语音处理程序
CN109257675A (zh) * 2018-10-19 2019-01-22 歌尔科技有限公司 一种防风噪方法、耳机及存储介质
CN109712637A (zh) * 2018-12-21 2019-05-03 珠海慧联科技有限公司 一种混响抑制系统及方法
CN113038341A (zh) * 2016-07-22 2021-06-25 美商楼氏电子有限公司 电容式传感器组件及其操作方法、集成电路
CN113196733A (zh) * 2018-12-22 2021-07-30 美高森美半导体(美国)股份有限公司 使用低频近端语音检测的声学回声消除

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8798992B2 (en) * 2010-05-19 2014-08-05 Disney Enterprises, Inc. Audio noise modification for event broadcasting
DK2739069T3 (en) * 2012-11-30 2018-03-05 Gn Hearing As Hearing aid with analog filtration and associated method
US9516418B2 (en) 2013-01-29 2016-12-06 2236008 Ontario Inc. Sound field spatial stabilizer
US9148725B2 (en) * 2013-02-19 2015-09-29 Blackberry Limited Methods and apparatus for improving audio quality using an acoustic leak compensation system in a mobile device
US9271100B2 (en) 2013-06-20 2016-02-23 2236008 Ontario Inc. Sound field spatial stabilizer with spectral coherence compensation
US9099973B2 (en) * 2013-06-20 2015-08-04 2236008 Ontario Inc. Sound field spatial stabilizer with structured noise compensation
US9106196B2 (en) * 2013-06-20 2015-08-11 2236008 Ontario Inc. Sound field spatial stabilizer with echo spectral coherence compensation
US9831843B1 (en) 2013-09-05 2017-11-28 Cirrus Logic, Inc. Opportunistic playback state changes for audio devices
US9391576B1 (en) 2013-09-05 2016-07-12 Cirrus Logic, Inc. Enhancement of dynamic range of audio signal path
JP2015130547A (ja) * 2014-01-06 2015-07-16 パナソニックIpマネジメント株式会社 記録装置
FR3017708B1 (fr) * 2014-02-18 2016-03-11 Airbus Operations Sas Dispositif de mesure acoustique dans un ecoulement d'air
US9774342B1 (en) 2014-03-05 2017-09-26 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system
US9525940B1 (en) 2014-03-05 2016-12-20 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system
US9306588B2 (en) 2014-04-14 2016-04-05 Cirrus Logic, Inc. Switchable secondary playback path
US10785568B2 (en) 2014-06-26 2020-09-22 Cirrus Logic, Inc. Reducing audio artifacts in a system for enhancing dynamic range of audio signal path
US9684292B1 (en) * 2014-09-05 2017-06-20 Textron Innovations Inc. Conditional switch rate low pass filter
US9596537B2 (en) 2014-09-11 2017-03-14 Cirrus Logic, Inc. Systems and methods for reduction of audio artifacts in an audio system with dynamic range enhancement
US9503027B2 (en) 2014-10-27 2016-11-22 Cirrus Logic, Inc. Systems and methods for dynamic range enhancement using an open-loop modulator in parallel with a closed-loop modulator
US9584911B2 (en) 2015-03-27 2017-02-28 Cirrus Logic, Inc. Multichip dynamic range enhancement (DRE) audio processing methods and apparatuses
US9762992B2 (en) * 2015-05-08 2017-09-12 Kabushiki Kaisha Audio-Technica Condenser microphone unit, condenser microphone, and method of manufacturing condenser microphone unit
US9959856B2 (en) 2015-06-15 2018-05-01 Cirrus Logic, Inc. Systems and methods for reducing artifacts and improving performance of a multi-path analog-to-digital converter
US9613628B2 (en) 2015-07-01 2017-04-04 Gopro, Inc. Audio decoder for wind and microphone noise reduction in a microphone array system
US9460727B1 (en) * 2015-07-01 2016-10-04 Gopro, Inc. Audio encoder for wind and microphone noise reduction in a microphone array system
US9721581B2 (en) 2015-08-25 2017-08-01 Blackberry Limited Method and device for mitigating wind noise in a speech signal generated at a microphone of the device
US9955254B2 (en) 2015-11-25 2018-04-24 Cirrus Logic, Inc. Systems and methods for preventing distortion due to supply-based modulation index changes in an audio playback system
US9543975B1 (en) * 2015-12-29 2017-01-10 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system with low-pass filter between paths
US9880802B2 (en) 2016-01-21 2018-01-30 Cirrus Logic, Inc. Systems and methods for reducing audio artifacts from switching between paths of a multi-path signal processing system
US9838737B2 (en) * 2016-05-05 2017-12-05 Google Inc. Filtering wind noises in video content
US9998826B2 (en) 2016-06-28 2018-06-12 Cirrus Logic, Inc. Optimization of performance and power in audio system
US10545561B2 (en) 2016-08-10 2020-01-28 Cirrus Logic, Inc. Multi-path digitation based on input signal fidelity and output requirements
US10263630B2 (en) 2016-08-11 2019-04-16 Cirrus Logic, Inc. Multi-path analog front end with adaptive path
US9813814B1 (en) 2016-08-23 2017-11-07 Cirrus Logic, Inc. Enhancing dynamic range based on spectral content of signal
US9780800B1 (en) 2016-09-19 2017-10-03 Cirrus Logic, Inc. Matching paths in a multiple path analog-to-digital converter
US9762255B1 (en) 2016-09-19 2017-09-12 Cirrus Logic, Inc. Reconfiguring paths in a multiple path analog-to-digital converter
US9929703B1 (en) 2016-09-27 2018-03-27 Cirrus Logic, Inc. Amplifier with configurable final output stage
US9967665B2 (en) 2016-10-05 2018-05-08 Cirrus Logic, Inc. Adaptation of dynamic range enhancement based on noise floor of signal
US10321230B2 (en) 2017-04-07 2019-06-11 Cirrus Logic, Inc. Switching in an audio system with multiple playback paths
US10008992B1 (en) 2017-04-14 2018-06-26 Cirrus Logic, Inc. Switching in amplifier with configurable final output stage
US9917557B1 (en) 2017-04-17 2018-03-13 Cirrus Logic, Inc. Calibration for amplifier with configurable final output stage
JP6929137B2 (ja) * 2017-06-05 2021-09-01 キヤノン株式会社 音声処理装置及びその制御方法
JP6886352B2 (ja) * 2017-06-05 2021-06-16 キヤノン株式会社 音声処理装置及びその制御方法
US10595126B1 (en) 2018-12-07 2020-03-17 Cirrus Logic, Inc. Methods, systems and apparatus for improved feedback control
TWI763232B (zh) * 2021-01-04 2022-05-01 瑞昱半導體股份有限公司 消除未穩態雜訊之方法及其裝置
EP4198976B1 (en) * 2021-12-17 2023-10-25 GN Audio A/S Wind noise suppression system

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1877517A (zh) * 2005-04-19 2006-12-13 三星电子株式会社 用于减少风噪声的音频数据处理装置和方法
CN1933677A (zh) * 2005-09-12 2007-03-21 索尼株式会社 噪音减小装置、方法以及用于电子设备的拾音器装置
JP2008129107A (ja) * 2006-11-17 2008-06-05 Sanyo Electric Co Ltd オートゲインコントロール装置、音声記録装置、映像・音声記録装置および通話装置
US20080219470A1 (en) * 2007-03-08 2008-09-11 Sony Corporation Signal processing apparatus, signal processing method, and program recording medium
CN101356849A (zh) * 2006-07-04 2009-01-28 日本胜利株式会社 麦克风装置
JP2009036831A (ja) * 2007-07-31 2009-02-19 Canon Inc 情報処理装置、情報処理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2791234B2 (ja) * 1991-07-08 1998-08-27 キヤノン株式会社 音声信号処理装置
JPH0965482A (ja) * 1995-08-25 1997-03-07 Canon Inc 集音方法及び該方法を実施するマイクロホン装置
JP3649847B2 (ja) * 1996-03-25 2005-05-18 日本電信電話株式会社 残響除去方法及び装置
JP3341811B2 (ja) * 1997-03-13 2002-11-05 日本電信電話株式会社 残響歪低減マイクロホン装置
US6420975B1 (en) * 1999-08-25 2002-07-16 Donnelly Corporation Interior rearview mirror sound processing system
EP1732352B1 (en) * 2005-04-29 2015-10-21 Nuance Communications, Inc. Detection and suppression of wind noise in microphone signals
US8321214B2 (en) * 2008-06-02 2012-11-27 Qualcomm Incorporated Systems, methods, and apparatus for multichannel signal amplitude balancing

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1877517A (zh) * 2005-04-19 2006-12-13 三星电子株式会社 用于减少风噪声的音频数据处理装置和方法
CN1933677A (zh) * 2005-09-12 2007-03-21 索尼株式会社 噪音减小装置、方法以及用于电子设备的拾音器装置
CN101356849A (zh) * 2006-07-04 2009-01-28 日本胜利株式会社 麦克风装置
JP2008129107A (ja) * 2006-11-17 2008-06-05 Sanyo Electric Co Ltd オートゲインコントロール装置、音声記録装置、映像・音声記録装置および通話装置
US20080219470A1 (en) * 2007-03-08 2008-09-11 Sony Corporation Signal processing apparatus, signal processing method, and program recording medium
JP2009036831A (ja) * 2007-07-31 2009-02-19 Canon Inc 情報処理装置、情報処理方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103856868B (zh) * 2012-11-30 2018-11-27 Gn瑞声达A/S 具有模拟滤波的听力装置和关联的方法
CN103856868A (zh) * 2012-11-30 2014-06-11 Gn瑞声达A/S 具有模拟滤波的听力装置和关联的方法
CN105745942A (zh) * 2013-11-26 2016-07-06 高通股份有限公司 用于提供宽带频率响应的系统和方法
CN107924686A (zh) * 2015-09-16 2018-04-17 株式会社东芝 语音处理装置、语音处理方法以及语音处理程序
CN107924686B (zh) * 2015-09-16 2022-07-26 株式会社东芝 语音处理装置、语音处理方法以及存储介质
CN113038341A (zh) * 2016-07-22 2021-06-25 美商楼氏电子有限公司 电容式传感器组件及其操作方法、集成电路
CN113038341B (zh) * 2016-07-22 2022-12-02 美商楼氏电子有限公司 电容式传感器组件及其操作方法、集成电路
CN109257675B (zh) * 2018-10-19 2019-12-10 歌尔科技有限公司 一种防风噪方法、耳机及存储介质
CN109257675A (zh) * 2018-10-19 2019-01-22 歌尔科技有限公司 一种防风噪方法、耳机及存储介质
CN109712637B (zh) * 2018-12-21 2020-09-22 珠海慧联科技有限公司 一种混响抑制系统及方法
CN109712637A (zh) * 2018-12-21 2019-05-03 珠海慧联科技有限公司 一种混响抑制系统及方法
CN113196733A (zh) * 2018-12-22 2021-07-30 美高森美半导体(美国)股份有限公司 使用低频近端语音检测的声学回声消除
CN113196733B (zh) * 2018-12-22 2023-08-04 美高森美半导体(美国)股份有限公司 使用低频近端语音检测的声学回声消除

Also Published As

Publication number Publication date
US20120207315A1 (en) 2012-08-16
JP5926490B2 (ja) 2016-05-25
US8995681B2 (en) 2015-03-31
JP2012169782A (ja) 2012-09-06

Similar Documents

Publication Publication Date Title
CN102637437A (zh) 音频处理设备及其控制方法
KR101999565B1 (ko) 파형을 이용한 사운드 대 햅틱 효과 변환 시스템
CN102947685B (zh) 用于减少环境噪声对收听者的影响的方法和装置
Välimäki et al. All about audio equalization: Solutions and frontiers
CN104040888B (zh) 多速率滤波器系统
KR102154877B1 (ko) 협대역폭 디지털 신호 처리 시스템 및 방법
CN103426433B (zh) 噪声消除方法
RU2658872C2 (ru) Модуль определения коэффициентов частотной корректирующей фильтрации, устройство, процессор коэффициентов частотной корректирующей фильтрации, система и способы
CN102568492B (zh) 音频处理设备、音频处理方法和摄像设备
CN104918177A (zh) 信号处理装置、信号处理方法和程序
CN106105259A (zh) 提供极高声学过载点的麦克风设备和方法
JP2008263498A (ja) 風雑音低減装置、音響信号録音装置及び撮像装置
CN104025619A (zh) 信号处理装置
JP5016581B2 (ja) エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラム、記録媒体
JP5998483B2 (ja) 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体
JP5267808B2 (ja) 音響出力システム及び音響出力方法
JP2005064968A (ja) 収音方法、その装置、そのプログラム、およびその記録媒体。
CN109151667B (zh) 一种信号处理方法、装置及扬声器
CN112151051B (zh) 音频数据的处理方法和装置及存储介质
CN114584902B (zh) 一种基于音量控制的对讲设备非线性回音消除方法及装置
CN206024079U (zh) 四进八出fir音箱处理器
CN110610714A (zh) 一种音频信号增强处理的方法和相关装置
JP4974713B2 (ja) カラオケ装置
JP2019016851A (ja) 音声処理装置、音声処理方法、及びプログラム
JP5036283B2 (ja) オートゲインコントロール装置、音響信号記録装置、映像・音響信号記録装置および通話装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120815