CN105393560B - 自动音色、响度以及均衡控制 - Google Patents
自动音色、响度以及均衡控制 Download PDFInfo
- Publication number
- CN105393560B CN105393560B CN201480041253.1A CN201480041253A CN105393560B CN 105393560 B CN105393560 B CN 105393560B CN 201480041253 A CN201480041253 A CN 201480041253A CN 105393560 B CN105393560 B CN 105393560B
- Authority
- CN
- China
- Prior art keywords
- signal
- room
- block
- gain
- electric signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000001228 spectrum Methods 0.000 claims abstract description 31
- 238000000605 extraction Methods 0.000 claims description 8
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 6
- 238000009499 grossing Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000008901 benefit Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 238000005303 weighing Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 claims 6
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 230000003044 adaptive effect Effects 0.000 description 11
- 230000008859 change Effects 0.000 description 7
- 230000006978 adaptation Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 238000002310 reflectometry Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 241000638935 Senecio crassissimus Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000013707 sensory perception of sound Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02163—Only one microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
还公开了一种用于自动控制收听房间中的声音信号的音色的系统和方法,所述系统和方法包括以下操作:从时域中的再变换电声音信号产生所述时域中的声音,其中所述时域中的电声音信号被变换成频域中的电声音信号,并且所述频域中的电声音信号再变换成所述再变换电声音信号;生成表示所述房间中的总声音的总声音信号,其中所述总声音包括来自扬声器的声音输出以及所述房间中的环境噪声;处理所述总声音信号以提取表示在所述房间中的所述环境噪声的估计环境噪声信号;以及根据所述估计环境噪声信号、所述电声音信号和房间相关增益信号,调节所述频域中的所述电声音信号的频谱增益。所述房间相关增益信号从参考房间数据和估计房间数据确定。
Description
技术领域
本公开涉及了一种用于处理信号、具体地是音频信号的系统和方法(一般称为“系统”)。
背景技术
收听者在房间中听到的声音是从声源笔直行进至收听者的耳朵的直接声音与间接反射声音(即,来自该声源的在其到达收听者的耳朵之前被墙壁、地板、天花板和房间中的物体回弹的声音)的组合。反射可为所需但不利的。这取决于它们的频率、级别、以及在声源所产生的直接声音后反射到达收听者的耳朵所花费的时间。反射声音可使音乐以及语音比它们原本饱满和响亮得多。反射声音还可以使原始声音增添令人愉悦的空灵感。然而,这些相同反射还可通过使得某些音符声音变得更响、同时抵消其他声音来使房间中的声音失真。反射还可在与来自声源的声音不同的时间到达收听者的耳朵,以使例如语音可识别度可以降低并且音乐无法被收听者感知。
反射受到房间的声学特性(即其“声波签名”)的严重影响。存在影响给定房间的“声波签名”的许多因素,最具影响的是房间大小、刚性、质量和反射率。房间尺寸(以及它们的比率)会对收听房间中的声音造成高度影响。房间高度、长度以及宽度确定空间以及在很大程度上声音感知最佳的地方的谐振频率。刚度和质量均在确定给定空间将如何对其内声音做出反应的方面具有重要作用。反射率简言之即为房间的外观“活跃度(liveness)”,也被称为混响时间,其为脉冲音调衰减至低于其原始强度的某些级别而花费的时间量。混响房间具有较为理想的反射率,并且因此具有较长混响时间。干燥房间具有极低的反射率,并且因此具有较短混响时间。如可看出,改变房间特性(例如,通过打开门或窗户,或者通过改变房间中的物体或人数量)可急剧地改变感知到的声音的声学的变化(例如,音品或音质)。
从心理声学的角度,音品和音质也称为“音色”,其为区分不同类型的发声(诸如话音以及乐器(弦乐器、管乐器、以及打击乐器))的音符、声音或音调的质量。声音的确定音色感知的物理特性包括频谱以及包络。简而言之,音色是使特定音乐声音不同于彼此的特性,即使是在这些音乐声音具有相同的音高和响度也是如此。例如,以相同响度来弹奏相同音符的吉他和钢琴之间存在差异。
具体来说,在小型房间(诸如车厢)内,房间签名变化对房间中生成且收听到的声音的音色的影响是显著的,并且常被收听者感知为恼人的。
发明内容
公开了一种用于自动控制收听房间中的声音信号的音色的系统。所述系统包括:时频变换区块,所述时频变换区块被配置来接收时域中的电声音信号并且生成频域中的电声音信号;频时变换区块,所述频时变换区块被配置来接收所述频域中的所述电声音信号并且生成所述时域中的再变换电声音信号;扬声器,所述扬声器被配置来从所述再变换电声音信号生成声音输出;麦克风,所述麦克风被配置来生成表示所述房间中的总声音的总声音信号,其中所述总声音包括来自所述扬声器的所述声音输出以及所述房间内的环境噪声;噪声提取区块,所述噪声提取区块被配置来从所述麦克风接收所述总声音信号并且从所述总声音信号提取表示所述房间中的所述环境噪声的估计环境噪声信号;以及均衡区块,所述均衡区块被配置来接收所述估计环境噪声信号以及所述频域中的所述电声音信号,并且被配置来根据所述估计环境噪声信号、所述电声音信号和房间相关增益信号调节所述频域中的所述电声音信号的频谱增益。所述房间相关增益信号从参考房间数据和估计房间数据确定。
还公开了一种用于自动控制收听房间中的声音信号的音色的方法。所述方法包括:从时域中的再变换电声音信号产生所述时域中的声音,其中所述时域中的电声音信号被变换成频域中的电声音信号,并且所述频域中的电声音信号再变换成所述再变换电声音信号;生成所述房间中的表示总声音的总声音信号,其中所述总声音包括来自扬声器的声音输出以及所述房间中的环境噪声;处理所述总声音信号以提取表示在所述房间中的所述环境噪声的估计环境噪声信号;以及根据所述估计环境噪声信号、所述电声音信号和房间相关增益信号,调节所述频域中的所述电声音信号的频谱增益。所述房间相关增益信号从参考房间数据和估计房间数据确定。
此外,还公开了一种用于自动控制收听房间中的声音信号的音色的系统。所述系统包括:扬声器,所述扬声器被配置来从电声音信号生成声学声音输出;麦克风,所述麦克风被配置来生成表示所述房间中的总声学声音的总电声音信号,其中所述总声学声音包括来自所述扬声器的声学声音输出以及所述房间内的环境噪声;实际响度评估区块,所述实际响度评估区块被配置来提供表示所述房间中的所述总声学声音的实际响度信号;所需响度评估区块,所述所需响度评估区块被配置来提供所需响度信号;以及增益成形区块,所述增益成形区块被配置来接收所述电声音信号、音量设置、所述实际响度信号、所述所需响度信号以及房间相关增益信号,所述房间相关增益信号从参考房间数据、估计房间数据、以及所述音量设置确定。所述增益成形区块还被配置来根据所述音量设置、所述实际响度信号、所述所需响度信号、以及所述房间相关增益信号调节所述电声音信号的增益。
此外,还公开了一种用于自动控制收听房间中的声音信号的音色的方法。所述方法包括:从电声音信号产生声音输出;生成表示所述房间中的总声音的总声音信号,其中所述总声音包括来自扬声器的所述声音输出以及所述房间中的环境噪声;评估所述总声音信号以提供实际响度;接收音量设置、所需响度、以及参考房间数据;提供从参考房间数据、估计房间数据、以及所述音量设置确定的房间相关增益;以及根据所述音量设置、所述实际响度信号、所需响度信号、以及所述房间相关增益,调节所述电声音信号的所述增益。
对于本领域的技术人员而言,在研究以下附图以及具体实施方式后,其他系统、方法、特征以及优点将会或将变得明显。意图是将所有此类另外系统、方法、特征以及优点包括在本说明书内、在本发明的范围内,并由随附权利要求书来保护。
附图说明
所述系统可以参考以下附图以及描述来更好地理解。附图中的部件不一定按比例绘制,相反,通常着重示出本发明的原理。此外,在附图中,相同参考数字标记所有不同视图中的对应部分。
图1是用于使用延迟系数方法来对未知房间脉冲响应(RIR)进行自适应估计的示例性系统的框图。
图2是采用动态均衡系统的示例性自动音色控制系统的框图。
图3是采用动态均衡系统以及自动响度控制系统的示例性自动音色控制系统的框图。
具体实施方式
在下文中,根据具体情况增益可为正(放大)或负(衰减)的。表达“频谱增益”在本文中用于频率相关增益(随频率的增益),而“增益”可根据具体情况为频率相关或频率不相关的。“房间相关增益”是受到所调查的房间的声学特性的影响的增益。“增益成形”或“均衡”意指(在频谱上)控制或改变信号的(频谱)增益。如本文所用的“响度”是主要为物理强度(振幅)的心理相关关系的声音特性。
许多已知声学控制系统呈现与估计(稳健)房间脉冲响应(RIR)、即对外部影响不敏感的RIR有关的问题,所述外部影响诸如背景噪声(关闭车门、风噪声等),这可使得信噪比(SNR)劣化。产生噪声扰乱适应过程;系统尝试适应噪声并且随后再次适应原始信号。这个过程花费一段时间,在这段时间中,系统并非是准确适应的。
用于使用如图1所示延迟系数方法对未知RIR进行自适应估计的示例性系统包括房间4(例如,可为车厢)中的扬声器房间麦克风(LRM)布置1、麦克风2、以及扬声器3。表示音频信号x(n)的所需声音是由扬声器3生成并且随后在房间4中并且根据该房间(其具有传递函数H(x))经由信号路径5而传递至麦克风2。另外,麦克风2接收不需要的声音信号b(n)(也被称为噪声),其由房间4外或内的噪声源6生成。为了简单起见,在假设声学信号至电信号的转换(反之亦然)为1:1的前提下,声学信号与电信号之间没有差异。
麦克风2得到的不需要的声音信号b(n)借助延迟元件7延迟一定延迟时间,所述延迟时间是由长度N(t)表示,其为可调节的。延迟元件7的输出信号被供应至减法器8,该减法器还从可控制滤波器9接收输出信号并且输出输出信号滤波器9可为具有滤波长度N的有限脉冲响应(FIR)滤波器,所述FIR滤波器提供信号Dist(n),所述信号Dist(n)表示系统距离且其传递函数(滤波器系数)可以利用滤波控制信号调节。所需信号源10所提供的所需信号x(n)还供应至滤波器9、提供信号均值X(n)的均值计算装置11以及提供滤波控制信号以控制滤波器9传递函数的自适应控件12。自适应控件12可以采用最小均方(LMS)算法(例如,归一化的最小均方(NLMS)算法)来从所需信号x(n)、输出信号以及表示来自适应步长计算器(μC)13的适应步长μ(n)的输出信号计算滤波器9的滤波器控制信号。适应步长计算器13从信号Dist(n)、信号均值X(n)、以及信号均值B(n)计算适应步长μ(n)。信号均值B(n)表示输出信号的均值并由被供应输出信号的均值计算区块14提供。
如图1的系统所用,时域中的NLMS算法可以在数学上如下描述:
y(n)=h(n)x(n)T,
其中
x(n)=[x(n),x(n-1),...,x(n-N+1)],
N=FIR滤波器的长度,
x(n)=时间点(样本)n上的具有长度N的输入信号,
y(n)=自适应(FIR)滤波器的输出信号的第n个样本,
μ(n)=时间点(样本)n上的自适应的适应步长,
||x||2=向量x的2次范数(2-part norm),
(x)T=向量x的移向。
为了确定以上等式中的自适应的适应步长μ(n),可以使用延迟系数方法,所述延迟系数方法可以在数学上如下描述:
μ(n)=Dist(n)SNR(n)
由此
其中
SNR(n)=时间点(样本)n上的估计SNR,
Nt=用作延迟系数方法的自适应(FIR)滤波器的滤波器系数的数量(Nt=[5,...,20]),
αx=用于输入信号x(n)的平滑系数(ax≈0.99),
如从以上等式可见,自适应的适应步长μ(n)可从估计当前SNR(n)与估计当前系统距离Dist(n)的乘积得出。具体来说,估计当前SNR(n)可计算为输入信号的平滑振幅与误差信号的平滑振幅的比率,输入信号表示SNR(n)中的“信号”,误差信号表示SNR(n)中的“噪声”。两个信号可容易从任何合适的自适应算法得出。图1的系统使用专用延迟系数方法估计当前系统距离Dist(n),其中预定延迟(Nt)被实施于麦克风信号路径中。延迟用于得出滤波器的预定部分的自适应质量的估计(例如,FIR滤波器的第一Nt系数)。第一Nt系数理想为零,因为自适应滤波器首先必须为由Nt乘以零而形成的Nt系数的延迟线建模。因此,FIR滤波器的第一Nt系数(其应理想为零)的平滑(均值)大小是系统距离Dist(n)的测量结果,即,估计RIR与实际RIR的结果方差。图1所示系统允许对RIR的准确估计,甚至是在存在暂时噪声的情况下也是如此。
自适应质量还可在收听者利用衰减/平衡控制时劣化,因为在此RIR再次改变。一种使得自适应对这类型的干扰更稳健的方式是为每个衰减/平衡设置保存相应RIR。然而,这种方法需要存储器的大量空间。将消耗较少存储器空间的方式是仅将各种RIR保存作为幅频特性。存储器空间进一步减少可以通过采用具有幅频特性的心理声学频标(诸如Bark、Mel或ERB频标)来实现。使用Bark频标,例如,仅仅需要每频率特性的24个平滑(平均)值表示RIR。另外,存储器消耗可借助以下方式来进一步降低:不存储音调改变而采用不同衰减/平衡设置、仅仅存储某些步骤、以及在两者间插值以便得到当前音调改变的近似值。
谱域中的动态均衡控制(DEC)系统中的图1的系统的实施方式在图2中示出,其中自适应滤波器(图1的系统中的9、12)还实施于谱域之中。存在不同方式用以在谱域中实施自适应滤波器,但是为了简单起见,仅仅描述频域自适应滤波器(FDAF)的重叠保留版本。
在图2的系统中,信号源15将所需信号(例如,来自CD播放器、收音机、卡带机等的音乐信号x[k])供应至增益成形区块,诸如频谱动态均衡控制(DEC)区块16,所述区块在频域中操作并向扬声器17提供均衡信号Out[k]。扬声器17生成声学信号,所述声学信号根据传递函数H(z)而传递至麦克风18。来自麦克风18的信号经由频谱话音抑制区块19以及心理声学增益成形区块20(两者在频域中操作)来供应至包括大量倍增器的倍增器区块25。
话音抑制区块19包括用于将信号从时域变换成频域的快速傅立叶变换(FFT)区块21。在后续均值计算区块22中,来自FFT区块21的频域中的信号求平均值并供应至用于使得来自均值计算区块22的均值信号的频谱分量平滑化的非线性平滑滤波器(NSF)区块23。来自NSF区块23的信号被供应至心理声学增益成形(PSG)区块20,以从频谱DEC区块16接收信号并向所述频谱DEC区块16传输信号。DEC区块16包括FFT区块24、倍增器区块25、逆快速傅立叶变换(IFFT)区块26、以及PSG区块20。FFT区块24接收信号x[k]并将其变换成频谱信号X(ω)。信号X(ω)被供应至PSG区块20以及还从PSG区块20接收表示频谱增益因数的信号G(ω)的倍增器区块25。倍增器25生成频谱信号Out(ω),所述频谱信号Out(ω)被馈送入IFFT区块26并变换以提供信号Out[k]。
频域中操作的自适应滤波器(诸如频域(重叠保留)自适应滤波器(FDAF)区块27)接收误差信号s[k]+n[k]的频谱版本,所述误差信号是麦克风信号d[k]与估计回声信号y[n]之间的差值;麦克风信号d[k]表示环境(例如,LRM系统)中的总声级,其中所述总声级由来自扬声器17的声音输出e[k](如由麦克风18接收到的)、环境噪声n[k]、以及(根据具体情况)脉冲状的扰动信号(诸如环境内的语音信号s[k])确定。信号X(ω)用作自适应滤波器27的参考信号。FDAF区块27的信号输出被传递至IFFT 28并变换成信号y[k]。减法器区块29计算信号y[k]与麦克风信号d[k]之间的差值,以便生成表示环境噪声n[k]和语音信号s[k]的估计总和信号n[k]+s[k]的信号,其可以被视为误差信号。总和信号n[k]+s[k]通过FFT区块21来变换成相应频域总和信号N(ω)+S(ω),随后,频域总和信号通过均值计算区块22而变换成均值频域总和信号随后,均值频域总和信号是由NSF区块23进行滤波,以便提供均值频谱噪声信号
图2的系统还包括房间相关增益成形(RGS)区块30,所述RGS区块30从FDAF区块27接收表示LRM系统的估计频率响应(RTF)的信号W(ω)并且接收由参考数据选择(RDE)区块31提供的参考RTF的参考信号Wref(ω),所述RDE区块31根据衰减/平衡(F/B)区块33所提供的给定衰减/平衡设置选择参考房间数据存储器(RDM)区块32中存储的大量参考RTF中的一个。RGS区块30将估计RTF与参考RTF进行比较,以便提供房间相关频谱增益信号Groom(ω),所述房间相关频谱增益信号与由音量设置区块34所提供的音量(VOL)设置一起控制PGS区块20。PGS区块20根据均值背景噪声当前音量设置VOL、参考信号X(ω)以及房间相关频谱增益信号Groom(ω)计算信号;信号G(ω)表示用于DEC区块16中的均衡和音色校正的频谱增益因数。VOL设置控制信号x[k]以及因此提供至扬声器17的信号Out[k]的增益。
图1的系统可以经受各种结构改变,诸如已对图3所示示例性系统所做出的改变。在图3的系统中,NSF区块23是由话音激活解码器(VAD)区块35取代。另外,处于当前示例DEC区块16中的增益成形区块包括最大量值(MM)检测器区块36,所述MM检测器区块36将估计均值背景噪声与区块38所提供的、以增益G放大且取决于当前音量设置VOL的先前存储的参考值进行比较,使得包括自动响度控制功能。VAD区块35与NSF区块23类似地操作,并且提供均值频谱噪声信号均值频谱噪声信号由MM检测器区块36处理,以便提供均值频谱噪声信号的最大量值MM检测器区块36采取均值频谱噪声信号和由增益控制区块37来提供的信号Ns(ω)的最大值,从区块38接收所需噪声功率频谱密度(DNPSD),并且通过来自音量设置区块34的音量设置VOL来控制。
本文所呈现的系统允许对动态地改变的背景噪声的心理声学校正计算、对响度的心理声学校正再现、以及对房间相关音色改变的自动校正。
虽然已经描述本发明的各种实施方案,但是本领域的普通技术人员将会清楚,在本发明的范围内,更多实施方案以及实施方式是可能的。因此,本发明仅受到随附权利要求书及其等效物限制。
Claims (30)
1.一种用于自动控制收听房间中的声音的音色和均衡的音频增强系统,其包括:
时频变换区块,所述时频变换区块被配置来接收时域中的电声音信号并且生成频域中的电声音信号;
频时变换区块,所述频时变换区块被配置来接收所述频域中的所述电声音信号并且生成所述时域中的再变换电声音信号;
扬声器,所述扬声器被配置来从所述再变换电声音信号生成声音输出;
麦克风,所述麦克风被配置来生成表示所述房间中的总声音的总声音信号,其中所述总声音包括来自所述扬声器的所述声音输出以及所述房间内的环境噪声;
噪声提取区块,所述噪声提取区块被配置来从所述麦克风接收所述总声音信号并且从所述总声音信号提取表示所述房间中的所述环境噪声的估计环境噪声信号;以及
均衡区块,所述均衡区块被配置来接收所述估计环境噪声信号以及所述频域中的所述电声音信号,并且被配置来根据所述估计环境噪声信号、所述频域中的电声音信号和房间相关增益信号调节所述频域中的所述电声音信号的频谱增益;所述房间相关增益信号从参考房间数据和估计房间数据确定。
2.如权利要求1所述的系统,其还包括存储器,所述参考房间数据和所述估计房间数据中的至少一个被存储在所述存储器中。
3.如权利要求1或2所述的系统,其还包括心理声学增益成形区块,所述心理声学增益成形区块被配置来根据心理声学参数调节所述电声音信号的所述频谱增益。
4.如权利要求3所述的系统,其中所述心理声学参数包括心理声学频标。
5.如权利要求3所述的系统,其还包括均值计算区块以及话音激活检测器,所述话音激活检测器被配置来提供所述估计环境噪声信号。
6.如权利要求1所述的系统,其还包括均值计算区块以及噪声估计区块,所述噪声估计区块被配置来提供所述估计环境噪声信号。
7.如权利要求6所述的系统,其中所述噪声估计区块是非线性平滑滤波器。
8.如权利要求1所述的系统,其中所述房间相关增益成形区块还被配置来接收衰减/平衡设置并且根据所述衰减/平衡设置调节所述电声音信号的所述频谱增益。
9.一种用于自动控制收听房间中的声音信号的音色的方法,其包括:
从时域中的再变换电声音信号产生所述时域中的声音,其中所述时域中的电声音信号被变换成频域中的电声音信号,并且所述频域中的电声音信号再变换成所述再变换电声音信号;
生成表示所述房间中的总声音的总声音信号,其中所述总声音包括来自扬声器的声音输出以及所述房间中的环境噪声;
处理所述总声音信号以提取表示在所述房间中的所述环境噪声的估计环境噪声信号;以及
根据所述估计环境噪声信号、所述频域中的电声音信号和房间相关增益信号,调节所述频域中的所述电声音信号的频谱增益;所述房间相关增益信号从参考房间数据和估计房间数据确定。
10.如权利要求9所述的方法,其中所述电声音信号的所述频谱增益根据心理声学参数进行调节。
11.如权利要求10所述的方法,其中所述心理声学参数包括心理声学频标。
12.如权利要求10或11所述的方法,其中均值计算以及话音激活检测被执行来提供所述估计环境噪声信号。
13.如权利要求9所述的方法,其中均值计算以及噪声估计被执行来提供所述估计环境噪声信号。
14.如权利要求13所述的方法,其中噪声估计采用非线性平滑。
15.如权利要求9所述的方法,其还包括接收衰减/平衡设置并且根据所述衰减/平衡设置调节所述电声音信号的所述频谱增益。
16.一种用于自动控制收听房间中的声音的音色和响度的系统,其包括:
扬声器,所述扬声器被配置来从电声音信号生成声学声音输出;
麦克风,所述麦克风被配置来生成表示所述房间中的总声学声音的总电声音信号,其中所述总声学声音包括来自所述扬声器的声学声音输出以及所述房间内的环境噪声;
实际响度评估区块,所述实际响度评估区块被配置来提供表示所述房间中的所述总声学声音的实际响度信号;
所需响度评估区块,所述所需响度评估区块被配置来提供所需响度信号;以及
增益成形区块,所述增益成形区块被配置来接收所述电声音信号、音量设置、所述实际响度信号、所述所需响度信号以及房间相关增益信号,所述房间相关增益信号从参考房间数据、估计房间数据、以及所述音量设置确定;其中
所述增益成形区块还被配置来根据所述音量设置、所述实际响度信号、所述所需响度信号、以及所述房间相关增益信号调节所述电声音信号的增益。
17.如权利要求16所述的系统,其中所述增益成形区块还被配置来接收衰减/平衡设置并且根据所述衰减/平衡设置调节所述电声音信号的所述增益。
18.如权利要求16或17所述的系统,其中所述增益成形区块包括心理声学增益成形区块,所述心理声学增益成形区块被配置来根据心理声学参数调节所述电声音信号的所述增益。
19.如权利要求18所述的系统,其中所述心理声学参数包括心理声学频标。
20.如权利要求16所述的系统,其中所述实际响度评估区块包括噪声提取区块,所述噪声提取区块被配置来从所述麦克风接收所述总声音信号并且提取表示实际响度的估计环境噪声信号。
21.如权利要求20所述的系统,其中所述噪声提取区块包括均值计算区块以及话音激活检测器,所述话音激活检测器被配置来提供所述估计环境噪声信号。
22.如权利要求20所述的系统,其中所述增益成形区块包括最大量值检测区块,所述最大量值检测区块被配置来根据所述音量设置以及所述所需响度信号检测所述估计环境噪声信号的最大量值,所述估计环境噪声信号的所述最大量值表示所述实际响度。
23.如权利要求16所述的系统,其中所述增益成形区块是均衡区块,所述均衡区块被配置来使得所述电声音信号的频率特性成形。
24.一种用于自动控制收听房间中的声音的音色和响度的方法,其包括:
从电声音信号产生声音输出;
生成表示所述房间中的总声音的总声音信号,其中所述总声音包括来自扬声器的声音输出以及所述房间中的环境噪声;
评估所述总声音信号以提供实际响度;
接收音量设置、所需响度、以及参考房间数据;
提供从参考房间数据、估计房间数据、以及所述音量设置确定的房间相关增益;以及
根据所述音量设置、所述实际响度信号、所需响度信号、以及所述房间相关增益,调节所述电声音信号的所述增益。
25.如权利要求24所述的方法,其还包括接收衰减/平衡设置并且根据所述衰减/平衡设置调节所述电声音信号的所述增益。
26.如权利要求24或25所述的方法,其中所述电声音信号的所述增益根据心理声学参数进行调节。
27.如权利要求26所述的方法,其中所述心理声学参数包括心理声学频标。
28.如权利要求24所述的方法,其中实际响度评估包括从麦克风提供的所述总声音信号进行噪声提取,以便提取表示所述实际响度的估计环境噪声信号。
29.如权利要求28所述的方法,其中均值计算以及话音激活检测被执行来提供所述估计环境噪声信号。
30.如权利要求28所述的方法,其中评估所述总声音信号以提供实际响度还包括最大量值检测,用以根据所述音量设置以及所述所需响度检测所述估计环境噪声信号的最大量值,所述估计环境噪声信号的所述最大量值表示所述实际响度。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13177456.4 | 2013-07-22 | ||
EP13177454.9 | 2013-07-22 | ||
EP13177456 | 2013-07-22 | ||
EP13177454 | 2013-07-22 | ||
PCT/EP2014/064055 WO2015010864A1 (en) | 2013-07-22 | 2014-07-02 | Automatic timbre, loudness and equalization control |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105393560A CN105393560A (zh) | 2016-03-09 |
CN105393560B true CN105393560B (zh) | 2017-12-26 |
Family
ID=51134078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480041253.1A Active CN105393560B (zh) | 2013-07-22 | 2014-07-02 | 自动音色、响度以及均衡控制 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10319389B2 (zh) |
EP (2) | EP3025516B1 (zh) |
CN (1) | CN105393560B (zh) |
WO (1) | WO2015010864A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3034928B1 (fr) * | 2015-04-10 | 2019-05-10 | Psa Automobiles Sa. | Procede et dispositif de controle de tonalite d’un signal sonore |
US10142731B2 (en) | 2016-03-30 | 2018-11-27 | Dolby Laboratories Licensing Corporation | Dynamic suppression of non-linear distortion |
CN105895127A (zh) * | 2016-03-30 | 2016-08-24 | 苏州合欣美电子科技有限公司 | 一种音量自适应调整的汽车播放器 |
EP3549259B1 (en) * | 2016-12-06 | 2023-10-25 | Harman International Industries, Incorporated | Method and device for equalizing audio signals |
CN108510987B (zh) * | 2018-03-26 | 2020-10-23 | 北京小米移动软件有限公司 | 语音处理方法及装置 |
CN111048108B (zh) * | 2018-10-12 | 2022-06-24 | 北京微播视界科技有限公司 | 音频处理方法和装置 |
CN112634916A (zh) * | 2020-12-21 | 2021-04-09 | 久心医疗科技(苏州)有限公司 | 一种除颤器语音自动调节方法及装置 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3580402D1 (de) | 1984-05-31 | 1990-12-13 | Pioneer Electronic Corp | Verfahren und geraet zur messung und korrektur der akustischen charakteristik eines schallfeldes. |
NL8702200A (nl) * | 1987-09-16 | 1989-04-17 | Philips Nv | Werkwijze en een inrichting voor het instellen van de overdrachtskarakteristiek naar twee luisterposities in een ruimte |
JP3661584B2 (ja) | 2000-01-28 | 2005-06-15 | セイコーエプソン株式会社 | 電気光学装置、画像処理回路、画像データ補正方法、および、電子機器 |
CA2354755A1 (en) | 2001-08-07 | 2003-02-07 | Dspfactory Ltd. | Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank |
JP2004004629A (ja) | 2002-03-25 | 2004-01-08 | Sharp Corp | 液晶表示装置 |
KR101118922B1 (ko) | 2002-06-05 | 2012-06-29 | 에이알씨 인터내셔날 피엘씨 | 음향 가상 현실 엔진 및 전달 사운드 확장을 위한 향상된 기술들 |
US20050157891A1 (en) | 2002-06-12 | 2005-07-21 | Johansen Lars G. | Method of digital equalisation of a sound from loudspeakers in rooms and use of the method |
US7333618B2 (en) * | 2003-09-24 | 2008-02-19 | Harman International Industries, Incorporated | Ambient noise sound level compensation |
EP1571768A3 (en) * | 2004-02-26 | 2012-07-18 | Yamaha Corporation | Mixer apparatus and sound signal processing method |
EP1619793B1 (en) * | 2004-07-20 | 2015-06-17 | Harman Becker Automotive Systems GmbH | Audio enhancement system and method |
US8199933B2 (en) | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
KR100636252B1 (ko) | 2005-10-25 | 2006-10-19 | 삼성전자주식회사 | 공간 스테레오 사운드 생성 방법 및 장치 |
EP1974587B1 (en) * | 2006-01-03 | 2010-06-02 | SL Audio A/S | Me thod and system for equalizing a loudspeaker in a room |
US7876903B2 (en) | 2006-07-07 | 2011-01-25 | Harris Corporation | Method and apparatus for creating a multi-dimensional communication space for use in a binaural audio system |
EP1986466B1 (en) | 2007-04-25 | 2018-08-08 | Harman Becker Automotive Systems GmbH | Sound tuning method and apparatus |
CN101802910B (zh) * | 2007-09-12 | 2012-11-07 | 杜比实验室特许公司 | 利用话音清晰性的语音增强 |
US8325931B2 (en) | 2008-05-02 | 2012-12-04 | Bose Corporation | Detecting a loudspeaker configuration |
US8085951B2 (en) * | 2009-03-23 | 2011-12-27 | Texas Instruments Incorporated | Method and system for determining a gain reduction parameter level for loudspeaker equalization |
WO2010138309A1 (en) | 2009-05-26 | 2010-12-02 | Dolby Laboratories Licensing Corporation | Audio signal dynamic equalization processing control |
KR101387195B1 (ko) * | 2009-10-05 | 2014-04-21 | 하만인터내셔날인더스트리스인코포레이티드 | 오디오 신호의 공간 추출 시스템 |
CN101719368B (zh) | 2009-11-04 | 2011-12-07 | 中国科学院声学研究所 | 高声强定向声波发射装置 |
JP5744391B2 (ja) | 2009-11-27 | 2015-07-08 | キヤノン株式会社 | 画像形成装置 |
ES2632576T3 (es) | 2010-05-06 | 2017-09-14 | Dolby Laboratories Licensing Corporation | Ecualización de sistema de audio para dispositivos de reproducción de medios portátiles. |
US9307340B2 (en) | 2010-05-06 | 2016-04-05 | Dolby Laboratories Licensing Corporation | Audio system equalization for portable media playback devices |
CN102907120B (zh) * | 2010-06-02 | 2016-05-25 | 皇家飞利浦电子股份有限公司 | 用于声音处理的系统和方法 |
CN102475554B (zh) | 2010-11-24 | 2014-05-28 | 比亚迪股份有限公司 | 一种利用声品质指导车内声学包装的方法 |
EP2575378A1 (en) * | 2011-09-27 | 2013-04-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for listening room equalization using a scalable filtering structure in the wave domain |
US20130136282A1 (en) | 2011-11-30 | 2013-05-30 | David McClain | System and Method for Spectral Personalization of Sound |
US9002030B2 (en) * | 2012-05-01 | 2015-04-07 | Audyssey Laboratories, Inc. | System and method for performing voice activity detection |
-
2014
- 2014-07-02 EP EP14735932.7A patent/EP3025516B1/en active Active
- 2014-07-02 WO PCT/EP2014/064055 patent/WO2015010864A1/en active Application Filing
- 2014-07-02 EP EP20205501.8A patent/EP3796680A1/en active Pending
- 2014-07-02 CN CN201480041253.1A patent/CN105393560B/zh active Active
- 2014-07-02 US US14/906,687 patent/US10319389B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN105393560A (zh) | 2016-03-09 |
US20160163327A1 (en) | 2016-06-09 |
WO2015010864A1 (en) | 2015-01-29 |
EP3796680A1 (en) | 2021-03-24 |
US10319389B2 (en) | 2019-06-11 |
EP3025516B1 (en) | 2020-11-04 |
EP3025516A1 (en) | 2016-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105393560B (zh) | 自动音色、响度以及均衡控制 | |
US9754605B1 (en) | Step-size control for multi-channel acoustic echo canceller | |
CN106664473B (zh) | 信息处理装置、信息处理方法和程序 | |
US7302062B2 (en) | Audio enhancement system | |
US8116481B2 (en) | Audio enhancement system | |
US8170221B2 (en) | Audio enhancement system and method | |
US8351626B2 (en) | Audio amplification apparatus | |
US6594365B1 (en) | Acoustic system identification using acoustic masking | |
JP2004507141A (ja) | 音声強調システム | |
CN103580631B (zh) | 自动响度控制系统及方法 | |
JP4914319B2 (ja) | コミュニケーション音声処理方法とその装置、及びそのプログラム | |
JP2003274492A (ja) | ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム | |
Akhtar et al. | Acoustic feedback cancellation in hearing aids using dual adaptive filtering and gain-controlled probe signal | |
US7756276B2 (en) | Audio amplification apparatus | |
US11539833B1 (en) | Robust step-size control for multi-channel acoustic echo canceller | |
US11189297B1 (en) | Tunable residual echo suppressor | |
US12010486B2 (en) | Detection of feedback path change | |
US10135413B2 (en) | Automatic timbre control | |
Forsgren | Active Noise Control in Forest Machines | |
Xiang | A prototype system for remote collaborative recording |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |