CN114095836A - 音频处理装置及音频处理方法 - Google Patents
音频处理装置及音频处理方法 Download PDFInfo
- Publication number
- CN114095836A CN114095836A CN202110793471.2A CN202110793471A CN114095836A CN 114095836 A CN114095836 A CN 114095836A CN 202110793471 A CN202110793471 A CN 202110793471A CN 114095836 A CN114095836 A CN 114095836A
- Authority
- CN
- China
- Prior art keywords
- linear
- signal
- audio
- stage
- control signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 126
- 238000003672 processing method Methods 0.000 title claims abstract description 11
- 230000009021 linear effect Effects 0.000 claims abstract description 149
- 230000005236 sound signal Effects 0.000 claims abstract description 73
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000004321 preservation Methods 0.000 claims abstract description 37
- 230000008569 process Effects 0.000 claims abstract description 20
- 230000006870 function Effects 0.000 claims description 14
- 230000004044 response Effects 0.000 description 16
- 238000012937 correction Methods 0.000 description 13
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000007667 floating Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009022 nonlinear effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B3/00—Line transmission systems
- H04B3/02—Details
- H04B3/04—Control of transmission; Equalising
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuit For Audible Band Transducer (AREA)
- Control Of Amplification And Gain Control (AREA)
Abstract
一种音频处理装置及音频处理方法,所述装置包括线性处理级与控制信号电路。线性处理级配置为接收输入音频信号,并基于线性处理级的使用者提供设定线性地处理输入音频信号,以产生线性级输出音频信号。控制信号电路配置为(a)基于(i)线性处理级的使用者提供设定与(ii)预先规定信号品质保存标准,产生控制信号,以及(b)遵循预先规定信号品质保存标准,以控制信号与线性级输出音频信号进行处理,以产生受控音频信号。
Description
技术领域
本发明实施例关于音频信号的处理,特别是关于一种用于校正音频信号失真的方法、系统及软件。
背景技术
用于自动调整音频信号的技术先前已在专利文献中提出。例如,美国专利号7,415,064描述了与传输振幅(transmit amplitude)无关的可适性等化器(adaptiveequalizer),当传输信号振幅是未知时,可适性等化器会补偿输入信号的传输损失。提供了几个实施例,其包括具有等化器核(equalizer core)、可变增益放大器(variable gainamplifier)与可变增益放大器控制回路的实施例。
作为另一实施例,美国专利号8,351,493描述了一种折迭可适性等化器(foldingadaptive equalizer)。该等化器包括等化器核与自动增益控制回路。等化器核的等化传输功能是由自动增益控制回路所产生的一个或多个增益控制信号以及自动增益控制回路所闪生的折迭信号(folding signal)调制。取决于折迭信号,等化器通过增加等化器核的传输功能的高频带增益(high-bandwidth gain)或低频带增益(low-bandwidth gain)以增加高频增益。
发明内容
在下文描述的本发明实施例提供一种音频处理装置,其包括线性处理级与控制信号电路(control signal circuitry,CSC)。线性处理级配置为接收输入音频信号,并基于线性处理级设定线性地处理输入音频信号,以产生线性级输出音频信号。控制信号电路(CSC)配置为(a)基于(i)线性处理级设定与(ii)预先规定信号品质保存标准(prespecified signal quality preserving criterion),产生控制信号,以及(b)遵循预先规定信号品质保存标准,以控制信号与线性级输出音频信号进行处理,以产生受控音频信号。
在一些实施例中,音频处理装置还包括非线性处理级,其配置为接收受控音频信号并遵循预先规定信号品质保存标准处理受控音频信号,其中该预先规定信号品质保存标准规定由非线性处理级满足的线性度。
在一些实施例中,线性处理级包括数字等化器,其中线性处理级设定包括数字等化器的各通道的多个调拨增益(user-dialed gain)的集合,其中控制信号电路配置为识别调拨增益之间的最大增益,且若最大增益超过预定阈值,则通过最大增益的函数的值将数字等化器的增益按比例缩小。
在一实施例中,数字等化器包括二极点二零点(two-pole-two-zero)滤波器与双二阶(bi-quadratic)滤波器的其中之一。
在一些实施例中,上述装置还包括存储器,且预先规定信号品质保存标准储存于存储器,且控制信号电路配置为从存储器上载预定信号品质保存标准。
在一实施例中,预先规定信号品质保存标准表示系包含决策表。
在另一实施例中,线性处理级包括数字滤波器,且其中线性处理级设定包括数字滤波器的增益设定。
在一些实施例中,预先规定信号品质保存标准用以规定不得超过的增益。
在一些实施例中,控制信号电路配置为通过将线性级输出音频信号乘以控制信号,借此以控制信号与线性级输出音频信号进行处理。
依据本发明的另一实施例另外提供一种方法,包括通过线性处理级,基于线性处理级设定以线性地处理输入音频信号,以产生线性级输出音频信号。基于(i)线性处理级设定与(ii)预先规定信号品质保存标准,产生控制信号。遵循预先规定信号品质保存标准,以控制信号与线性级输出音频信号进行处理,以产生受控音频信号。
通过下面结合附图与本发明的实施例的详细描述,可以更全面地理解本发明,其中:
附图说明
图1为依据本发明的一实施例示意性地示出的包括线性处理级、非线性处理级与控制信号电路(CSC)的音频处理装置的方块图。
图2A与图2B分别为依据本发明的一实施例的图1的音频处理装置的滤波器输出信号与校正信号的示意图。
图3为依据本发明的一实施例的示意性地示出的使用图1的音频处理装置来校正音频增益的方法的流程图。
【符号说明】
10:线性处理级
20:控制信号电路
22:决策表
23:存储器
24:处理器
30:非线性处理级
60,62,64,66,68:步骤
100:音频处理装置
101:输入音频信号
102:线性处理级设定
103:线性级输出音频信号
104:控制信号
105:受控音频信号
106:输出信号
200:平坦的零[dB]信号
202,402:下沉
204,404:尖峰
400:平坦信号
1020:使用者增益设定
1030:滤波器输出信号
1050:校正信号
DF1-DF8:旋钮
具体实施方式
概述(Overview)
消费级(consumer-grade)音频系统的制造商,特别是那些安装在移动装置中的音频系统的制造商,面临平衡音频品质与成本的挑战。许多这类数字音频系统使用数字信号处理(digital signal processing,DSP)技术来补偿装置的物理限制(例如,克服小塑胶外壳(small plastic enclosure)的失真),并改善工程产品的成本及/或尺寸。特别是,制造商通常使用结合线性演算法(例如,滤波器、音量旋钮(volume knob))与非线性演算法(例如动态范围压缩器(dynamic range compressor)、动态范围限制器(dynamic rangelimiter))的DSP解决方案。因此,这类音频系统对输入信号的整体响应可能是非线性的(例如,取决于阈值(threshold))。
尽管DSP解决方案可以通过非线性地执行以改善音频性能(例如,通过以可接受的失真水平最大化扬声器输出),但在许多商业应用中,信号的纯度是非常重要的,因此必须避免信号失真。示例包括主动噪声消除(active noise cancelation)、音频应用(例如回音消除(acoustic echo cancelation)以及语音检测(例如语音识别)。为此,在这些应用中,保持音频处理的线性度是重要的。
通常,线性输入信号的特征在于其振幅被限制在预定线性动态范围内。例如,考虑一种情况,其中输入信号在信号振幅的预定16位(16-bit)范围内是线性的,其中FS表示全刻度(full scale)。在此示例中,在不失去一般性的情况下,将信号振幅保持在[-96,0][dBFS]范围内可确保通过包括非线性级的DSP解决方案对信号进行线性地处理,进而保持已处理信号的纯度。举例来说,线性保持标准(linearity-maintain criterion)可以包括(以线性方式)将信号振幅限制为不大于0[dB]的非线性阈值。
此外,无论系统是否包括非线性级,人类使用者(例如家庭、工作室或现场的音乐家和混音/母代处理工程师(mixing/mastering engineer))通常倾向于通过强调“想要的”频率区域(frequency zone)来均衡声音,而不是衰减“不想要的”频率区域。对于上述原因(避免失真与非线性),衰减不想要的频率区域的方法通常比提高想要的频率区域更好。然而,出于简单的原因-易于使用,许多使用者仍然发现自己提高了想要的区域,而不是衰减不想要的区域。对于人类使用者来说,更容易“关注”于特定的频率区域,且接着拨入(dial-in)单一参数(或旋钮),然后“拨出(dial-out)”所有其他区域。因此,许多声学工程师知道,从理论上来说,“不想要的”频率的衰减示优选方法,但并未实践此方法。本文所述的技术可以自动地校正此问题。使用者可以使用同一个调拨盘(dial)来“提高”“想要的”区域,而其他区域将会自动地“衰减”。
如上所述,来自音频装置(例如,具有和不具有非线性级)的冲突需求可能会导致信号意外地失真。举例来说,音频工程师或其他使用者误以为这可以确保线性响应而可以在等化器中提供(例如,调拨)正增益。如上所述,这种情况可能很常见,因为低信号纯度常常导致制造商将使用者不知道的非线性级合并到某些音频系统中。然而,如上所述,所揭露技术也可用于确保独立线性装置的信号品质。
下文描述的本发明实施例提供自动维持信号品质的方法与装置。因此,所揭露技术自动补偿装置的给定线性处理级的音频处理参数的使用者选择(例如,调拨),其保持对给定线性动态范围内(例如,在[-96,0][dBFS]内)的任何输入信号的受控响应。在一实施例中,音频处理装置包括(a)线性处理级,其配置为接收输入音频信号,并基于线性处理级设定线性地处理输入音频信号,以产生线性级输出音频信号,以及(b)控制信号电路(CSC),其配置为基于(i)线性处理级设定与(ii)预先规定信号品质保存标准(例如,输出信号强度不超过零[dB]),产生控制信号。控制信号电路遵循预先规定信号品质保存标准,以控制信号与线性级输出音频信号进行处理,以产生受控音频信号。
在一些实施例中,当音频处理装置结合包括非线性处理级的非线性级(nonlinearstage)时,这类非线性级配置为接收受控音频信号并遵循预先规定信号品质保存标准处理受控音频信号,其中预先规定信号品质保存标准用以规定由非线性处理级满足的线性度。在一实施例中,预先规定信号品质保存标准又可称为预先规定信号线性保存标准(prespecified signal linearity preserving criterion)。
举例来说,认为所使用的DSP技术是线性解决方案,使用者可以设定驱动系统进入非线性响应的正增益。举例来说,在接收振幅小于零[dB]但大于-G[dB]的输入信号的等化器通道中调拨正增益G,会导致随后的非线性限制器级将该信号限制为零[dB]。这种人为错误可能会在各种情况下发生,例如:
·在设计周期内调整消费级音频产品(例如,在电脑(PC)、手机(cellularphone)、电视(TV)、条形音箱(soundbar)中)。
·现场直播(live show)的场馆公众区系统(Front-of-house system)调整。
·载入公告(Public announcement,PA)系统调整以传达人类语音。
·在工作室录音或母带处理。
·设定消费级电子产品(例如,手机)的EQ或低音提高。
因此,本发明的一些实施例提供在给定线性动态范围内(例如,在[-96,0][dBFS]内)自动保持对任何输入信号的线性响应的方法与装置。所揭露技术自动补偿装置的给定线性处理级的音频处理参数的使用者选择(例如,调拨),其随后可能导致非线性处理阶段使信号失真。所述的技术方案具有较低的复杂度、具有较低计算和电能需求,因此非常适用于消费级移动装置。
在一些实施例中,提供一种包括线性处理级与非线性处理级的音频处理装置。线性处理级配置为接收输入音频信号,并基于线性处理级设定线性地处理输入音频信号,以产生线性级输出音频信号。音频处理装置还包括控制信号电路(CSC),其配置为(a)接收线性处理级设定(例如,从存储器上载决策表,此决策表包括用于使用者提供(例如,使用者选择)设定的信号线性保存标准(signal-linearity-preserving criteria)),(b)基于(i)线性处理级设定与(ii)预先规定信号线性保存标准,产生控制信号,以及(c)以控制信号与线性级输出音频信号进行处理,以产生受控音频信号。音频处理装置的非线性处理级配置为受控(例如,校正)音频信号,并遵循信号线性保存标准处理受控音频信号。
在本揭露发明的一些实施例中,控制信号电路接收线性级的设定的改变的指示(例如,在等化器中的多个滤波器的集合的调拨的改变),并检查上述改变是否会导致随后的非线性级并使信号失真。若是这样的情况下,控制信号电路会执行校正动作来防止这类非线性效应,以保持信号纯度。
例如,在一些实施例中,控制信号电路接收一个或多个滤波器的增益设定的改变的指示,并依据通过将控制信号输出至乘法器的改变的设定修正系统响应,以使信号振幅保持等于或小于0[dB],其中乘法器用于将滤波信号乘以控制信号。在一实施例中,处理器使用决策表中读取的信号线性保存标准,并检查滤波器的最大增益。若将任何滤波器设定为高于预定阈值的值(例如,设定为正增益),控制信号电路将(所有滤波器的)总输出增益降低至至少相同的设定量。反的,控制信号电路不会降低增益。
此控制信号(亦即,以dB为单位的增益降低量)输出至乘法器。因此,所得到的信号在整个音频频谱上平均衰减,包括例如增益已经为负的滤波器通道。据此,降低了总信号功率(例如,音量),同时保留通道之间的原始相对增益并防止不希望得到的失真。如此,不知道可能的非线性处理步骤的工程师或使用者可以调拨任何增益,并且所揭露技术使系统始终免受非线性区域的影响。
在另一实施例中,线性处理级包括数字等化器,且线性处理级设定包括数字等化器的各通道的多个调拨增益的集合。控制信号电路配置为识别调拨增益之间的最大增益,且若最大增益超过预定阈值,则通过最大增益的函数的值将所有调拨增益按比例缩小。
通过提供自动音频输入控制系统与方法来自动地(例如,无需使用者知道)防止音频信号失真,所揭露技术致使消费级装置能够运行具有高信号纯度需求的应用,同时保持具有低计算与电能需求的低复杂度。
装置说明(APPARATUS DESCRIPTION)
如上所述,在一些消费装置(consumer device)中,输入音频信号可能会由于非线性DSP而产生失真输出,在许多情况下,这可能旨在优化例如输出音量的期望造物。
然而,在一些应用(例如,机器语音识别(machine-speech recognition)中,信号纯度(例如,线性度(linearity)是重要的。为了防止在这类情况的失真,在没有本发明所揭露的实施例的情况下,需要一种功能,其将需要使用者意识到不切实际的水平,或者需要高能量消耗的复杂且昂贵的解决方案。
图1为依据本发明的一实施例示意性地示出的包括线性处理级10、非线性处理级30与控制信号电路(CSC)20的音频处理装置100的方块图。音频处理装置100可以用于输出音频信号的任何合适的系统或装置,例如行动电话、电脑、游戏机(gaming console)或立体声系统(stereo system),仅列举几种可能性的系统或装置。特别是,音频处理装置100可以用于语音识别应用。
音频处理装置100具有前馈拓扑(feed-forward topology),其中线性处理级10接收线性的输入音频信号101并产生线性级输出音频信号103。作为非限制示例,线性处理级10可以包括例如多个线性数字滤波器(linear digital filter,LDF)的集合,通常是2p2z(二极点二零点)滤波器。典型地,这类滤波器的集合包括在等化器单元(图未示)中。因此,线性级输出音频信号103可以示等化器输出信号。在一些情况下,线性处理级10可以包括一个或多个数字双二阶滤波器(digital biquad filter),其为包括二极点与二零点的二阶递归线性滤波器(second order recursive linear filter)。“Biquad”是“biquadratic”的缩写,其是指这类滤波器的传递函数是两个二阶函数之比的事实。
将线性级设定102(例如,调拨滤波器增益的集合)输入至控制信号电路20,控制信号电路20通过将它们与预先规定信号线性保存标准进行比较来响应地分析它们。接着,控制信号电路20计算、产生并输出控制信号104,控制信号电路20将控制信号104与线性级输出音频信号103一起控制(例如,相乘)。例如使用乘法器25的控制信号104的应用产生受控音频信号105,该受控音频信号105不受随后的非线性处理级30的非线性影响,且非线性处理级30本身配置为遵循相同的信号线信保存标准(例如,不允许以[dB]为单位的正振幅的信号)。例如,控制信号电路防止受控音频信号105在任何频率下都高于0dB,使得非线处理性级30的限制器类型不会通过无效高于0dB的信号来使信号失真(亦即,产生失真的输出信号106),如图2A与图2B所示。
更详细地,控制信号电路20包括存储器23(或,在其他实施例中,可以存取不是控制信号电路20的一部分的存储器),存储器23储存包括信号线性保存标准的决策表22。控制信号电路20还包括处理器24(或,在其他实施例中,可以存取不是控制信号电路20的一部分的处理器)。处理器响应于接收到的线性级处理设定102(例如,其包含滤波器增益的设定),并基于由处理器24所读取的决策表24包括的滤波器增益的信号线性保存标准,计算校正增益系数作为控制信号104(控制信号电路20的输出)。控制信号电路20使用控制信号104(其包含增益系数)以均匀地衰减线性级输出音频信号103。因此,受控音频信号105(作为校正信号)随后不会被作为限制器的非线性处理级产生失真,如图2A与图2B所示。
为了清楚起见,以示例的方式且以简化的方式示出图1的实施例。例如,所揭露技术可以使用另一类型的数字滤波器,例如单极点滤波器(single-pole filter)、三极点(three-pole)或任何其他数量的极点滤波器(pole filter)、低通滤波器(LPF)、任意阶数的带通滤波器(BPF)、有限脉冲响应(finite impulse response,FIR)滤波器等。为了呈现清楚器件,未描述音频处理装置100的额外元件,例如等化器单元的其他组件以及音频放大级(audio amplification stage)。
在各个实施例中,图1所示的音频处理装置的不同元件可以使用适当的硬体来实现,例如一个或多个离散组件(discrete component)、一个或多个特殊应用积体电路(Application-Specific Integrated Circuit,ASIC)及/或一个或多个现场可程式闸阵列(Field-Programmable Gate Array,FPGA)。所揭露控制信号电路20的一些功能可以在以软件编程的一个或多个通用处理器(general purpose processor)中实现,以执行本文所述的功能。软件可以以电子形式、通过网际网路或从主机下载至处理器,例如,或是它可替代地或额外地被提供或储存在非暂态有形媒体(non-transitory tangible media)上,像是磁性存储器、光学式存储器或是电子式存储器。
防止原始输入信号失真的等化器自动增益响应(EQUALIZER AUTO GAIN RESPONSEFOR PREVENTING DISTORTION OF ORIGINAL INPUT SIGNAL)
以线性处理级10为N通道等化器为例,使用者可以通过使用等化器的旋钮DF1-DFN来调拨N通道等化器的N个不同滤波器的滤波器增益。
调拨增益的至少其一是最高的,以下称为HighestGain。如上所述,假设共用动态范围[-96,0][dBFS],若HighestGain是非正数,则控制信号电路20对等化器输出信号没有影响(例如,控制信号电路输出控制信号104,OutGain,OutGain=0[dB])。另一方面,若使用者调拨HighestGain为正,亦即
式1 HighestGain>0,
接着,音频处理装置100的控制信号电路会校正所有等化器的N个通道增益。
在此示例中,控制信号电路20计算、产生并输出复制控制信号OutGain,其是最高调拨增益的函数。例如,
式2 OutGain=-(HighestGain)-Δ,
其中Δ≥0是预先规定公差值,亦即1dB。
在图2A与图2B中更详细地描述了如上示例,其分别是依据本发明实施例的图1的音频处理装置100的滤波器输出信号1030与校正信号1050的曲线图。
在所示的实施例中,使用者使用旋钮DF1-DF8调拨(1020)8(N=8)通道的8个不同滤波器的滤波器增益。调拨增益的其中的一(DF5)是最高的且为正的,借以调用使用所揭露的技术执行的自动校正。
在图2A中,使用者将平坦的零[dB]信号(200)在125Hz(DF2的中心频率)处放大-10dB,以在其中具有下沉(dip)202,以及在1500Hz(DF5的中心频率)处放大+10dB,以在其中具有尖峰(peak)204。依据式1,这类使用者增益设定1020意旨HighestGain=10[dB]。
如图2B所示,在控制信号电路20将信号均匀地衰减10[dB]后,所有频率下的校正信号(受控音频信号)1050的振幅是低于或等于零[dB]。音频处理装置100借由控制信号电路20依据式(2)通过输出-10[dB]的乘法因子(使用Δ=0)以自动校正(例如,补偿)调拨增益来实现此目的,其中乘法因子均匀地(亦即,线性地)衰减输出滤波器输出信号1030。具体来说,平坦信号400的振幅为-10[dB],在125Hz的下沉402的振幅为-20[dB],且在1500Hz的尖峰404的振幅为零[dB]。
因此,校正信号1050的任何部分都不会例如通过配置为将正信号箝制为零[dB]的限制器进行非线性处理。
在如上示例中,阈值被引入为零[dBFS]的一般示例,该阈值是系统的“低动态范围(low Dynamic range)”的最大可能准位,而没有被箝制或失真。
虽然这是最常见的情况,但不一定是唯一的情况。假设系统的输入与输出都限制在规定动态范围与字长(word length),则在常见示例中,字长为16-位(表示动态范围约为96dB的系统,多次被称为“CD品质(CD quality)”)。数字声音处理器通常使用较高的动态范围与较长的字长。这类当代的DSP通常使用32-位浮点核DSP结构。
在此情况下,DSP“接收”限于16-位表示的信号。这被视为零[dBFS](满刻度(Fullscale)的dB),其中“FS”是指整个系统的输入与输出(低动态范围)区域。在DSP内,信号可以被“增加”并超过0[dBFS]的阈值,因此对于系统的较高动态范围部分而言,它并不是真正的“满刻度(Full Scale)”。这通常称为“零dB”。
如上常见情况是非限制性示例。在其他情况下,阈值(非线性演算法在其上改变信号)可以设定为其他值,亦即不必设置为零[dBFS]。在其他系统中,输入与输出可能不是相同动态范围类型,因此阈值(设定为防止输出箝制(output clipping))可能不是上述的“零”[dBFS](其是从输入接收的最大值)。
因此,重要的是要注意,这里将“零”dB的广泛示例作为非限制性示例而不是严格的规则。
请注意的是,这类系统可能使用“定点(fixed point)”输入与输出以及“浮点(floating point)”处理,其中核处理的范围可能远大于输入/输出的范围。该应用不限定于规定结构类型(定点、浮点、16-位、24-位、32-位等)或实现,并且应涵盖软件实现(例如PC)以及硬体(HW)(DSP、ASIC等)。这样的各种情况可能不限于规定阈值(零dB),而是任何其他情况。
因此,在本节中,信号线性动态范围概括为[A,B][dBFS],其中A与B是实数(realnumber),其中它们的值可能会或可能不会在A0=-96[dBFS]与B0=0[dBFS]的附近,以说明所揭露发明还可以如何处理非标准动态范围内的线性信号。
为了说明所揭露装置的灵活性,提供另一种实现方式,其中对于[A,B]的信号的非标准动态范围,例如[A,B]=[-90,+6][dB]的16-位范围或[A,B]=[-120,+24][dB]的24-位范围,所揭露装置会维持信号线性度。在此情况下,式1变为HighestGain>C,系数C是B的函数,例如C=-B。同时,式2可以保持相同,进而使信号进入信号振幅[-96,0][dBFS]的共用线性动态范围。可替代地,例如,若随后的非线性级是已知以操作于非标准动态范围,则式2可以配置系数C以将校正信号保持在非标准线性范围内,进而保持其纯度。
多处理器整体增益的联合响应(JOINT RESPONSE FOR MULTI PROCESSORSOVERALL GAIN)
在图2A与图2B中,调拨到任何一个滤波器(或更一般地说是演算法)的最高增益会触发系统进行校正增益降低。
然而,真实世界情况可能涉及少数几个数字声音处理器的工作,而数字声音处理器的累积增益高于单一处理器的最大增益。作为非线性示例,音频处理装置100的线性处理级10可以提供线性处理级设定102,且增益设定包括+3dB的增益,但是与信号的频率宽度相比具有稍微不同的频率(例如,f1=1000Hz和f2=1100Hz与两个信号的FWHM=1400Hz相比)。
在此情况下,容易看出的是,~1000Hz的输入频率的整体增益约为累积的+6dB。
选择如上两个频带的最大值将要求系统衰减3dB,而不是实际需要的约6dB。如本文所用的用于任何数值或范围的术语“约(about)”或“近似(approximately)”表示合适的尺寸公差,该尺寸公差允许组件的部分或集合为本文所述的预期目的起作用。更具体来说,“约”或“近似”可以指的是所述值的±20%的值的范围,例如“约90%”可以指的是从71%至99%的值的范围。
因此,为了准确说明真实世界情况,系统必须考虑所有演算法的累积增益设定(若存在)作为控制信号电路20的输入。可以用于用通用整体设定取代线性处理级设定102的累积增益的计算方法通常依据基于每一线性级的零点与极点的计算来撷取每一线性级的线性传输函数的大小。这些技术是众所皆知的且在本申请的范围的外。
选择性自动增益响应(Selective AUTO GAIN RESPONSE)
在一些实施例中,设计者想要确保控制信号电路20不是由所有演算法的最高增益(例如,在不同频率的线性级的所有增益设定)无条件地触发。作为示例,假设低音提高验算法具有最高增益设定。然而,此最大值可能不会触发使用储存在“决策表”中的标准,或是至少不会与其他EQ频段的相同程度。控制信号电路20可配置为例如仅基于非低音频率来计算增益降低。对于低频音符,低音提高演算法提供某种程度的失真是该行业所非常接受的,且上述失真通常是人脑所接受且甚至喜欢的。中频(声音)频率可能不接受这类失真,因此可以设计一种系统,低音提高将不会触发使用储存于决策表中的标准(并且由于限制器动作,会使整个系统产生轻微失真),而其他演算法(例如EQ频段)将触发使用储存于“决策表”中的标准,并强制其不触发限制器,否则,将降低输出音量并保持声音的高纯度。
对于不同演算法,决策因子与权重的任何混合都仍视为由本专利所涵盖。
防止原始输入信号失真的自动增益响应的方法(METHOD OF AUTO GAIN RESPONSEFOR PREVENTING DISTORTION OF ORIGINAL INPUT SIGNAL)
图3为依据本发明的一实施例的示意性地示出的使用图1的音频处理装置来校正音频增益设定(例如,调拨)的方法的流程图。依据所呈现的实施例,该演算法执行一过程,首先在信号线性处理步骤60中,使用者调拨线性处理级设定102(例如,滤波器的增益值)至音频处理装置100的线性处理级10以线性地处理(例如,数字地滤波)输入信号,以产生线性级输出音频信号103。
接着,在控制信号产生步骤62中,接收调拨线性处理级设定102的控制信号电路20依据预先规定信号线性保存标准,计算并产生控制信号104。
在信号校正步骤64中,控制信号电路20控制(例如,相乘)控制信号与线性级输出音频信号103,以产生满足预先规定信号线性保存标准的校正信号(受控音频信号)105。
在校正信号输出步骤66中,控制信号电路20将接收的校正信号(受控音频信号)105输出至非线性处理级30的动态范围处理器(例如,限制器)类型中,其中非线性处理级30遵循预先规定信号线性保存标准(亦即,线性度)来处理信号。最后,在信号输出步骤68中,非线处理性级30输出线性的输出信号106。
尽管这里描述的实施例主要针对用于消费及装置的音频处理,但是这里描述的方法与系统还可以用于其他应用中,例如音频工程。
因此将意识到,上述实施例是作为例示性实施例,并且本发明不限于上文已经特别示出和描述的内容。相反,本发明的范围包含上文描述的各种特征的组合和子组合,以及本领域技术人员在阅读前述描述时将会想到的变化和修改,这些变化和修改未在现有技术中揭露。在本专利申请中通过引用并入的文件被认为是本申请的一部分,而在这些并入的文件中以与在本说明书中明确或隐含地作出的定义相冲突的方式来定义任何术语的范围时,只应考虑本说明书中的定义。
Claims (17)
1.一种音频处理装置,其特征在于,包括:
一线性处理级,配置为接收一输入音频信号,并基于一线性处理级设定以线性地处理所述输入音频信号,以产生一线性级输出音频信号;以及
一控制信号电路,其配置为:
基于(i)所述线性处理级设定与(ii)一预先规定信号品质保存标准,产生一控制信号;以及
遵循所述预先规定信号品质保存标准,以所述控制信号与所述线性级输出音频信号进行处理,以产生一受控音频信号。
2.根据权利要求1所述的音频处理装置,其特征在于,包括一非线性处理级,其配置为接收所述受控音频信号并遵循所述预先规定信号品质保存标准处理所述受控音频信号,其中所述预先规定信号品质保存标准规定由所述非线性处理级满足的一线性度。
3.根据权利要求1所述的音频处理装置,其特征在于,所述线性处理级包括一数字等化器,其中所述线性处理级设定包括所述数字等化器的各通道的多个调拨增益的一集合,其中所述控制信号电路配置为识别所述调拨增益之间的一最大增益,且若所述最大增益超过一预定阈值,则通过所述最大增益的函数的值将所述数字等化器的一增益按比例缩小。
4.根据权利要求3所述的音频处理装置,其特征在于,所述数字等化器包括一二极点二零点滤波器与一双二阶滤波器的其中之一。
5.根据权利要求1所述的音频处理装置,其特征在于,还包括一存储器,其中所述预先规定信号品质保存标准储存于所述存储器,且所述控制信号电路配置为从所述存储器上载所述预先规定信号品质保存标准。
6.根据权利要求1所述的音频处理装置,其特征在于,所述预先规定信号品质保存标准系包含一决策表。
7.根据权利要求1所述的音频处理装置,其特征在于,所述线性处理级包括一数字滤波器,且其中所述线性处理级设定包括所述数字滤波器的一增益设定。
8.根据权利要求1所述的音频处理装置,其特征在于,所述预先规定信号品质保存标准用以规定不得超过的一增益。
9.根据权利要求1所述的音频处理装置,其特征在于,所述控制信号电路配置为通过将所述线性级输出音频信号乘以所述控制信号,借此以所述控制信号与所述线性级输出音频信号进行处理。
10.一种音频处理方法,其特征在于,包括:
通过一线性处理级,基于一线性处理级设定以线性地处理一输入音频信号,以产生一线性级输出音频信号;
基于(i)所述线性处理级设定与(ii)一预先规定信号品质保存标准,产生一控制信号;以及
遵循所述预先规定信号品质保存标准,以所述控制信号与所述线性级输出音频信号进行处理,以产生一受控音频信号。
11.根据权利要求10所述的音频处理方法,其特征在于,包括在一非线性处理级中接收所述受控音频信号,并通过所述非线性处理级遵循所述预先规定信号品质保存标准处理所述受控音频信号,其中所述预先规定信号品质保存标准用以规定由所述非线性处理级满足的一线性度。
12.根据权利要求10所述的音频处理方法,其特征在于,所述线性处理级包括一数字等化器,其中所述线性处理级设定包括所述数字等化器的各通道的多个调拨增益的一集合,其中控制所述线性级输出音频信号的步骤包括:
识别所述调拨增益之间的一最大增益,且若所述最大增益超过一预定阈值,则通过所述最大增益的函数的值将所述数字等化器的一增益按比例缩小。
13.根据权利要求10所述的音频处理方法,其特征在于,还包括将所述预先规定信号品质保存标准储存于一存储器,并从所述存储器上载所述预先规定信号品质保存标准。
14.根据权利要求10所述的音频处理方法,其特征在于,所述预先规定信号品质保存标准系包含一决策表。
15.根据权利要求10所述的音频处理方法,其特征在于,所述线性处理级包括一数字滤波器,且其中所述线性处理级设定包括所述数字滤波器的一增益设定。
16.根据权利要求10所述的音频处理方法,其特征在于,所述预先规定信号品质保存标准用以规定不得超过的一增益。
17.根据权利要求10所述的音频处理方法,其特征在于,以所述控制信号与所述线性级输出音频信号进行处理的步骤包括将所述线性级输出音频信号乘以所述控制信号。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/984,560 US11317203B2 (en) | 2020-08-04 | 2020-08-04 | System for preventing distortion of original input signal |
US16/984,560 | 2020-08-04 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114095836A true CN114095836A (zh) | 2022-02-25 |
CN114095836B CN114095836B (zh) | 2023-12-05 |
Family
ID=80114383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110793471.2A Active CN114095836B (zh) | 2020-08-04 | 2021-07-14 | 音频处理装置及音频处理方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11317203B2 (zh) |
JP (1) | JP7371065B2 (zh) |
CN (1) | CN114095836B (zh) |
TW (1) | TWI769766B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09102719A (ja) * | 1995-10-03 | 1997-04-15 | Sony Corp | 音響再生装置 |
JP2008187624A (ja) * | 2007-01-31 | 2008-08-14 | Sharp Corp | 音質調整装置及び音質調整方法 |
US20090080675A1 (en) * | 2007-09-21 | 2009-03-26 | Microsoft Corporation | Dynamic bass boost filter |
CN101641965A (zh) * | 2007-03-20 | 2010-02-03 | 日本电气株式会社 | 电子设备用声音处理系统、方法以及便携电话终端 |
CN101727907A (zh) * | 2008-10-29 | 2010-06-09 | 雅马哈株式会社 | 音频处理电路、音频处理装置和音频处理方法 |
CN102104822A (zh) * | 2009-12-18 | 2011-06-22 | 新唐科技股份有限公司 | 音频调整系统与方法 |
CN109561372A (zh) * | 2017-09-25 | 2019-04-02 | 新唐科技股份有限公司 | 音频处理装置及方法 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4701953A (en) | 1984-07-24 | 1987-10-20 | The Regents Of The University Of California | Signal compression system |
FR2599580B1 (fr) | 1986-05-30 | 1988-09-23 | Elison Sarl | Dispositif de reduction du bruit de fond dans une chaine electroacoustique. |
US4739514A (en) | 1986-12-22 | 1988-04-19 | Bose Corporation | Automatic dynamic equalizing |
DE19928420A1 (de) | 1999-06-23 | 2000-12-28 | Micronas Gmbh | Verfahren zur Verarbeitung eines Audiosignals |
US6956914B2 (en) * | 2001-09-19 | 2005-10-18 | Gennum Corporation | Transmit amplitude independent adaptive equalizer |
US7194096B2 (en) | 2003-06-25 | 2007-03-20 | Intel Corporation | Method and apparatus for adaptively pre-shaping audio signal to accommodate loudspeaker characteristics |
RU2279758C2 (ru) | 2004-07-07 | 2006-07-10 | Гарри Романович Аванесян | Адаптивный эквалайзер (варианты) |
CN101048935B (zh) | 2004-10-26 | 2011-03-23 | 杜比实验室特许公司 | 控制音频信号的单位响度或部分单位响度的方法和设备 |
RU2284648C2 (ru) | 2004-11-18 | 2006-09-27 | Гарри Романович Аванесян | Способ автоматической адаптивной частотной коррекции (варианты) |
JP4981123B2 (ja) | 2006-04-04 | 2012-07-18 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ信号の知覚音量及び/又は知覚スペクトルバランスの計算と調整 |
EP1923994B1 (en) | 2006-11-17 | 2008-11-19 | AKG Acoustics GmbH | Audio compressor |
JP4859977B2 (ja) | 2007-02-27 | 2012-01-25 | 富士通株式会社 | 適応等化回路 |
US7663052B2 (en) * | 2007-03-22 | 2010-02-16 | Qualcomm Incorporated | Musical instrument digital interface hardware instruction set |
US8351493B2 (en) | 2008-11-18 | 2013-01-08 | Gennum Corporation | Folding sequential adaptive equalizer |
WO2010138309A1 (en) | 2009-05-26 | 2010-12-02 | Dolby Laboratories Licensing Corporation | Audio signal dynamic equalization processing control |
EP2704143B1 (en) * | 2009-10-21 | 2015-01-07 | Panasonic Intellectual Property Corporation of America | Apparatus, method and computer program for audio signal processing |
US8600076B2 (en) | 2009-11-09 | 2013-12-03 | Neofidelity, Inc. | Multiband DRC system and method for controlling the same |
JP5707963B2 (ja) | 2011-01-20 | 2015-04-30 | ヤマハ株式会社 | オーディオアンプ |
ITTO20120530A1 (it) | 2012-06-19 | 2013-12-20 | Inst Rundfunktechnik Gmbh | Dynamikkompressor |
WO2015143127A1 (en) * | 2014-03-19 | 2015-09-24 | Actiwave Ab | Non-linear control of loudspeakers |
US9626981B2 (en) | 2014-06-25 | 2017-04-18 | Cirrus Logic, Inc. | Systems and methods for compressing a digital signal |
CN106297813A (zh) * | 2015-05-28 | 2017-01-04 | 杜比实验室特许公司 | 分离的音频分析和处理 |
WO2017074321A1 (en) | 2015-10-27 | 2017-05-04 | Ambidio, Inc. | Apparatus and method for sound stage enhancement |
US10468053B2 (en) * | 2015-12-04 | 2019-11-05 | Chromera, Inc. | Verifying messages projected from an intelligent audible device |
GB2549805B (en) * | 2016-04-29 | 2018-10-03 | Cirrus Logic Int Semiconductor Ltd | Audio signals |
TWI590239B (zh) | 2016-12-09 | 2017-07-01 | 宏碁股份有限公司 | 語音信號處理裝置及語音信號處理方法 |
JP7163300B2 (ja) * | 2017-03-09 | 2022-10-31 | アバネラ コーポレイション | リアルタイム音響プロセッサ |
US10755722B2 (en) | 2018-08-29 | 2020-08-25 | Guoguang Electric Company Limited | Multiband audio signal dynamic range compression with overshoot suppression |
CN111048112A (zh) * | 2019-12-04 | 2020-04-21 | 义乌市深研智能科技有限公司 | 一种作业机械远程控制的音频信号线性处理方法 |
-
2020
- 2020-08-04 US US16/984,560 patent/US11317203B2/en active Active
-
2021
- 2021-03-30 TW TW110111585A patent/TWI769766B/zh active
- 2021-07-14 CN CN202110793471.2A patent/CN114095836B/zh active Active
- 2021-07-30 JP JP2021125916A patent/JP7371065B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09102719A (ja) * | 1995-10-03 | 1997-04-15 | Sony Corp | 音響再生装置 |
JP2008187624A (ja) * | 2007-01-31 | 2008-08-14 | Sharp Corp | 音質調整装置及び音質調整方法 |
CN101641965A (zh) * | 2007-03-20 | 2010-02-03 | 日本电气株式会社 | 电子设备用声音处理系统、方法以及便携电话终端 |
US20090080675A1 (en) * | 2007-09-21 | 2009-03-26 | Microsoft Corporation | Dynamic bass boost filter |
CN101727907A (zh) * | 2008-10-29 | 2010-06-09 | 雅马哈株式会社 | 音频处理电路、音频处理装置和音频处理方法 |
CN102104822A (zh) * | 2009-12-18 | 2011-06-22 | 新唐科技股份有限公司 | 音频调整系统与方法 |
CN109561372A (zh) * | 2017-09-25 | 2019-04-02 | 新唐科技股份有限公司 | 音频处理装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
TW202207217A (zh) | 2022-02-16 |
CN114095836B (zh) | 2023-12-05 |
JP2022029438A (ja) | 2022-02-17 |
US20220046356A1 (en) | 2022-02-10 |
US11317203B2 (en) | 2022-04-26 |
JP7371065B2 (ja) | 2023-10-30 |
TWI769766B (zh) | 2022-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2635154C (en) | Feedback limiter with adaptive time control | |
US9985597B2 (en) | Digital compressor for compressing an audio signal | |
EP3100353B1 (en) | An audio compression system for compressing an audio signal | |
US20030216907A1 (en) | Enhancing the aural perception of speech | |
EP2675063B1 (en) | Agc circuit with optimized reference signal energy levels for an echo cancelling circuit | |
CN111966322B (zh) | 音频信号处理方法、装置、设备及存储介质 | |
CN101843115B (zh) | 听觉灵敏度校正装置 | |
JP4016206B2 (ja) | 音声信号処理装置及び音声信号処理方法 | |
US7260209B2 (en) | Methods and apparatus for improving voice quality in an environment with noise | |
US7774079B2 (en) | Method and system for receiving and decoding audio signals | |
CN114095836B (zh) | 音频处理装置及音频处理方法 | |
KR101419433B1 (ko) | 입력 신호에 따라 파라메트릭 이퀄라이저의 게인을 다이나믹하게 조절하는 방법 및 그 방법을 채용한 다이내믹 파라메트릭 이퀄라이저 | |
KR101400865B1 (ko) | 입력 신호에 따라 파라메트릭 이퀄라이저의 게인을 다이나믹하게 조절하는 방법 및 그 방법을 채용한 다이내믹 파라메트릭 이퀄라이저 시스템 | |
US11032642B1 (en) | Combined frequency response and dynamic range correction for loudspeakers | |
JP2574283B2 (ja) | ハウリング防止装置 | |
CN114094992A (zh) | 信号处理装置、信号处理方法、信号处理终端及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |