CN106533379B - 用于处理音频信号的方法和装置 - Google Patents
用于处理音频信号的方法和装置 Download PDFInfo
- Publication number
- CN106533379B CN106533379B CN201610817370.3A CN201610817370A CN106533379B CN 106533379 B CN106533379 B CN 106533379B CN 201610817370 A CN201610817370 A CN 201610817370A CN 106533379 B CN106533379 B CN 106533379B
- Authority
- CN
- China
- Prior art keywords
- audio
- loudness
- maximum
- audio signal
- preparation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000012545 processing Methods 0.000 title claims abstract description 16
- 230000001419 dependent effect Effects 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims 8
- 238000007620 mathematical function Methods 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 210000003027 ear inner Anatomy 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G5/00—Tone control or bandwidth control in amplifiers
- H03G5/16—Automatic control
- H03G5/165—Equalizers; Volume or gain control in limited frequency bands
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/002—Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
本发明涉及一种用于处理音频信号的方法和装置。在根据本发明的用于处理娱乐系统中的音频信号的方法中,来自至少一个音频源的音频信号在娱乐系统回放期间被改变以调整到心理声学响度设置值,其中在各种情形下基于在预定时间间隔内对相关音频源确定的平均心理声学响度最大值而执行该改变。
Description
技术领域
本发明涉及用于处理娱乐系统中的音频信号的方法和装置。
背景技术
娱乐系统当前使用各种不同的音频源。这里每个音频源典型地具有特定音量,该音量由所使用的各硬件、软件和相关音频轨道预定。在改变音频源之后,用户通常被迫调整或重新调整主音量以获得与先前主观感知相同的音量。被称作术语“响度”的感知的音量取决于音频信号的频率、振幅和时间位置。
根据线上维基百科全书,响度是人类音量感知的比例映射量(比照http://www.wikipedia.de标题“Lautheit”[响度],2015年8月3日版)。
响度是心理声学术语,其描述若干测试人员主要评估感知音量的方式。响度取决于声压水平、频谱和声音随时间推移的特性。响度的感知由内耳中声音的处理类型和方式引起。根据神经细胞的激励强度,声音被评估为更大声或更小声。当声音被感知为两倍大时,响度总体是两倍大。
已知用于定量确定响度的标准化测量方法。然而,在本发明的上下文中使用的术语“响度”总体意在被理解为心理声学加权音量,其可以对应于根据标准化测量方法限定的响度(以宋(sone)测量),但也可以利用可选的方法(在适当情况下简化)限定。
在实时处理期间调整音频信号的音量的算法是已知的。然而,这些算法使用均衡器、压缩器或限制器改变相关声音轨道或由于该调整使它们降低动态范围。此外,这种类型的算法通常需要高的处理和存储能力。
关于现有技术,仅以示例的形式参照WO 2013/154823 A2、WO 2004/111994 A2、EP1 805 891 B1、EP 1 629 463 A2、EP 1 835 487 A2和EP 1 763 923 A1。
发明内容
本发明的目标是提供一种用于处理音频信号的方法和装置,其中可以获得在每种情况下对来自不同音频源的音频信号中主观感知的音量或响度的最佳对应效果。
在根据本发明的用于处理娱乐系统中的音频信号的方法中,来自至少一个音频源的音频信号在由娱乐系统回放期间被改变以调整到心理声学响度设置值,其中在每种情况下基于平均心理声学响度最大值执行该改变,平均心理声学响度最大值是在预定时间间隔中针对相关音频源所确定的。
根据一个实施例,来自至少两个不同音频源的音频信号在娱乐系统回放期间被改变以调整到心理声学响度设置值。
本发明尤其基于执行将不同音频源实时调整到心理声学响度设置值的构思。根据本发明的方法尤其基于音频流的实时数据,而不需要知道未来值。而且,来自一个或多个音频源的音频信号在每种情况下被处理,该处理对每种情况下来自其它音频源的音频信号没有依赖性。
根据本发明的方法不需要用于例如由相同音频源回放的不同音乐或歌曲的音量调整。作为替代,来自娱乐系统不同音频源的音频信号的动态调整根据各自最大主观感知的响度而实施。
如上文中已经提到的,术语“响度”表示与用户心理声学感知的音量近似成比例的量。该响度可以根据相关标准计算,但也可以由简化的粗略计算限定。尤其地,可以根据机动车辆中的特定标准而调整用于响度限定所需的频率加权(例如通过将典型的背景噪声谱纳入考虑)。
根据一个实施例,音频信号在每种情况下在改变事件中乘以振幅,该振幅取决于各相关音频源。
根据一个实施例,该振幅在每种情况下计算为响度设置值和平均心理声学响度最大值的商。
根据一个实施例,平均心理声学响度最大值的估算基于针对各音频源存储的响度数据而实施。
本发明还设计用于处理音频信号的装置,其中来自至少一个音频源的音频信号在娱乐系统回放期间可被改变以调整到心理声学响度设置值,其中该装置配置用于实施具有上述特性的方法。关于该装置的优势和有利设计,参照上述与本发明的方法相关作出的陈述。
根据本发明的处理尤其基于长期的信号信息。这通过极端数据简化来实现。由于在通常情况下振幅的变化只是在无内存重写的情况下非常缓慢地进行,因此娱乐系统的听众或用户不能感知到动态音量或响度变化。而且,因此调整过程非常稳定并仅需要相对较低的处理能量。
在下文中使用优选实施例并参照附图更详细地说明本发明。
附图说明
在图中:
图1示出了说明根据本发明用于音量调整的方法的示意图;
图2示出了用于说明使用根据本发明的方法执行的最大响度估算的流程图;
图3示出了用于说明根据图2中的步骤S22的响度限定的可行实施方式;以及
图4示出了根据图2的步骤S29计算平均最大响度的示意性表示。
具体实施方式
根据图1,在根据本发明的用于音量调整的方法中,输入音频信号11通过乘以由源决定和时间决定的振幅15来改变,从而获得输出音频信号16。振幅15由常数计算得出,通过音量设置值(SET)13除以来自音量存储器14的估算平均最大心理声学音量12(在下文中参照图2更详细地说明)得到该常数。为了避免由于振幅15突变所引起的信号失真,振幅值优选地随随时间逐渐减弱。
为了计算振幅,根据本发明的方法尤其需要心理声学音量平均最大值的估算,其中针对该估算实施的过程在下文中参照图2的流程图描述。
此处,估算的平均最大响度在下文被称作EL值(EL=“估算的平均最大响度”)。使用过去可用的各音频源音频信号的音量数据计算EL值。
为了计算EL值,首先根据特定音频轨道的信号频率测量当前响度(图2中步骤S21和S22)。以这种方式测量的响度值被用于确定固定时间间隔内的局部最大值。各当前响度最大值被存储在存储器中,其中在每种情况下根据询问S25(“太大声”?),如果各自存在的EL值超出了限定的公差,那么存储在该存储器中的值在步骤S26中被重写。如果音频轨道的当前响度小于预定值,那么调整在步骤S23(“太小声”?)中暂停。
在每种情况下根据步骤S28获得存储音频轨道响度特性的数据,其依据固定时间间隔内的局部最大值的搜索(步骤S27)。因此存在于存储器中的值包含相关音频源的音频信号的各响度最大值。根据存储的响度最大值计算EL值(步骤S29)。
如果没有可用的以前的音量值(例如由于涉及新的未知音频源)或者如果当前音量大体大于EL值,执行新EL值的快速近似确定。该近似值基于传入音频轨道的新响度最大值。只要发现新的平均最大值,利用该值重写存储器内容并且再次执行根据本发明的计算。
图3示出了用于图2的步骤22中的响度限定的示意性算法的示例。音频轨道(S22a)被细分为单独的频率成分(例如通过傅里叶分析)。在步骤S22b中,心理声学估算滤波器被应用到该离散谱中,例如带通滤波器,该滤波器可以具有向下开放的抛物线形,其在人耳感知最大值处具有最大值。以这种方式获得的加权谱成分的平方被加和并且与步骤S22c中的标准化常数相乘以产生表示当前响度的值(S22d)。除了图3中所示的响度限定之外,也可以想到针对响度限定的各种其它算法。
图4示出了用于确定图2的步骤S29所使用的平均最大响度的可行方法,其仅以示例方式给出。存在于存储器中的音频信号优选——但并非必须——在步骤30细分为单独的框(在该情形中是三个)。在步骤31,函数被应用到单独的区段,函数提供与最大值(对应于步骤S28)接近的值,例如和/或和/或其中意指适用的全部值(mean=平均值,max=最大值并且std=标准偏差)。在32处,“遗忘因子”λ可以可选地被应用到与最大值接近的单独的值,其中0<λ<1。因此,与最近的信号相比,以前的信号被给予较少的权重。最终,在33处,以这种方式获得的值被相加以形成和(如必要,在之前的平方之后)并且因此在34处获得值EL。此外,用于确定EL值的各种其它算法是明显可行的。
Claims (8)
1.一种用于处理娱乐系统中的音频信号的方法,
其特征在于,
在所述娱乐系统回放期间改变来自至少一个音频源的音频信号以调整到心理声学响度设置值,其中在各种情况下基于在预定时间间隔内对相关所述音频源确定的平均心理声学响度最大值(EL)而执行所述改变;
其中,通过以下步骤来计算多个预定时间间隔内的音频信号的平均心理声学响度最大值(EL):
将近似最大值的数学函数应用于与多个时间间隔中的每一个相关联的音频信号,以确定相应的与最大值接近的单独的值;
将基于经过时间而变化的遗忘因子应用于每个与最大值接近的单独的值,以生成时间加权的估计值;以及
对时间加权的估计值求和,以确定平均心理声学响度最大值(EL)。
2.根据权利要求1所述的方法,
其特征在于,
在所述娱乐系统回放期间改变来自至少两个不同音频源的音频信号以调整到心理声学响度设置值。
3.根据权利要求1或2所述的方法,
其特征在于,
所述音频信号(11)在所述改变期间在各情况下乘以取决于相关音频源的振幅(15)。
4.根据权利要求3所述的方法,
其特征在于,
所述振幅(15)在各种情况下计算为所述响度设置值(13)和所述平均心理声学响度最大值(EL)的商。
5.根据权利要求1所述的方法,
其特征在于,
所述音频信号(11)的所述改变在各种情况下基于音频信号数据流的实时数据而执行。
6.根据权利要求1所述的方法,
其特征在于,
来自一个音频源的所述音频信号(11)在所述改变期间在各种情况下与来自不同音频源的音频信号独立地被处理。
7.根据权利要求1所述的方法,
其特征在于,
所述平均心理声学响度最大值(EL)的估算基于针对所述各音频源存储的响度数据而执行。
8.一种用于处理音频信号的装置,
其特征在于,
来自至少一个音频源的音频信号在娱乐系统回放期间被改变以调整到心理声学响度设置值,其中所述装置配置用于实施根据任一上述权利要求所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102015217565.0 | 2015-09-15 | ||
DE102015217565.0A DE102015217565A1 (de) | 2015-09-15 | 2015-09-15 | Verfahren und Vorrichtung zur Verarbeitung von Audio-Signalen |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106533379A CN106533379A (zh) | 2017-03-22 |
CN106533379B true CN106533379B (zh) | 2021-11-30 |
Family
ID=57153239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610817370.3A Active CN106533379B (zh) | 2015-09-15 | 2016-09-12 | 用于处理音频信号的方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9893698B2 (zh) |
EP (1) | EP3190700B1 (zh) |
CN (1) | CN106533379B (zh) |
DE (1) | DE102015217565A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107509153B (zh) * | 2017-08-18 | 2020-01-14 | Oppo广东移动通信有限公司 | 声音播放器件的检测方法、装置、存储介质及终端 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101569092A (zh) * | 2006-12-21 | 2009-10-28 | 皇家飞利浦电子股份有限公司 | 用于处理音频数据的系统 |
CN103248982A (zh) * | 2012-02-01 | 2013-08-14 | 哈曼贝克自动系统股份有限公司 | 基于信号响度调适信号增益时的峰值检测 |
CN103262409A (zh) * | 2010-09-10 | 2013-08-21 | Dts(英属维尔京群岛)有限公司 | 用于改进的感觉的频谱不平衡的音频信号的动态补偿 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BRPI0410740A (pt) | 2003-05-28 | 2006-06-27 | Dolby Lab Licensing Corp | método, aparelho e programa de computador para calcular e ajustar o volume percebido de um sinal de áudio |
EP1835487B1 (en) | 2003-05-28 | 2013-07-10 | Dolby Laboratories Licensing Corporation | Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal |
US20080095385A1 (en) | 2004-06-30 | 2008-04-24 | Koninklijke Philips Electronics, N.V. | Method of and System for Automatically Adjusting the Loudness of an Audio Signal |
MX2007005027A (es) | 2004-10-26 | 2007-06-19 | Dolby Lab Licensing Corp | Calculo y ajuste de la sonoridad percibida y/o el balance espectral percibido de una senal de audio. |
US20070121966A1 (en) * | 2005-11-30 | 2007-05-31 | Microsoft Corporation | Volume normalization device |
US20080025530A1 (en) * | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
US8488811B2 (en) * | 2006-08-09 | 2013-07-16 | Dolby Laboratories Licensing Corporation | Audio-peak limiting in slow and fast stages |
US8213624B2 (en) * | 2007-06-19 | 2012-07-03 | Dolby Laboratories Licensing Corporation | Loudness measurement with spectral modifications |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
US9685921B2 (en) * | 2012-07-12 | 2017-06-20 | Dts, Inc. | Loudness control with noise detection and loudness drop detection |
EP2833549B1 (en) * | 2013-08-01 | 2016-04-06 | EchoStar UK Holdings Limited | Loudness level control for audio reception and decoding equipment |
US9391575B1 (en) * | 2013-12-13 | 2016-07-12 | Amazon Technologies, Inc. | Adaptive loudness control |
-
2015
- 2015-09-15 DE DE102015217565.0A patent/DE102015217565A1/de not_active Ceased
-
2016
- 2016-08-19 EP EP16184883.3A patent/EP3190700B1/de active Active
- 2016-09-12 CN CN201610817370.3A patent/CN106533379B/zh active Active
- 2016-09-14 US US15/265,227 patent/US9893698B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101569092A (zh) * | 2006-12-21 | 2009-10-28 | 皇家飞利浦电子股份有限公司 | 用于处理音频数据的系统 |
CN103262409A (zh) * | 2010-09-10 | 2013-08-21 | Dts(英属维尔京群岛)有限公司 | 用于改进的感觉的频谱不平衡的音频信号的动态补偿 |
CN103248982A (zh) * | 2012-02-01 | 2013-08-14 | 哈曼贝克自动系统股份有限公司 | 基于信号响度调适信号增益时的峰值检测 |
Also Published As
Publication number | Publication date |
---|---|
EP3190700B1 (de) | 2020-10-07 |
DE102015217565A1 (de) | 2017-03-16 |
US20170077889A1 (en) | 2017-03-16 |
EP3190700A1 (de) | 2017-07-12 |
US9893698B2 (en) | 2018-02-13 |
CN106533379A (zh) | 2017-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9768750B2 (en) | Audio control using auditory event detection | |
EP1629463B1 (en) | Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal | |
EP2614586B1 (en) | Dynamic compensation of audio signals for improved perceived spectral imbalances | |
AU2011244268B2 (en) | Apparatus and method for modifying an input audio signal | |
US7333618B2 (en) | Ambient noise sound level compensation | |
CA2827326C (en) | Apparatus and method for determining a measure for a perceived level of reverberation, audio processor and method for processing a signal | |
EP2262108B1 (en) | Adjusting the perceived loudness and/or the perceived spectral balance of an audio signal | |
US8761415B2 (en) | Controlling the loudness of an audio signal in response to spectral localization | |
AU2011244268A1 (en) | Apparatus and method for modifying an input audio signal | |
EP2002429A1 (en) | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal | |
TW201123176A (en) | Adjusting the loudness of an audio signal with perceived spectral balance preservation | |
CN106533379B (zh) | 用于处理音频信号的方法和装置 | |
EP1835487B1 (en) | Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal | |
WO2006000215A1 (en) | Method of evaluating perception intensity of an audio signal and a method of controlling an input audio signal on the basis of the evaluation | |
Zhu et al. | Relative Contribution of Frequency and Parameter Values to Selectivity for Interaural Correlation | |
Ule et al. | Description of the multiple look approach for calculating unsteady loudness |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |