CN106533379B - 用于处理音频信号的方法和装置 - Google Patents

用于处理音频信号的方法和装置 Download PDF

Info

Publication number
CN106533379B
CN106533379B CN201610817370.3A CN201610817370A CN106533379B CN 106533379 B CN106533379 B CN 106533379B CN 201610817370 A CN201610817370 A CN 201610817370A CN 106533379 B CN106533379 B CN 106533379B
Authority
CN
China
Prior art keywords
audio
loudness
maximum
audio signal
preparation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610817370.3A
Other languages
English (en)
Other versions
CN106533379A (zh
Inventor
马尔科·贝尔夫
比约恩·雅各布斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ford Global Technologies LLC
Original Assignee
Ford Global Technologies LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ford Global Technologies LLC filed Critical Ford Global Technologies LLC
Publication of CN106533379A publication Critical patent/CN106533379A/zh
Application granted granted Critical
Publication of CN106533379B publication Critical patent/CN106533379B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

本发明涉及一种用于处理音频信号的方法和装置。在根据本发明的用于处理娱乐系统中的音频信号的方法中,来自至少一个音频源的音频信号在娱乐系统回放期间被改变以调整到心理声学响度设置值,其中在各种情形下基于在预定时间间隔内对相关音频源确定的平均心理声学响度最大值而执行该改变。

Description

用于处理音频信号的方法和装置
技术领域
本发明涉及用于处理娱乐系统中的音频信号的方法和装置。
背景技术
娱乐系统当前使用各种不同的音频源。这里每个音频源典型地具有特定音量,该音量由所使用的各硬件、软件和相关音频轨道预定。在改变音频源之后,用户通常被迫调整或重新调整主音量以获得与先前主观感知相同的音量。被称作术语“响度”的感知的音量取决于音频信号的频率、振幅和时间位置。
根据线上维基百科全书,响度是人类音量感知的比例映射量(比照http://www.wikipedia.de标题“Lautheit”[响度],2015年8月3日版)。
响度是心理声学术语,其描述若干测试人员主要评估感知音量的方式。响度取决于声压水平、频谱和声音随时间推移的特性。响度的感知由内耳中声音的处理类型和方式引起。根据神经细胞的激励强度,声音被评估为更大声或更小声。当声音被感知为两倍大时,响度总体是两倍大。
已知用于定量确定响度的标准化测量方法。然而,在本发明的上下文中使用的术语“响度”总体意在被理解为心理声学加权音量,其可以对应于根据标准化测量方法限定的响度(以宋(sone)测量),但也可以利用可选的方法(在适当情况下简化)限定。
在实时处理期间调整音频信号的音量的算法是已知的。然而,这些算法使用均衡器、压缩器或限制器改变相关声音轨道或由于该调整使它们降低动态范围。此外,这种类型的算法通常需要高的处理和存储能力。
关于现有技术,仅以示例的形式参照WO 2013/154823 A2、WO 2004/111994 A2、EP1 805 891 B1、EP 1 629 463 A2、EP 1 835 487 A2和EP 1 763 923 A1。
发明内容
本发明的目标是提供一种用于处理音频信号的方法和装置,其中可以获得在每种情况下对来自不同音频源的音频信号中主观感知的音量或响度的最佳对应效果。
在根据本发明的用于处理娱乐系统中的音频信号的方法中,来自至少一个音频源的音频信号在由娱乐系统回放期间被改变以调整到心理声学响度设置值,其中在每种情况下基于平均心理声学响度最大值执行该改变,平均心理声学响度最大值是在预定时间间隔中针对相关音频源所确定的。
根据一个实施例,来自至少两个不同音频源的音频信号在娱乐系统回放期间被改变以调整到心理声学响度设置值。
本发明尤其基于执行将不同音频源实时调整到心理声学响度设置值的构思。根据本发明的方法尤其基于音频流的实时数据,而不需要知道未来值。而且,来自一个或多个音频源的音频信号在每种情况下被处理,该处理对每种情况下来自其它音频源的音频信号没有依赖性。
根据本发明的方法不需要用于例如由相同音频源回放的不同音乐或歌曲的音量调整。作为替代,来自娱乐系统不同音频源的音频信号的动态调整根据各自最大主观感知的响度而实施。
如上文中已经提到的,术语“响度”表示与用户心理声学感知的音量近似成比例的量。该响度可以根据相关标准计算,但也可以由简化的粗略计算限定。尤其地,可以根据机动车辆中的特定标准而调整用于响度限定所需的频率加权(例如通过将典型的背景噪声谱纳入考虑)。
根据一个实施例,音频信号在每种情况下在改变事件中乘以振幅,该振幅取决于各相关音频源。
根据一个实施例,该振幅在每种情况下计算为响度设置值和平均心理声学响度最大值的商。
根据一个实施例,平均心理声学响度最大值的估算基于针对各音频源存储的响度数据而实施。
本发明还设计用于处理音频信号的装置,其中来自至少一个音频源的音频信号在娱乐系统回放期间可被改变以调整到心理声学响度设置值,其中该装置配置用于实施具有上述特性的方法。关于该装置的优势和有利设计,参照上述与本发明的方法相关作出的陈述。
根据本发明的处理尤其基于长期的信号信息。这通过极端数据简化来实现。由于在通常情况下振幅的变化只是在无内存重写的情况下非常缓慢地进行,因此娱乐系统的听众或用户不能感知到动态音量或响度变化。而且,因此调整过程非常稳定并仅需要相对较低的处理能量。
在下文中使用优选实施例并参照附图更详细地说明本发明。
附图说明
在图中:
图1示出了说明根据本发明用于音量调整的方法的示意图;
图2示出了用于说明使用根据本发明的方法执行的最大响度估算的流程图;
图3示出了用于说明根据图2中的步骤S22的响度限定的可行实施方式;以及
图4示出了根据图2的步骤S29计算平均最大响度的示意性表示。
具体实施方式
根据图1,在根据本发明的用于音量调整的方法中,输入音频信号11通过乘以由源决定和时间决定的振幅15来改变,从而获得输出音频信号16。振幅15由常数计算得出,通过音量设置值(SET)13除以来自音量存储器14的估算平均最大心理声学音量12(在下文中参照图2更详细地说明)得到该常数。为了避免由于振幅15突变所引起的信号失真,振幅值优选地随随时间逐渐减弱。
为了计算振幅,根据本发明的方法尤其需要心理声学音量平均最大值的估算,其中针对该估算实施的过程在下文中参照图2的流程图描述。
此处,估算的平均最大响度在下文被称作EL值(EL=“估算的平均最大响度”)。使用过去可用的各音频源音频信号的音量数据计算EL值。
为了计算EL值,首先根据特定音频轨道的信号频率测量当前响度(图2中步骤S21和S22)。以这种方式测量的响度值被用于确定固定时间间隔内的局部最大值。各当前响度最大值被存储在存储器中,其中在每种情况下根据询问S25(“太大声”?),如果各自存在的EL值超出了限定的公差,那么存储在该存储器中的值在步骤S26中被重写。如果音频轨道的当前响度小于预定值,那么调整在步骤S23(“太小声”?)中暂停。
在每种情况下根据步骤S28获得存储音频轨道响度特性的数据,其依据固定时间间隔内的局部最大值的搜索(步骤S27)。因此存在于存储器中的值包含相关音频源的音频信号的各响度最大值。根据存储的响度最大值计算EL值(步骤S29)。
如果没有可用的以前的音量值(例如由于涉及新的未知音频源)或者如果当前音量大体大于EL值,执行新EL值的快速近似确定。该近似值基于传入音频轨道的新响度最大值。只要发现新的平均最大值,利用该值重写存储器内容并且再次执行根据本发明的计算。
图3示出了用于图2的步骤22中的响度限定的示意性算法的示例。音频轨道(S22a)被细分为单独的频率成分(例如通过傅里叶分析)。在步骤S22b中,心理声学估算滤波器被应用到该离散谱中,例如带通滤波器,该滤波器可以具有向下开放的抛物线形,其在人耳感知最大值处具有最大值。以这种方式获得的加权谱成分的平方被加和并且与步骤S22c中的标准化常数相乘以产生表示当前响度的值(S22d)。除了图3中所示的响度限定之外,也可以想到针对响度限定的各种其它算法。
图4示出了用于确定图2的步骤S29所使用的平均最大响度的可行方法,其仅以示例方式给出。存在于存储器中的音频信号优选——但并非必须——在步骤30细分为单独的框(在该情形中是三个)。在步骤31,函数
Figure GDA0003185310700000051
被应用到单独的区段,函数
Figure GDA0003185310700000052
提供与最大值(对应于步骤S28)接近的值,例如
Figure GDA0003185310700000053
和/或
Figure GDA0003185310700000054
和/或
Figure GDA0003185310700000055
其中
Figure GDA0003185310700000056
意指
Figure GDA0003185310700000057
适用的全部值(mean=平均值,max=最大值并且std=标准偏差)。在32处,“遗忘因子”λ可以可选地被应用到与最大值接近的单独的值,其中0<λ<1。因此,与最近的信号相比,以前的信号被给予较少的权重。最终,在33处,以这种方式获得的值被相加以形成和(如必要,在之前的平方之后)并且因此在34处获得值EL。此外,用于确定EL值的各种其它算法是明显可行的。

Claims (8)

1.一种用于处理娱乐系统中的音频信号的方法,
其特征在于,
在所述娱乐系统回放期间改变来自至少一个音频源的音频信号以调整到心理声学响度设置值,其中在各种情况下基于在预定时间间隔内对相关所述音频源确定的平均心理声学响度最大值(EL)而执行所述改变;
其中,通过以下步骤来计算多个预定时间间隔内的音频信号的平均心理声学响度最大值(EL):
将近似最大值的数学函数应用于与多个时间间隔中的每一个相关联的音频信号,以确定相应的与最大值接近的单独的值;
将基于经过时间而变化的遗忘因子应用于每个与最大值接近的单独的值,以生成时间加权的估计值;以及
对时间加权的估计值求和,以确定平均心理声学响度最大值(EL)。
2.根据权利要求1所述的方法,
其特征在于,
在所述娱乐系统回放期间改变来自至少两个不同音频源的音频信号以调整到心理声学响度设置值。
3.根据权利要求1或2所述的方法,
其特征在于,
所述音频信号(11)在所述改变期间在各情况下乘以取决于相关音频源的振幅(15)。
4.根据权利要求3所述的方法,
其特征在于,
所述振幅(15)在各种情况下计算为所述响度设置值(13)和所述平均心理声学响度最大值(EL)的商。
5.根据权利要求1所述的方法,
其特征在于,
所述音频信号(11)的所述改变在各种情况下基于音频信号数据流的实时数据而执行。
6.根据权利要求1所述的方法,
其特征在于,
来自一个音频源的所述音频信号(11)在所述改变期间在各种情况下与来自不同音频源的音频信号独立地被处理。
7.根据权利要求1所述的方法,
其特征在于,
所述平均心理声学响度最大值(EL)的估算基于针对所述各音频源存储的响度数据而执行。
8.一种用于处理音频信号的装置,
其特征在于,
来自至少一个音频源的音频信号在娱乐系统回放期间被改变以调整到心理声学响度设置值,其中所述装置配置用于实施根据任一上述权利要求所述的方法。
CN201610817370.3A 2015-09-15 2016-09-12 用于处理音频信号的方法和装置 Active CN106533379B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102015217565.0 2015-09-15
DE102015217565.0A DE102015217565A1 (de) 2015-09-15 2015-09-15 Verfahren und Vorrichtung zur Verarbeitung von Audio-Signalen

Publications (2)

Publication Number Publication Date
CN106533379A CN106533379A (zh) 2017-03-22
CN106533379B true CN106533379B (zh) 2021-11-30

Family

ID=57153239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610817370.3A Active CN106533379B (zh) 2015-09-15 2016-09-12 用于处理音频信号的方法和装置

Country Status (4)

Country Link
US (1) US9893698B2 (zh)
EP (1) EP3190700B1 (zh)
CN (1) CN106533379B (zh)
DE (1) DE102015217565A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107509153B (zh) * 2017-08-18 2020-01-14 Oppo广东移动通信有限公司 声音播放器件的检测方法、装置、存储介质及终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101569092A (zh) * 2006-12-21 2009-10-28 皇家飞利浦电子股份有限公司 用于处理音频数据的系统
CN103248982A (zh) * 2012-02-01 2013-08-14 哈曼贝克自动系统股份有限公司 基于信号响度调适信号增益时的峰值检测
CN103262409A (zh) * 2010-09-10 2013-08-21 Dts(英属维尔京群岛)有限公司 用于改进的感觉的频谱不平衡的音频信号的动态补偿

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0410740A (pt) 2003-05-28 2006-06-27 Dolby Lab Licensing Corp método, aparelho e programa de computador para calcular e ajustar o volume percebido de um sinal de áudio
EP1835487B1 (en) 2003-05-28 2013-07-10 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
US20080095385A1 (en) 2004-06-30 2008-04-24 Koninklijke Philips Electronics, N.V. Method of and System for Automatically Adjusting the Loudness of an Audio Signal
MX2007005027A (es) 2004-10-26 2007-06-19 Dolby Lab Licensing Corp Calculo y ajuste de la sonoridad percibida y/o el balance espectral percibido de una senal de audio.
US20070121966A1 (en) * 2005-11-30 2007-05-31 Microsoft Corporation Volume normalization device
US20080025530A1 (en) * 2006-07-26 2008-01-31 Sony Ericsson Mobile Communications Ab Method and apparatus for normalizing sound playback loudness
US8488811B2 (en) * 2006-08-09 2013-07-16 Dolby Laboratories Licensing Corporation Audio-peak limiting in slow and fast stages
US8213624B2 (en) * 2007-06-19 2012-07-03 Dolby Laboratories Licensing Corporation Loudness measurement with spectral modifications
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US9685921B2 (en) * 2012-07-12 2017-06-20 Dts, Inc. Loudness control with noise detection and loudness drop detection
EP2833549B1 (en) * 2013-08-01 2016-04-06 EchoStar UK Holdings Limited Loudness level control for audio reception and decoding equipment
US9391575B1 (en) * 2013-12-13 2016-07-12 Amazon Technologies, Inc. Adaptive loudness control

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101569092A (zh) * 2006-12-21 2009-10-28 皇家飞利浦电子股份有限公司 用于处理音频数据的系统
CN103262409A (zh) * 2010-09-10 2013-08-21 Dts(英属维尔京群岛)有限公司 用于改进的感觉的频谱不平衡的音频信号的动态补偿
CN103248982A (zh) * 2012-02-01 2013-08-14 哈曼贝克自动系统股份有限公司 基于信号响度调适信号增益时的峰值检测

Also Published As

Publication number Publication date
EP3190700B1 (de) 2020-10-07
DE102015217565A1 (de) 2017-03-16
US20170077889A1 (en) 2017-03-16
EP3190700A1 (de) 2017-07-12
US9893698B2 (en) 2018-02-13
CN106533379A (zh) 2017-03-22

Similar Documents

Publication Publication Date Title
US9768750B2 (en) Audio control using auditory event detection
EP1629463B1 (en) Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
EP2614586B1 (en) Dynamic compensation of audio signals for improved perceived spectral imbalances
AU2011244268B2 (en) Apparatus and method for modifying an input audio signal
US7333618B2 (en) Ambient noise sound level compensation
CA2827326C (en) Apparatus and method for determining a measure for a perceived level of reverberation, audio processor and method for processing a signal
EP2262108B1 (en) Adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8761415B2 (en) Controlling the loudness of an audio signal in response to spectral localization
AU2011244268A1 (en) Apparatus and method for modifying an input audio signal
EP2002429A1 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TW201123176A (en) Adjusting the loudness of an audio signal with perceived spectral balance preservation
CN106533379B (zh) 用于处理音频信号的方法和装置
EP1835487B1 (en) Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
WO2006000215A1 (en) Method of evaluating perception intensity of an audio signal and a method of controlling an input audio signal on the basis of the evaluation
Zhu et al. Relative Contribution of Frequency and Parameter Values to Selectivity for Interaural Correlation
Ule et al. Description of the multiple look approach for calculating unsteady loudness

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant