CN109473115B - 数字音频信号音量等响度调节方法 - Google Patents

数字音频信号音量等响度调节方法 Download PDF

Info

Publication number
CN109473115B
CN109473115B CN201811399852.7A CN201811399852A CN109473115B CN 109473115 B CN109473115 B CN 109473115B CN 201811399852 A CN201811399852 A CN 201811399852A CN 109473115 B CN109473115 B CN 109473115B
Authority
CN
China
Prior art keywords
loudness
audio signal
frame
frequency
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811399852.7A
Other languages
English (en)
Other versions
CN109473115A (zh
Inventor
周杨
刘传银
李长生
刘贤洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN201811399852.7A priority Critical patent/CN109473115B/zh
Publication of CN109473115A publication Critical patent/CN109473115A/zh
Application granted granted Critical
Publication of CN109473115B publication Critical patent/CN109473115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

本发明涉及音频信号处理技术领域,公开了一种数字音频信号音量等响度调节方法,通过对音频中不同频率成分施加不同增益,使得不同成分在音量调节后具有相同的响度改变量。本发明首先根据等响曲线构造单位响度改变量条件下不同频率声音与其所需的声压改变量之间的映射关系;其次,对音频信号分帧,并对各帧计算其DFT得到幅值谱和相位谱。再次,结合音量调节值和频率‑声压改变量映射关系,计算幅值谱中各个频率点的增益,并将增益与对应频率点幅值相乘;然后,利用施加了增益的幅值谱和原相位谱计算IDFT得到音量调节后的音频帧;最后,将得到的音频帧依次重叠拼接获得音量调节后的完整音频信号。本发明适用于音频信号处理。

Description

数字音频信号音量等响度调节方法
技术领域
本发明涉及音频信号处理技术领域,特别涉及数字音频信号音量等响度调节方法。
背景技术
响度,是人类主观感觉到的声音强弱程度。一般而言,声音频率一定,声强越强,响度也越大。但是,响度与频率有关,相同的声强,频率不同,响度也可能不同。经大量实验测得的在典型听者认为响度相同条件下声音频率与声压级的关系即等响曲线图,充分刻画了人耳对不同频率声音的感知灵敏度,如图1(GB-T 4963-2007/ISO 226:2003附录A”自由场测听条件下纯音标准等响度级曲线”)所示。
音频信号音量调节目标即在于改变音频信号响度大小。常规数字音频音量调节方式通常是等增益的,即所有信号采样值通过乘以一个增益系数使音量放大或者缩小。这种方式使得音频中低、中、高不同频率成分以相同比例进行幅值缩放。然而,由等响曲线可知人耳对不同频率成分的响应灵敏度并不相同,如果采用等增益方式缩放音量,即所有频率成分施加相同声压改变量,则可能导致人耳对音频中某些频率成分的响度感受变差,进而影响对这些成分的感知和判断。例如,对于采集的心音、肺音等生理音频信号,如果采用等增益方式增大信号音量,可能使得医务人员对于某些心肺疾病引起的微弱低频杂音成分无法感知和分辨。
发明内容
本发明要解决的技术问题是:提供一种数字音频信号音量等响度调节方法,通过对音频中不同频率成分施加不同增益,使得不同成分在音量调节后具有相同的响度改变量。
为解决上述问题,本发明采用的技术方案是:数字音频信号音量等响度调节方法,包括如下步骤:
步骤1:根据等响曲线构造单位响度改变量条件下不同频率声音与其所需的声压改变量之间的映射关系;
步骤2:对音频信号分帧,并对各帧计算其离散傅里叶变换得到幅值谱和相位谱;
步骤3:结合音量调节值和频率-声压改变量映射关系,计算幅值谱中各个频率点的增益,并将增益与对应频率点幅值相乘;
步骤4:利用施加了增益的幅值谱和原相位谱计算离散傅里叶逆变换得到音量调节后的音频帧;
步骤5:将得到的音频帧依次重叠拼接获得音量调节后的完整音频信号。
进一步的,步骤1可通过以下公式计算单位响度改变量条件下不同频率对应的声压改变量:
Figure BDA0001876076440000021
其中,i表示频率;spl_h表示响度级为80phon的等响曲线对应的映射;spl_l表示响度级为20phon的等响曲线对应的映射。从数据覆盖范围的角度选择20phon和80phon对应的等响曲线来计算声压改变量Δspl是较为合理的。
进一步的,步骤2采用重叠分帧的方式将信号分割为若干帧,重叠分帧时,帧长度frame_len根据以下公式取值:
Figure BDA0001876076440000022
其中,fs为信号采样频率,N为正整数。根据心理声学理论,单帧持续时间取300毫秒左右为宜,本发明优选250-300毫秒。
进一步的,步骤3在对各帧计算其离散傅里叶变换得到幅值谱和相位谱之前,还包括:对单帧时域信号加窗。通过加窗处理可以减少DFT变换时的频谱泄漏,本发明在对单帧时域信号加窗时优选汉宁窗,重叠分帧时,帧重叠长度取值为帧长度的一半。
进一步的,步骤3中,增益按以下公式计算:
Figure BDA0001876076440000023
其中,g(i)表示幅值谱中频率i对应的增益,k为音量调节值,Δspl(i)为幅值谱中频率i对应的声压改变量。
本发明的有益效果是:本发明基于人类听觉的等响曲线,对音频信号中的不同频率成分施加不同的增益,从而实现等响度的音量调节,从而克服音量线性调节(即所有频率成分施加相同的增益)导致人耳对信号中不同频率成分的响度感受不一致。
附图说明
图1为等响曲线图,声压级以分贝(dB)为单位,响度级以方(phon)为单位,频率以赫兹(Hz)为单位。自由场测听条件下听阈Tf由短划线表示。图中点线表示缺少该数据。
图2为频率--声压改变量映射关系,即为了获得单位响度改变量,不同频率声音与其所需的声压级改变量之间的映射关系。
图3为实施例的流程图。
具体实施方式
为了克服现有技术的上述不足,本发明提供了一种数字音频信号音量等响度调节方法。该方法能够使音频信号中不同频率成分在音量调节后具有相同的响度改变量,有助于人耳对音频信号中响度较小的频率成分的感知。该方法首先根据等响曲线构造单位响度改变量条件下不同频率声音与其所需的声压改变量之间的映射关系。其次,对音频信号分帧,并对各帧计算其DFT(离散傅里叶变换)得到幅值谱和相位谱。再次,结合音量调节值和频率-声压改变量映射关系,计算幅值谱中各个频率点的增益,并将增益与对应频率点幅值相乘。然后,利用施加了增益的幅值谱和原相位谱计算IDFT(离散傅里叶逆变换)得到音量调节后的音频帧。最后,将得到的音频帧依次重叠拼接获得音量调节后的完整音频信号。
以下通过实施例对本发明做进一步说明。
实施例提供一种数字音频信号音量等响度调节方法,如图3所示,其具体步骤如下:
第一步,构造频率--声压改变量映射关系。
基于等响曲线(如图1)并根据以下式(1)计算单位响度改变量条件下不同频率对应的声压改变量:
Figure BDA0001876076440000031
其中,i表示频率;Δspl(i)为幅值谱中频率i对应的声压改变量;spl_h表示响度级为80phon的等响曲线对应的映射;spl_l表示响度级为20phon的等响曲线对应的映射。计算得到的频率--声压改变量映射关系如图2所示。需要说明的是,从数据覆盖范围的角度选择20phon和80phon对应的等响曲线来计算声压改变量Δspl是较为合理的。
第二步,音频信号分帧。
采用重叠分帧的方式将信号分割为若干帧。令帧长度为frame_len,帧重叠长度为overlap_len。信号分帧时,根据心理声学理论,单帧持续时间取300毫秒左右为宜,实施例优选250-300毫秒。
为提高下一阶段计算效率,帧长度frame_len根据式(2)取值:
Figure BDA0001876076440000032
即其取值为距离0.3*fs最近的2的整数幂,其中fs为信号采样频率,N为正整数。
重叠分帧是指相邻两帧中前一帧的尾部overlap_len个数据与后一帧的首部overlap_len个数据是一致的。在第三步段信号加窗选择汉宁窗(hanning)时,优选地,帧重叠长度overlap_len取值为frame_len/2,即帧长度的一半。
第三步,单帧信号调节。
首先,对单帧时域信号加窗。其次,对加窗后的信号进行DFT得到其幅值谱和相位谱。再次,结合音量调节值和频率-声压改变量映射关系,计算幅值谱中各个频率点的增益,并将增益与对应频率点幅值相乘。然后,利用施加了增益的幅值谱和原相位谱进行IDFT得到音量调节后的音频帧。
需要说明的是,通过加窗处理可以减少DFT变换时的频谱泄漏,窗函数优选hanning窗。
进一步的,上述步骤三中增益按式(3)计算:
Figure BDA0001876076440000041
式中g(i)表示幅值谱中频率i对应的增益,k为音量调节值,Δspl(i)为幅值谱中频率i对应的声压改变量。k的取值可根据应用场景对音量缩放程度不同而不同,例如,k取自[-40,40]且当Δspl约为1时,增益g的取值大约在[0.01,100]范围内。式(3)推导过程如下:
设有频率为i Hz的信号,其声压级Li与其信号电平峰值Vi的关系满足式(4):
Figure BDA0001876076440000042
式中Vref为参考电平幅值。令通过施加电平增益g(i),使该信号响度改变k个响度级,则有:
Figure BDA0001876076440000043
则由式(5)可推导出式(3)。
第四步,音频帧拼接。
将第三步中调节后的音频帧依次重叠拼接得到完整的音频信号。其重叠方法为,将前一帧信号尾部overlap_len个数据与后一帧的首部overlap_len个数据对齐两两数值相加。

Claims (6)

1.数字音频信号音量等响度调节方法,其特征在于,包括如下步骤:
步骤1:根据等响曲线构造单位响度改变量条件下不同频率声音与其所需的声压改变量之间的映射关系,利用映射关系计算单位响度改变量条件下不同频率对应的声压改变量Δspl;
步骤2:对音频信号分帧,并对各帧计算其离散傅里叶变换得到幅值谱和相位谱;
步骤3:结合音量调节值和不同频率对应的声压改变量,计算幅值谱中各个频率点的增益,增益按以下公式计算:
Figure FDA0003506798010000011
其中,g(i)表示幅值谱中频率i对应的增益,k为音量调节值,Δspl(i)为幅值谱中频率i对应的声压改变量,并将增益与对应频率点幅值相乘;
步骤4:利用施加了增益的幅值谱和原相位谱计算离散傅里叶逆变换得到音量调节后的音频帧;
步骤5:将得到的音频帧依次重叠拼接获得音量调节后的完整音频信号。
2.如权利要求1所述的数字音频信号音量等响度调节方法,其特征在于,步骤1通过以下公式计算单位响度改变量条件下不同频率对应的声压改变量:
Figure FDA0003506798010000012
其中,i表示频率;spl_h表示响度级为80phon的等响曲线对应的映射;spl_l表示响度级为20phon的等响曲线对应的映射。
3.如权利要求1所述的数字音频信号音量等响度调节方法,其特征在于,步骤2采用重叠分帧的方式将信号分割为若干帧,重叠分帧时,帧长度frame_len根据以下公式取值:
Figure FDA0003506798010000013
其中,fs为信号采样频率,N为正整数。
4.如权利要求3所述的数字音频信号音量等响度调节方法,其特征在于,重叠分帧时,单帧持续时间250-300毫秒。
5.如权利要求3所述的数字音频信号音量等响度调节方法,其特征在于,步骤3在对各帧计算其离散傅里叶变换得到幅值谱和相位谱之前,还包括:对单帧时域信号加窗。
6.如权利要求5所述的数字音频信号音量等响度调节方法,其特征在于,对单帧时域信号加窗时选择汉宁窗,重叠分帧时,帧重叠长度取值为帧长度的一半。
CN201811399852.7A 2018-11-22 2018-11-22 数字音频信号音量等响度调节方法 Active CN109473115B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811399852.7A CN109473115B (zh) 2018-11-22 2018-11-22 数字音频信号音量等响度调节方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811399852.7A CN109473115B (zh) 2018-11-22 2018-11-22 数字音频信号音量等响度调节方法

Publications (2)

Publication Number Publication Date
CN109473115A CN109473115A (zh) 2019-03-15
CN109473115B true CN109473115B (zh) 2022-04-12

Family

ID=65673211

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811399852.7A Active CN109473115B (zh) 2018-11-22 2018-11-22 数字音频信号音量等响度调节方法

Country Status (1)

Country Link
CN (1) CN109473115B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109917458B (zh) * 2019-04-16 2020-03-06 成都理工大学 油气分析方法及装置
CN110491366B (zh) * 2019-07-02 2021-11-09 招联消费金融有限公司 音频平滑处理方法、装置、计算机设备和存储介质
CN111966322A (zh) * 2020-08-31 2020-11-20 广州视源电子科技股份有限公司 音频信号处理方法、装置、设备及存储介质
CN111970628B (zh) * 2020-08-31 2022-03-08 广州视源电子科技股份有限公司 音频信号的增强方法、装置、存储介质和处理器
CN113849149A (zh) * 2020-10-19 2021-12-28 广东朝歌智慧互联科技有限公司 应用于蓝牙终端的等响度音量调节方法、装置和电子设备
CN112040373B (zh) * 2020-11-02 2021-04-23 统信软件技术有限公司 一种音频数据处理方法、计算设备及可读存储介质
CN112614503A (zh) * 2020-12-14 2021-04-06 北京远鉴信息技术有限公司 心音信号的处理方法、装置、电子设备及可读存储介质
CN113472938B (zh) * 2021-08-23 2023-06-30 Oppo广东移动通信有限公司 音频控制方法及装置、终端和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2188986A1 (en) * 2007-08-16 2010-05-26 DTS, Inc. Audio processing for compressed digital television
CN102378085A (zh) * 2010-08-21 2012-03-14 比亚迪股份有限公司 基于等响曲线的响度补偿方法、补偿装置及音频处理系统
CN102915741A (zh) * 2012-10-29 2013-02-06 上海大学 基于等响曲线的根据音量调整自动还原声音信号音色的方法
CN105228069A (zh) * 2015-09-28 2016-01-06 南京工程学院 一种基于声压级分段的数字助听器宽动态压缩方法
CN107333076A (zh) * 2017-06-26 2017-11-07 青岛海信电器股份有限公司 电视机及其音频信号中频点数据的调整方法、装置
CN109040885A (zh) * 2017-06-09 2018-12-18 中国科学院声学研究所 一种基于音量的个性化响度补偿方法及耳机均衡系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130136282A1 (en) * 2011-11-30 2013-05-30 David McClain System and Method for Spectral Personalization of Sound

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2188986A1 (en) * 2007-08-16 2010-05-26 DTS, Inc. Audio processing for compressed digital television
CN102378085A (zh) * 2010-08-21 2012-03-14 比亚迪股份有限公司 基于等响曲线的响度补偿方法、补偿装置及音频处理系统
CN102915741A (zh) * 2012-10-29 2013-02-06 上海大学 基于等响曲线的根据音量调整自动还原声音信号音色的方法
CN105228069A (zh) * 2015-09-28 2016-01-06 南京工程学院 一种基于声压级分段的数字助听器宽动态压缩方法
CN109040885A (zh) * 2017-06-09 2018-12-18 中国科学院声学研究所 一种基于音量的个性化响度补偿方法及耳机均衡系统
CN107333076A (zh) * 2017-06-26 2017-11-07 青岛海信电器股份有限公司 电视机及其音频信号中频点数据的调整方法、装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
竺增宝 ; 刘佩林.车载音频系统的自动增益补偿设计.《电子技术应用》.2015, *

Also Published As

Publication number Publication date
CN109473115A (zh) 2019-03-15

Similar Documents

Publication Publication Date Title
CN109473115B (zh) 数字音频信号音量等响度调节方法
US11296668B2 (en) Methods and apparatus for adjusting a level of an audio signal
EP2002429B1 (en) Controlling a perceived loudness characteristic of an audio signal
US8199933B2 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8976974B2 (en) Sound tuning system
US9672834B2 (en) Dynamic range compression with low distortion for use in hearing aids and audio systems
US9431982B1 (en) Loudness learning and balancing system
US9647624B2 (en) Adaptive loudness levelling method for digital audio signals in frequency domain
US20110251704A1 (en) Adaptive environmental noise compensation for audio playback
Zorilă et al. Effectiveness of a loudness model for time-varying sounds in equating the loudness of sentences subjected to different forms of signal processing
EP3595172B1 (en) Systems and methods for processing an audio signal for replay on an audio device
CN116168719A (zh) 一种基于语境分析的声音增益调节方法及系统
Hopkins et al. The effect of compression speed on intelligibility: simulated hearing-aid processing with and without original temporal fine structure information
US20240170001A1 (en) Improving perceptual quality of dereverberation
CN116964665A (zh) 提高去混响的感知质量

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant