CN115811690A - 一种音频响度调节方法、装置、终端设备及存储介质 - Google Patents

一种音频响度调节方法、装置、终端设备及存储介质 Download PDF

Info

Publication number
CN115811690A
CN115811690A CN202211652388.4A CN202211652388A CN115811690A CN 115811690 A CN115811690 A CN 115811690A CN 202211652388 A CN202211652388 A CN 202211652388A CN 115811690 A CN115811690 A CN 115811690A
Authority
CN
China
Prior art keywords
pass filter
loudness
sound source
group delay
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211652388.4A
Other languages
English (en)
Inventor
陈志鹏
施韵
彭聪聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Silicon Integrated Co Ltd
Original Assignee
Wuhan Silicon Integrated Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Silicon Integrated Co Ltd filed Critical Wuhan Silicon Integrated Co Ltd
Priority to CN202211652388.4A priority Critical patent/CN115811690A/zh
Publication of CN115811690A publication Critical patent/CN115811690A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本申请实施例公开了一种音频响度调节方法、装置、终端设备及存储介质,音频响度调节装置中包括多个全通滤波器组,每个全通滤波器组中串联了一组全通滤波器,音频响度调节方法包括:获取多条目标候选群时延响应曲线,并确定多条目标候选群时延响应曲线对应的多组滤波器参数;将多组滤波器参数分别赋值给多个全通滤波器组,其中,一组滤波器参数与一个全通滤波器组对应;将预设音源信号分别输入多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号;对滤波音源信号进行响度预测,确定滤波音源信号对应的全通滤波器组的响度预测值;采用响度预测值最大的一组全通滤波器对待播放音频信号进行响度调节。

Description

一种音频响度调节方法、装置、终端设备及存储介质
技术领域
本申请涉及音频响度调节技术领域,尤其涉及一种音频响度调节方法、装置、终端设备及存储介质。
背景技术
为了满足消费者对移动便携设备外形尺寸轻、薄、小的需求,在手机、平板等设备上一般会配备2~4个、音圈振幅较小且最大功率仅为1瓦左右的微型扬声器用于设备音频的外放。受限于尺寸和输出功率,微扬声器往往不具备大尺寸高保真(High-Fidelity,Hi-Fi)音箱所拥有的全频段相对平坦的频响曲线,且其只能输出较低的总响度水平,不利于音乐的真实准确回放。
现有技术中,为了提升微扬声器的重放响度,利用动态范围控制(dynamic rangecontrol,DRC)对音源信号进行处理,对一些音源信号中包含较少的低频和高频成分的音源信号的响度提升效果有限;且利用限幅和动态压缩的非线性处理对音源信号进行处理的方式,在进行大幅度的限幅与压缩时,会引入明显的谐波失真,导致音源音色改变。
发明内容
有鉴于此,本申请实施例期望提供一种音频响度调节方法、装置、终端设备及存储介质,能够显著提升微扬声器重放音频的响度,同时减少谐波失真对音源音色的影响。
为达到上述目的,本申请的技术方案是这样实现的:
第一方面,本申请实施例提供一种音频响度调节方法,应用于音频响度调节装置,所述音频响度调节装置中包括多个全通滤波器组,每个全通滤波器组中串联了一组全通滤波器,所述方法包括:
获取多条目标候选群时延响应曲线,并确定多条目标候选群时延响应曲线对应的多组滤波器参数;
将多组滤波器参数分别赋值给多个全通滤波器组,其中,一组滤波器参数与一个全通滤波器组对应;
将预设音源信号分别输入多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号;
对滤波音源信号进行响度预测,确定滤波音源信号对应的全通滤波器组的响度预测值;采用响度预测值最大的一组全通滤波器对待播放音频信号进行响度调节。
第二方面,本申请实施例提供一种音频响度调节装置,所述音频响度调节装置包括:
获取模块,用于获取多条目标候选群时延响应曲线,并确定多条目标候选群时延响应曲线对应的多组滤波器参数;
赋值模块,用于将多组滤波器参数分别赋值给多个全通滤波器组,其中,一组滤波器参数与一个全通滤波器组对应;
滤波模块,用于将预设音源信号输入多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号;
确定模块,用于对滤波音源信号进行响度预测,确定滤波音源信号对应的全通滤波器组的响度预测值;
调节模块,用于采用响度预测值最大的一组全通滤波器对待播放音频信号进行响度调节。
第三方面,本申请实施例提供一种终端设备,终端设备包括:处理器、存储器及通信总线;处理器执行存储器存储的运行程序时实现上述音频响度调节方法。
第四方面,本申请实施例提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述音频响度调节方法。
本申请实施例提供一种音频响度调节方法、终端设备及存储介质,该方法包括:获取多条目标候选群时延响应曲线,并确定多条目标候选群时延响应曲线对应的多组滤波器参数;将多组滤波器参数分别赋值给多个全通滤波器组,其中,一组滤波器参数与一个全通滤波器组对应;将预设音源信号输入多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号;对滤波音源信号进行响度预测,确定滤波音源信号对应的全通滤波器组的响度预测值;采用响度预测值最大的一组全通滤波器对待播放音频信号进行响度调节。采用上述实现方案,在对音频响度进行调节的过程中,引入全通滤波器组,并根据多个全通滤波器组对应的多组滤波器参数对输入的音源信号进行滤波处理,基于全通滤波器能够改变时延的特性,针对于不同频率,调整音源信号在该频率下对应的群时延,错开不同频率正弦波的峰值,使得同一时刻不同频率的峰值不会被叠加,从而维持每个单频正弦波的形状不被改变,避免了截顶失真,从而减小因谐波失真导致的音源信号受损,且为了保证响度增强效果更优,分别对每个全通滤波器组滤波后的音源信号进行响度值预测,进一步确定响度增强值最大的滤波器组,利用该全通滤波器组不仅能够减少谐波失真对音源音色的影响,还能够显著提升微扬声器重放音频的响度。
附图说明
图1为本申请实施例提供一种音频响度调节方法流程图一;
图2为本申请实施例提供的一种对全通滤波器的滤波器参数进行遍历搜索过程流程图;
图3为本申请实施例提供的一种全通滤波器组连接示意图;
图4为本申请实施例提供的一种候选群时延曲线族示意图;
图5为本申请实施例提供的一种Z平面内一个2阶全通滤波器的零极点示意图;
图6为本申请实施例提供的一种示例性地全通滤波器采样频率与延时之间的对应关系示意图;
图7为本申请实施例提供的一种示例性地微扬声器的原始幅度频响曲线示意图;
图8为本申请实施例提供的一种示例性地响度预测模块示意图;
图9为本申请实施例提供的一种示例性地音频响度调节方法流程图二;
图10为本申请实施例提供的一种示例性地音频响度调节方法流程图三;
图11为本申请实施例提供的一种示例性地音频响度调节方法流程图四;
图12为本申请实施例提供的一种音频响度调节装置1的结构示意图;
图13为本申请实施例提供的一种终端设备2的结构示意图。
具体实施方式
为了能够更加详尽地了解本申请实施例的特点及技术内容,下面结合说明书附图及具体实施例对本申请的技术方案做进一步的详细阐述,所附附图仅供参考说明之用,并非用来限定本申请实施例。
除非另有定义,本文所使用的所有技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。还需要指出,本申请实施例所涉及的术语“第一/第二/第三”仅是用于区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一/第二/第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述以外的顺序实施例。
现有技术中,在对频段进行响度增强时,通常采用以下技术方案实现:
(1)基于频段压缩的响度增强
基于频段压缩的响度增强方法,先对音源信号的低频段和高频段进行压缩衰减再输送给扬声器进行播放。根据心理声学等响曲线,相同的声压下人耳对低频的响度感知不如中高频敏感,且微型扬声器在200Hz以下低频段和10kHz以上极高频段的重放能力较弱,因此在功率有限的前提下可将扬声器的输出能量尽量分配于扬声器重放能力强、人耳更敏感的中高频段上,衰减对总响度贡献小的低频和极高频段的信号的幅度。此方法是微扬声器调音中常见的技术手段,对某些本身低频和高频成分较少的音源的响度提升效果有限。
(2)基于动态范围控制(Dynamic Range Compression,DRC)和自动增益补偿(Automatic Gain Control,AGC)结合的响度增强
如常见的商用响度增强插件OneKnob Louder,将限制器Limit、动态范围控制DRC和自动增益补偿AGC结合在一起,先对输入信号中超过阈值的峰值信号进行削波,将输入信号的幅度整体限制于固定阈值以下,再对信号施加一个可变的增益来压缩大幅度信号和提升小幅度信号。由于限幅和动态压缩都属于非线性处理,大幅度的限幅与压缩时会引入明显的谐波失真,致使音色改变。
为解决现有技术中的技术问题,本申请实施例提供的一种音频响度调节方法,如图1所示,应用于音频响度调节装置,音频响度调节装置中包括多个全通滤波器组,每个全通滤波器组中串联了一组全通滤波器,该方法可以包括:
S101、获取多条候选群时延响应曲线,并确定每条候选群时延响应曲线对应的一组滤波器参数。
在本申请实施例中,对音频的响度进行调节时,采用多个全通滤波器串联的方式,将多个串联的全通滤波器组成一个全通滤波器组,利用全通滤波器组对音频的响度进行线性动态范围调节。
在本申请实施例中,全通滤波器不改变输入信号的频率特性,但它会改变输入信号的相位,利用这个特性,全通滤波器可以用做延时器、延迟均衡等。
在本申请实施例中,要对音频的音源信号进行响度调节前,需要获取到每个全通滤波器组中每个全通滤波器对应的滤波器参数,利用获取的每个全通滤波器组中每个全通滤波器对应的滤波器参数对音源信号进行滤波处理。
在本申请实施例中,在获取多条目标候选群时延曲线之前,可以现针对于大量的扬声器,利用遍历搜索的方式搜索每个滤波器组中的每个滤波器对应的滤波器参数,具体地,获取多条目标候选群时延响应曲线之前,在第一预设搜索范围内,根据第一预设搜索步长,调整每个全通滤波器组中每个全通滤波器对应的极点幅度值,确定出每个全通滤波器对应的多个目标极点幅度值;在第二预设搜索范围内,根据第二预设搜索步长,调整每个全通滤波器对应的极点角度值,确定出每个全通滤波器对应的多个目标极点角度值;根据多个目标极点幅度值和多个目标极点角度值,确定多个全通滤波器组对应的多组初始滤波器参数;基于多组初始滤波器参数,确定多条候选群时延响应曲线。
在本申请实施例中,分别获取多个全通滤波器组中每个全通滤波器对应的滤波器参数的方式可以通过预先采用离线遍历搜索的方式确定每个全通滤波器组中每个全通滤波器对应的滤波器参数。
需要说明的是,考虑到实际可能搜索到若干个响度提升效果接近或相同的滤波器组,可离线挑选出效果最优的前M个滤波器组作为后续实时滤波时的候选组合,具体的,预先利用遍历搜索的方式获取多个全通滤波器组中每个全通滤波器对应的滤波器参数的遍历搜索的过程如图2所示:
1、指定每个全通滤波器APF的参数r的搜索范围为[r1,r2]、搜索步长为dr,记r共有k1种选择;
2、指定每个全通滤波器APF的参数w的搜索范围为[w1,w2]、搜索步长为dw,记w共有k2种选择;
3、在r和w指定搜索范围内,根据搜索步长不断改变每个全通滤波器APF的参数r和参数w,生成N个新的全通滤波器;
4、将N个新的全通滤波器进行串联作为一个滤波器组,重复执行上述1-3过程,直至确定出K个滤波器组。
在本申请实施例中,示例性地,一个滤波器组串联的方式如图3所示,一个滤波器组中可以包含若干个全通滤波器。
需要说明的是,由于N个滤波器串联使用时,改变内部每个子滤波器的先后顺序不会改变最终的总滤波效果,因此根据排列组合公式,共有K=(k1*k2+N-1)!/N!/k1*k2)!种不同的N个滤波器的串联组合方式。
需要说明的是,N的取值可以根据实际情况进行选择,本申请中不作具体地限定,K为调节r和w参数所得到的滤波器组的数量,这K种组合方式便是确定出的多个全通滤波器组。
在本申请实施例中,基于上述利用的遍历搜索的方式提前针对大量不同类型的扬声器采用离线遍历搜索的方式,对进行响度增强的全通滤波器组中的每个全通滤波器对应的滤波器参数进行搜索,获取多个全通滤波器组中每个全通滤波器对应的滤波器参数。
在本申请实施例中,在获取多个全通滤波器组中每个全通滤波器对应的滤波器参数之后,得到多个全通滤波器组对应的多组初始滤波器参数,进而根据多组初始滤波器参数,确定多条初始候选群时延响应曲线。
在本申请实施例中,基于多组初始滤波器参数,确定多条初始候选群时延响应曲线,可以是利用多组初始滤波器参数,确定出多个全通滤波器组的多个传输函数;利用多个传输函数,确定多个全通滤波器组的多个相位频响参数;利用多个相位频响参数,确定多条初始候选群时延响应曲线。
在本申请实施例中,要对音频信号的响度进行调节,需要获取到全通滤波器组中每个滤波器对应的滤波器参数,滤波器参数的确定可以是根据多个目标候选群时延响应曲线以及预设均衡滤波器对应的群时延响应曲线进行确定。
在本申请实施例中,在对滤波器参数进行确定之前,首先需要获取到多个目标候选群时延响应曲线以及预设均衡滤波器对应的群时延响应曲线。
在本申请实施例中,要获取目标候选群时延响应曲线,需先采用离线遍历搜索的方式多组初始滤波器参数进行确定,再基于多组初始滤波器参数,确定多条初始候选群时延响应曲线,从多条初始候选群时延响应曲线中挑选出一条对应的响度提升效果最佳的APF滤波器组合。
在本申请实施例中,考虑到实际过程实现可能搜索到若干个响度提升效果接近或相同的滤波器组,可利用上述离线遍历的方式挑选出效果最优的前M个滤波器组作为后续实时滤波时的候选组合。
需要说明的是,M的数量可以根据实际情况进行选择,本申请中不做具体地限定。
需要说明的是,在本申请实施例中,采用多个2阶IIR全通滤波器APF串联的方式对输入信号进行群时延的微调,APF不改变信号幅度频响的特性,可保持原信号中各个单频正弦信号幅度不变,且实现简单即使串联多个的总计算量也很小。
在本申请实施例中,在确定出多组初始滤波器参数r和w的值之后,可以利用公式(1)确定出全通滤波器的传输函数,公式(1)如下所示:
Figure BDA0004011115970000081
需要说明的是,全通滤波器的传输函数由r和w两个系数来确定。
其中,Z表示Z平面,Z平面内的任意点可用
Figure BDA0004011115970000082
表示,Z平面内某2阶全通滤波器的零极点示意图如图5所示,其中,两个x表示2个共轭对称极点,两个o表示2个共轭对称零点。其中r表示在Z平面内,此全通滤波器对应的极点的幅度,其取值范围为(0,1);w表示极点与z轴正半轴的夹角,单位弧度rad。
在本申请实施例中,在计算出A(z)之后,利用A(z)表达式求系统的相位频响φ(ej ω),其计算表达式如公式(2)所示:
Figure BDA0004011115970000083
其中,atan表示反正切函数,imag表示对括号内表达式求虚部,real表示对括号内表达式求实部。
在本申请实施例中,在计算得到相位频响情况下,利用已知的相位频响φ(e)求群时延频响参数GD(e),其计算表达式如公式(3)所示:
Figure BDA0004011115970000084
需要说明的是,群时延频响曲线等于相位频响对角频率w求导再取负值。
在本申请实施例中,根据上述公式可以计算出一个全通滤波器组对应的候选群时延响应曲线,剩余的全通滤波器组对应的候选群时延响应曲线的计算方式和上述相同,在这里不再赘述。
在本申请实施例中,在确定多条初始候选群时延响应曲线之后,基于预设算法对多条初始候选群时延响应曲线进行统计分析,确定出群时延响应曲线簇;基于群时延响应曲线簇,并经人工听音识别,从群时延响应曲线簇中确定多个全通滤波器组对应的多条目标候选群时延响应曲线。
在本申请实施例中,在对大量的不同类型扬声器进行全通滤波器组中的全通滤波器对应的滤波器参数进行获取之后,可以通过训练的神经网络、机器学习等方式进行统计归纳曲线的特征,从大量的滤波器参数对应的初始候选群时延曲线中选择出较优的几组初始候选群时延曲线,作为群时延响应曲线簇。
需要说明的是,较优的初始候选群时延曲线的数量可以根据实际情况进行选择,本申请中不做具体地限定。
在本申请实施例中,在确定出群时延响应曲线簇之后,并经人耳听音试验,从群时延响应曲线簇中选择出响度增强效果最优多个全通滤波器组对应的多条目标候选群时延响应曲线。
在本申请实施例中,在获取到增强效果最优的多条目标候选群时延响应曲线之后,可以利用获取的多条目标候选群时延响应曲线以及预设均衡滤波器对应的群时延响应曲线,进一步确定多个全通滤波器组分别对应的一组滤波器参数。
在本申请实施例中,确定多条候目标选群时延曲线对应的多组滤波器参数,是根据多条目标候选群时延响应曲线以及预设均衡滤波器对应的群时延响应曲线进行计算得到的,具体地,可以是利用预设均衡滤波器对应的群时延响应曲线,至少通过相减的方法对多个全通滤波器组对应的多条目标候选群时延响应曲线进行处理,得到多个全通滤波器组对应的多条目标群时延响应曲线;基于多条目标群时延响应曲线,确定多个目标相位频响参数;利用多个目标相位频响参数,确定多个目标传输函数;利用多个目标传输函数,确定多条目标候选群时延响应曲线对应的一组滤波器参数。
在本申请实施例中,要利用全通滤波器组对音频信号的响度进行调节,需要获取到全通滤波器组中每个滤波器对应的滤波器参数,滤波器参数的确定可以是是根据目标群时延响应曲线进行确定,一条目标群时延响应曲线与一组滤波器参数对应,即在获取到多组目标群时延响应曲线的情况下,根据多组目标群时延响应曲线可以分别确定出多个全通滤波器组中每个滤波器对应的滤波器参数。
在本申请实施例中,在得到多个全通滤波器组对应的多个目标候选群时延响应曲线之后,利用多个目标候选群时延响应曲线与获取的预设均衡滤波器对应的群时延响应曲线进行相减,得到多组目标群时延响应曲线。
需要说明的是,在本申请实施例中,获取多个全通滤波器组对应的多组目标群时延响应曲线,可以是利用多个全通滤波器组对应的多条目标候选群时延响应曲线与预设均衡滤波器对应的群时延响应曲线进行相减,得到多组目标群时延响应曲线,也可以是除了相减的方式以外,其他得到目标群时延响应曲线的方式均属于本申请保护的范围,具体地计算方式可以根据实际情况进行选择,本申请中不做具体地限定。
需要说明的是,预设均衡滤波器对应的群时延响应曲线的计算方式可以参考现有技术中的计算方式,在这里不再赘述。
在本申请实施例中,目标群时延响应曲线确定之后,一条目标群时延响应曲线与一组滤波器参数对应,即在获取到多组目标群时延响应曲线的情况下,根据多组目标群时延响应曲线可以确定出多个全通滤波器组中每个滤波器对应的滤波器参数。
需要说明的是,在进行目标群时延响应曲线获取时,可先针对大量不同的扬声器采用离线遍历搜索的方式进行响度增强滤波器参数的搜索,获得多个最优滤波器组,再经过人耳听音试验,统计归纳出响度增强效果最优的候选群时延特征曲线族,后续针对任意微扬声器,从候选群时延特征曲线族中挑选出效果最佳的候选群时延曲线和对应滤波器组参数即可,无需再去通过遍历搜索的方式去依次搜索每个扬声器响度增强效果最优的全通滤波器组。
需要说明的是,提前进行滤波器参数离线遍历搜索的方式可以参照上述实施例中遍历搜索的方式进行遍历搜索,在这里不再赘述。
在本申请实施例中,候选群时延曲线族如图4所示,候选群时延曲线族中每条曲线的群时延大致随着频率增大而单调衰减,这符合人耳对低频信号的相位和时延差的改变不敏感、对高频信号的相位和时延差敏感的听觉特性。尽量只改变中低频段延时而维持中高频段的原始延时的做法可避免人耳察觉到全通滤波器(All-Pass Filter,APF)对信号的影响,从而尽可能的保持原音源信号的音色的准确重放。
需要说明的是,优选的,可以任意对上述候选群时延特征曲线族所形成的曲线形状做局部细微调整,比如增加某几个频率点的延时,改变基础群时延特征参数所形成的曲线的形状,可以获得一类新的群时延特征曲线族。
在本申请实施例中,在利用预设均衡滤波器对应的群时延响应曲线,通过相减的方法对多个全通滤波器组对应的多个候选群时延响应曲线进行处理,得到多个全通滤波器组对应的多组目标群时延响应曲线之后,可以根据得到的每组目标群群时延响应曲线确定出目标相位频响参数,进而根据目标相位频响参数确定出目标传输函数,最后根据目标传输函数确定出全通滤波器组对应的滤波器参数。
具体地,可以参照上述公式(1)-(3)的计算过程,具体地进行每个全通滤波器组对应的一组滤波器参数的确定可以根据公式(1)-(3),利用反推的方式进行滤波器参数的确定。具体推算的过程本申请中不再赘述。
需要说明的是,总结归纳出多条候选群时延响应曲线族后,后续基于候选群时延响应曲线族进行最优的APF搜索的计算量和耗时可以显著的减少。
上述确定目标群时延响应曲线的过程具体执行过程可以是,先导入多条候选群时延响应曲线GDi(i=1,2,3,…,Q),以及均衡滤波器H1的群时延响应曲线GD0,针对每条候选群时延响应曲线GDi,以GDi-GD0作为第i个APF滤波器组的目标群时延响应曲线,利用常用的逼近算法求解出满足此目标群时延参数所形成的曲线的N个APF的r、w等参数。
需要说明的是,其他的目标群时延响应曲线所对应的N个APF的r、w参数都可以参考上述求解过程,在这里不再赘述。
需要说明的是,利用上述实施例中根据多组目标群时延响应曲线确定出多个全通滤波器组分别对应的一组滤波器参数,即确定出多个全通滤波器组中每个滤波器对应的滤波器参数,从而得到多个可以应用于音频响度调节的多个滤波器组。
需要说明的是,利用上述方式确定多个全通滤波器组分别对应的一组滤波器参数的方法是先利用优先遍历搜索的方式获得滤波器参数,再根据获得的滤波器参数确定出对应的候选群时延曲线簇,在有需要的时候,直接利用候选群时延曲线簇进行滤波器参数的获取。
需要说明的是,本申请实施例中为了改变不同频率正弦信号的相对延时,而群时延可表征滤波器对不同频率信号的时间弥散程度,因此一旦确定了群时延曲线后,就可以通过最优逼近方法来快速求解出满足此候选群时延曲线对应的APF滤波器参数。
需要说明的是,由于实际音乐信号的统计特性是随机变化的,其所含单频信号的频率个数、每个单频的初始相对延时、每个单频的幅度都是不确定的,因此不同的音乐片段所需的最优群延时改变量也是不同的;即使对相同的音乐片段,不同的微扬声器调音时选择的EQ均衡器的不同也会导致音乐信号的初始相对延时的改变。故实际使用前,应针对指定的微扬声器通过试验挑选出能对绝大部分类型音乐都具有明显的响度提升效果的一组或几组APF参数,或者统计出亦或理论推导出APF群时延曲线特性与提升随机音乐的响度之间的内在规律或公式,便于后续对任意的微扬声器能快速的给出最优的APF滤波器组对应的一组滤波器参数。
可选地,在本申请实施例中,在进行滤波器参数确定时,可以采用边遍历搜索参数边利用遍历搜索的滤波器参数进行音源信号滤波处理,采用这种方式的效率比先进行遍历归纳总结出群时延曲线簇的效率低。
在本申请实施例中,将多组滤波器参数分别赋值给多个全通滤波器组之前,获取多组全通滤波器组分别对应的一组滤波器参数的方式还可以是在第一预设搜索范围内,根据第一预设搜索步长,调整每个全通滤波器组中每个全通滤波器对应的极点幅度值,确定出每个全通滤波器对应的多个目标极点幅度值;在第二预设搜索范围内,根据第二预设搜索步长,调整每个全通滤波器对应的极点角度值,确定出每个全通滤波器对应的多个目标极点角度值;根据多个目标极点幅度值和多个目标极点角度值,确定多个全通滤波器组分别对应的一组滤波器参数。
在本申请实施例中,确定多个全通滤波器组分别对应的一组滤波器参数的方式可以是直接采用离线遍历搜索的方式挑选出响度提升效果最佳的APF滤波器组。考虑到实际可能搜索到若干个响度提升效果接近或相同的滤波器组,可离线挑选出效果最优的前M个滤波器组作为后续实时滤波时的候选组合,具体的,获取多个全通滤波器组对应的多组滤波器参数的遍历搜索的过程如上述图2所示的实现过程,如下:
1、指定每个全通滤波器APF的参数r的搜索范围为[r1,r2]、搜索步长为dr,记r共有k1种选择;
2、指定每个全通滤波器APF的参数w的搜索范围为[w1,w2]、搜索步长为dw,记w共有k2种选择;
3、在r和w指定搜索范围内,根据搜索步长不断改变每个全通滤波器APF的参数r和参数w,生成N个新的全通滤波器;
4、将N个新的全通滤波器进行串联作为一个滤波器组,重复执行上述1-3过程,直至确定出K个滤波器组。
在本申请实施例中,示例性地,一个滤波器组串联的方式如上述图3所示,一个滤波器组中可以包含若干个全通滤波器。
需要说明的是,由于N个滤波器串联使用时,改变内部每个子滤波器的先后顺序不会改变最终的总滤波效果,因此根据排列组合公式,共有K=(k1*k2+N-1)!/N!/k1*k2)!种不同的N个滤波器的串联组合方式。
需要说明的是,N的取值可以根据实际情况进行选择,本申请中不作具体地限定,K为调节r和w参数所得到的滤波器组的数量,这K种组合方式便是确定出的多个全通滤波器组。
需要说明的是,在本申请实施例中,采用多个2阶IIR全通滤波器APF串联的方式对输入信号进行群时延的微调,APF不改变信号幅度频响的特性,可保持原信号中各个单频正弦信号幅度不变,且实现简单即使串联多个的总计算量也很小。
需要说明的是,在进行多个全通滤波器组选择时,可以预先指定构成滤波器组的全通滤波器的总个数N以及候选的最优滤波器组合的个数M。
需要说明的是,全通滤波器总个数N的选择可以是调音工程师根据效果与计算量折中考虑进行N的取值。
需要说明的是,如图6所示的全通滤波器APF采样频率与延时之间的对应关系示意图,如图6所示,1个r=0.99,w=0.0131的APF将对100-200Hz附近频段引入最多约5.2ms的延时(48kHz采样率下,延时250sample),对500Hz以上频段基本无影响。可见单个APF的主要作用频段较窄,产生的群时延改变量也较小,因此需要串联多个APF作为一个滤波器组来实现多频段的延时,从而显著改变多频音乐信号中各单频的相互延时。因此,在本申请实施例中,需提前指定滤波器组的APF总个数N。
需要说明的是,利用遍历搜索方法可确保对任意扬声器获得响度增强效果最优的M个滤波器组,但是实现遍历的计算量和耗时均较大,不便于实际应用场景中快速便捷的获得最佳滤波器参数。因此,可采用提前针对大量不同类型的扬声器利用上述遍历法进行响度增强参数搜索获得多个最优滤波器组,再经过人耳听音试验,统计归纳出响度增强效果最优的群时延特征曲线族,后续针对任意微扬声器,从群时延特征曲线族中挑选出效果最佳的群时延曲线以及对应滤波器组中对应的滤波器参数即可。
S102、将多组滤波器参数分别赋值给多个全通滤波器组,其中,一组滤波器参数与一个全通滤波器组对应。
在本申请实施例中,经上述实现过程确定出多组滤波器参数之后,将每一组滤波器参数赋值给对应的一个滤波器组中每个滤波器,利用每个滤波器所串联组成的滤波器组进行滤波处理。
S103、将预设音源信号分别输入多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号。
在本申请实施例中,或通过直接进行遍历搜索的方式获取多个全通滤波器组分别对应的一组滤波器参数,或是通过预先统计归纳出的候选群时延曲线的方式获取多个全通滤波器组分别对应的多条目标群时延响应曲线,并根据多条目标群时延响应曲线确定多个全通滤波器组分别对应的一组滤波器参数之后,将预设音源信号分别输入多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号。
需要说明的是,每个全通滤波器组中串联的一组全通滤波器对应一组滤波器参数。
在本申请实施例中,将预设音源信号输入每个全通滤波器组中,利用每个全通滤波器组对应的一组滤波器参数对预设音源信号进行滤波处理,得到每个全通滤波器组对应的滤波音源信号。
在本申请实施例中,为了充分评估全通滤波器组的响度增强效果和挑选出最优的滤波器组,需选择若干首不同类型的音乐作为预设音源信号,每个音源信号均用均衡器H1做滤波预处理,继而获得响度评估音源数据库S,记数据库中的音源数量为P首。
需要说明的是,在本申请实施例中响度评估音源数据库中音源信号数为100首以上,包含各类乐器的瞬态短暂片段如贝斯、军鼓、架子鼓、吉他、钢琴等,也包含各类风格(流行、古典、摇滚、爵士等)的常见歌曲,和若干电影片段和游戏音乐片段。
在本申请实施例中,对于均衡滤波器的确定是针对于不同的微扬声器来进行选择的,如图7所示,是一种微扬声器的原始幅度频响曲线,横轴为频率,单位为Hz,纵轴为幅度,单位为dB,均衡滤波器的选择可以是根据该微扬声器原始的幅度频响曲线获得。
需要说明的是,幅度频响曲线可采用公知的扫频信号或者伪随机序列MLS信号方法测试求解获取。
在本申请实施例中,从图7可见其400Hz以下和10kHz以上的幅度显著低于中间频段,且在5.5kHz频段附近内频响存在峰值,并非完全平坦,对此,使用若干个截止频率为100~200Hz的高通滤波器及截止频率为10~15kHz的低通滤波器来衰减扬声器无法重放的低频和极高频信号;以及使用峰值滤波器peak滤波器和陷波滤波器notch滤波器来补偿频响曲线上的局部峰值和谷值,使得中高频段的频响曲线尽量平坦,利用高通滤波器、低通滤波器、peak滤波器以及peak滤波器组成的若干个滤波器组成了均衡滤波器组,记为H1。
需要说明的是,均衡滤波器的种类不限于上述这4种,任意形式的数字滤波器都可以用作均衡滤波器,具体地,可以根据实际的微扬声器的原始幅度频响曲线进行均衡滤波器组的选择,本申请中不做具体地限定。
在本申请实施例中,利用微扬声器对应的均衡滤波器组对预设音源信号进行均衡滤波处理,将处理后得到的音源信号分别输入至每个全通滤波器组中,利用每个全通滤波器组中每个滤波器对应的滤波器参数对利用均衡滤波器进行处理后得到的音源信号进行滤波处理,得到每个全通滤波器组对应的滤波音源信号。
在本申请实施例中,利用确定出的K种滤波器组分别对数据库中的所有预设音源信号S进行滤波处理,获得滤波后的信号Sij,i表示第i个滤波器组合,j表示P首预设音源信号中的第j首。
示例性地,假设有5种滤波器组合,数据库中有3首歌,假设将第一首歌输入至第一个滤波器组合中,滤波后的信号可以用S11表示;将第一首歌输入至第二个滤波器组合中,滤波后的信号可以用S21表示。
需要说明的是,现有技术中,为了提高音频重放的听觉响度,是先利用限幅处理和压缩处理来降低数字信号时域波形上的峰值即降低信号峰均比,再利用自动增益补偿AGC进行信号的整体增益放大,达到降低动态范围增强响度的目的。这种方式有损地丢弃了原信号中波峰段的部分信息,音乐信号的音色将受到破坏。众所周知,乐器和人声信号均由其基频和多阶谐波组合而成,而实际消费者所播放的音乐歌曲则由各类乐器和人声复合而成,可见音乐信号是一种富含多种频率的随机信号;在较短的时间窗(10ms~20ms以下)内音乐信号可视为多个不同频率的正弦波所构成的稳态信号,各频率正弦波的波峰叠加构成音乐信号的波峰也即幅度极大值段。为了减小音乐信号的波峰幅度可采用前述的限幅与压缩来直接降低音乐峰值段内所有频率正弦波的幅度,对每个单频正弦波而言,其波峰段波形的压缩将使得正弦波不再标准,相当于引入了谐波失真。
在本申请实施例中,则是调节不同频率的相位差或群时延差来错开不同频率正弦波的峰值,每个单频正弦波的形状将被维持不改变,轻微的相位改变和延时对人耳音色感知的影响甚微,从而实现近乎“无损”地降低音乐信号的总的峰值,再结合AGC提高信号总增益来实现响度增强。
S104、对滤波音源信号进行响度预测,确定滤波音源信号对应的全通滤波器组的响度预测值;采用响度预测值最大的一组全通滤波器对待播放音频信号进行响度调节。
在本申请实施例中,将滤波后的滤波音源信号输入到响度预测模块中,进行滤波音源信号响度值的预测。
在本申请实施例中,将进行响度值预测时,依次将第i个滤波器组对应的P个滤波后信号Si(Si1~Sip)输入至响度预测模块并记录输出的P个信号的响度值之和Li,i=1~K。
示例性地,假设有4个滤波器组,有3首预设音源信号,在进行响度值预测时,将3首预设音源信号依次输入第1个滤波器组中,得到3个滤波后信号,将得到的3个滤波后信号分别输入至响度预测模块中进行响度预测得到3个响度值,并计算3个响度值之和,得到第一个滤波器组对应的响度值。以此类推,可以计算出第2-4个滤波器组对应的响度值。
在本申请实施例中,在计算得到多个全通滤波器对应的多个响度预测值之后,可以从多个全通滤波器组对应的多个响度预测值中选择出最大的响度预测值,将最大响度预测值对应的全通滤波器组确定为进行待播放音频信号进行响度调节的全通滤波器组。
需要说明的是,全通滤波器组数量的确定,可以是预先进行设置的,全通滤波器组数量的确定可以根据实际情况进行选择,可以为M(M>1)个,具体地,本申请中不做数量的限定。
需要说明的是,在进行响度预测最大值选择时,可以将K个响度预测值Li进行从大到小排序,选择响度最大的一个或是前M种组合对应的滤波器组用于后续的实时音频响度增强处理。
在本申请实施例中,分别利用滤波音源信号,确定对应的一个滤波器组的响度预测值,可以将滤波音源信号至少依次经过动态范围控制DRC处理、自动增益补偿AGC处理和扬声器振幅保护处理,得到滤波音源信号对应的待评估信号;根据待评估信号,确定对应的一个滤波器组的响度预测值。
需要说明的是,对滤波音源信号进行处理不限于上述的DRC处理、AGC处理和扬声器振幅保护处理三种处理方式,还可以根据实际情况进行增加或删减处理的过程,具体地,可以根据实际情况进行选择,本申请中不做具体地限定。
在本申请实施例中,响度预测模块可以由动态范围控制DRC、自动增益补偿AGC、扬声器振幅保护算法Excursion Limit和响度计算4个处理子过程组成。如图8所示,在响度预测模块中,其处理流程可以为将P个输入信号Si1~Sip依次经过DRC处理和AGC处理和扬声器保护算法处理,获得P个待评估信号S2,对S2按照一定响度计算准则计算响度值Li。
需要说明的是,响度预测模块中不限于包含的上述的处理子过程,具体地,可以根据实际情况进行选择,本申请中不作具体限定。
在本申请实施例中,根据待评估信号,确定对应的一个滤波器组的响度预测值可以是计算待评估信号对应的能量值;基于能量值,至少通过求和的方法得到对应的一个滤波器组的响度预测值。
在本申请实施例中,计算每个待评估信号S2的能量Ei,再将P个信号的能量求和作为此滤波器组的响度值Li。
需要说明的是,基于能量值确定滤波器组的响度预测值的方式不限于求和的方式,其他根据能量值确定滤波器组的响度预测值的方式均属于本申请保护的范围,具体地,可以根据实际情况进行选择,本申请中不做具体地限定。
在另一种可选地实施例中,根据待评估信号,确定对应的一个滤波器组的响度预测值可以是将待评估信号输入预设心理学听觉响度模型中,得到第一响度值;基于第一响度值,至少通过求和的方法得到对应的一个滤波器组的响度预测值。
在本申请实施例中,将每个待评估信号S2代入ISO 532A或ISO 532B等标准的心理声学听觉响度模型获得平均响度,再将所有待测信号的平均响度求和作为此滤波器组的响度值Li。
需要说明的是,基于第一响度值确定滤波器组的响度预测值的方式不限于求和的方式,其他根据第一响度值确定滤波器组的响度预测值的方式均属于本申请保护的范围,具体地,可以根据实际情况进行选择,本申请中不做具体地限定。
需要说明的是,根据响度计算准则进行响度值计算的方式不限于本申请中提到的两种计算方式,具体地,可以根据实际情况进行选择,本申请中不做具体地限定。
在本申请实施例中,在进行离线搜索获得M个最优APF滤波器组,将获得的M个最优滤波器用于手机、平板等电子设备的音乐、电影和游戏场景当中的实时音频外放。在实时音频处理链路中,响度增强滤波器组LEF被放置于扬声器幅度频响调节EQ均衡的后级,动态范围控制DRC前级。如图9所示,包含响度增强模块的基本处理链路为输入→均衡滤波器组均衡处理→响度增强滤波器组处理→动态范围控制处理→自动增益补偿处理→扬声器振幅保护算法处理→输出。
需要说明的是,本申请中引入一种全通滤波器组的线性动态范围调节方法,结合现有的频段压缩处理、DRC处理和AGC处理等手段,显著提升微扬声器重放音频的响度,同时减少谐波失真对音色的破坏。
在本申请实施例中,在对响度增强滤波器组进行选择时,为了减少LEF带来的计算量,可从离线获取的M种最优组合当中选择最优的第1个滤波器组,代入音频处理链路做固定的响度增强滤波处理。
可选地,在本申请实施例中,在对响度增强滤波器组进行选择时,将预设音源信号分别输入多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号,还可以是利用预设均衡滤波器对多个初始音源信号进行预处理,得到多个预设音源信号;将预设音源信号划分为多段音源信号;按照多个全通滤波器组的组数量,将每一段音源信号进行复制,得到每一段音源信号对应的多份音源信号;依次将每一段音源信号对应的多份音源信号,分别输入多个全通滤波器组中进行滤波处理,分别得到每个滤波器组对应的滤波音源信号。
在本申请实施例中,如图10所示,可先对链路中的输入信号做分帧处理,比如以10ms为1帧时长,将当前帧信号输出给EQ模块,再将EQ处理后信号复制M路并输出给M个最优滤波器组合各自进行滤波增强处理,将M路处理后信号输出给响度预测模块并做响度对比,将响度最优的一路信号作为响度增强模块的输出并传输给DRC模块、AGC模块以及扬声器振幅保护算法模块做后续处理。
需要说明的是,由于响度增强模块实时选择的最优滤波参数是动态变化的,当前帧与上一帧的输出信号的连接处需做平滑出来,以避免因前后帧信号的不连续导致的音乐听感的损失。
需要说明的是,基于全通滤波器对音频信号做线性的动态范围调节,可显著减少现有DRC等技术手段在压缩峰值的同时引入谐波失真的问题。
需要说明的是,在进行响度增强滤波器组的选择时,不限于本申请中的两种选择的方式,具体地,可以根据实际情况进行选择,本申请中不做具体地限定。
可以理解的是,在本申请实施例提供的一种音频响度调节方法,在对音频响度进行调节的过程中,引入全通滤波器组,并根据多个全通滤波器组对应的多组滤波器参数对输入的音源信号进行滤波处理,基于全通滤波器能够改变时延的特性,针对于不同频率,调整音源信号在该频率下对应的群时延,错开不同频率正弦波的峰值,使得同一时刻不同频率的峰值不会被叠加,从而维持每个单频正弦波的形状不被改变,避免了截顶失真,从而减小因谐波失真导致的音源信号受损,且为了保证响度增强效果更优,分别对每个全通滤波器组滤波后的音源信号进行响度值预测,进一步确定响度增强值最大的滤波器组,利用该全通滤波器组不仅能够减少谐波失真对音源音色的影响,还能够显著提升微扬声器重放音频的响度。
基于上述实施例,在本申请中提供的一种音频响度调节方法,如图11所示,具体包括以下步骤:
步骤1、确定多个全通滤波器组的多条目标候选群时延响应曲线;
步骤2、获取预设均衡滤波器对应的群时延响应参数曲线;
步骤3、利用预设均衡滤波器对应的群时延响应曲线,至少通过相减的方法对多个全通滤波器组对应的多条目标候选群时延响应曲线进行处理,得到多个全通滤波器组对应的多条目标群时延响应曲线;
步骤4、根据多组目标群时延响应曲线,确定多个全通滤波器组分别对应的一组滤波器参数;
步骤5、将预设音源信号输入每个全通滤波器组中,并利用全通滤波器组对应的一组滤波器参数对预设音源信号进行滤波处理,得到每个全通滤波器组对应的滤波音源信号;
步骤6、将滤波音源信号至少依次经过动态范围控制DRC处理、自动增益补偿AGC处理和扬声器振幅保护处理,得到滤波音源信号对应的待评估信号;
步骤7、计算待评估信号对应的能量值;利用能量值,得到对应的一个滤波器组的响度预测值;
步骤8、将待评估信号输入预设心理学听觉响度模型中,得到第一响度值;利用第一响度值,得到对应的一个滤波器组的响度预测值;
步骤9、从多个全通滤波器组中选择出响度预测值最大的一组全通滤波器;以利用一组全通滤波器对待播放音频信号进行响度调节。
需要说明的是,本申请中先对输入的音频信号进行低频和极高频段的衰减滤波处理,再基于全通滤波器组对信号做线性动态范围调节,再施加少量的动态范围控制DRC处理,最后的自动增益补偿AGC处理,响度提升更明显,且减少了DRC带来的谐波失真。
基于上述实施例,在本申请的另一实施例中提供一种音频响度调节装置1,如图12所示,音频响度调节装置中包括多个全通滤波器组,每个全通滤波器组中串联了一组全通滤波器;该音频响度调节装置包括:
获取模块10,用于获取多条目标候选群时延响应曲线,并确定多条目标候选群时延响应曲线对应的多组滤波器参数。
赋值模块11,用于将多组滤波器参数分别赋值给多个全通滤波器组,其中,一组滤波器参数与一个全通滤波器组对应。
滤波模块12,用于将预设音源信号分别输入多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号。
确定模块13,用于对滤波音源信号进行响度预测,确定滤波音源信号对应的全通滤波器组的响度预测值。
调节模块14,用于采用响度预测值最大的一组全通滤波器对待播放音频信号进行响度调节。
可选地,音频响度调节装置还可以包括:处理模块;
处理模块,用于将滤波音源信号至少依次经过DRC处理、自动增益补偿AGC处理和扬声器振幅保护处理,得到滤波音源信号对应的待评估信号。
可选地,所述确定模块13,还用于根据待评估信号,确定对应的一个滤波器组的响度预测值。
可选地,音频响度调节装置1还可以包括:计算模块;
计算模块,用于计算待评估信号对应的能量值;基于能量值,至少通过求和的方法得到对应的一个滤波器组的响度预测值。
可选地,音频响度调节装置1还可以包括:输入模块;
输入模块,用于将待评估信号输入预设心理学听觉响度模型中,得到第一响度值;基于第一响度值,至少通过求和的方法得到对应的一个滤波器组的响度预测值。
可选地,音频响度调节装置1还可以包括:预处理模块;
预处理模块,用于利用预设均衡滤波器对多个初始音源信号进行预处理,得到多个预设音源信号。
可选地,音频响度调节装置1还可以包括:划分模块;
划分模块,用于将预设音源信号划分为多段音源信号。
可选地,音频响度调节装置1还可以包括:复制模块;
复制模块,用于按照多个全通滤波器组的组数量,将每一段音源信号进行复制,得到每一段音源信号对应的多份音源信号。
可选地,滤波模块12,还用于依次将每一段音源信号对应的多份音源信号,分别输入多个全通滤波器组中进行滤波处理,分别得到每个滤波器组对应的滤波音源信号。
可选地,确定模块13,还用于在第一预设搜索范围内,根据第一预设搜索步长,调整每个全通滤波器组中每个全通滤波器对应的极点幅度值,确定出每个全通滤波器对应的多个目标极点幅度值。
可选地,确定模块13,还用于在第二预设搜索范围内,根据第二预设搜索步长,调整每个全通滤波器对应的极点角度值,确定出每个全通滤波器对应的多个目标极点角度值。
可选地,确定模块13,还用于根据多个目标极点幅度值和多个目标极点角度值,确定多个全通滤波器组对应的多组初始滤波器参数;基于多组初始滤波器参数,确定多条初始候选群时延响应曲线。
可选地,确定模块13,还用于基于预设算法对多条初始候选群时延响应曲线进行统计分析,确定出群时延响应曲线簇;基于群时延响应曲线簇,并经人工听音识别,从群时延响应曲线簇中确定多个全通滤波器组对应的多条目标候选群时延响应曲线。
可选地,所述处理模块,还用于利用预设均衡滤波器对应的群时延响应曲线,至少通过相减的方法对多个全通滤波器组对应的多条目标候选群时延响应曲线进行处理,得到多个全通滤波器组对应的多条目标群时延响应曲线。
可选地,确定模块13,还用于基于多条目标群时延响应曲线,确定多个目标相位频响参数。
可选地,确定模块13,还用于利用多个目标相位频响参数,确定多个目标传输函数。
可选地,确定模块13,还用于利用多个目标传输函数,确定多条目标候选群时延响应曲线对应的一组滤波器参数。
可选地,确定模块13,还用于利用多组初始滤波器参数,确定出多个全通滤波器组的多个传输函数。
可选地,确定模块13,还用于利用多个传输函数,确定多个全通滤波器组的多个相位频响参数。
可选地,确定模块13,还用于利用多个相位频响参数,确定多条初始候选群时延响应曲线。
本申请实施例提供一种音频响度调节装置,获取多条目标候选群时延响应曲线,并确定多条目标候选群时延响应曲线对应的多组滤波器参数;将多组滤波器参数分别赋值给多个全通滤波器组,其中,一组滤波器参数与一个全通滤波器组对应;将预设音源信号分别输入多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号;对滤波音源信号进行响度预测,确定滤波音源信号对应的全通滤波器组的响度预测值;采用响度预测值最大的一组全通滤波器对待播放音频信号进行响度调节。由此可见,本申请实施例提出的一种音频响度调节装置,在对音频响度进行调节的过程中,引入全通滤波器组,并根据多个全通滤波器组对应的多组滤波器参数对输入的音源信号进行滤波处理,基于全通滤波器能够改变时延的特性,针对于不同频率,调整音源信号在该频率下对应的群时延,错开不同频率正弦波的峰值,使得同一时刻不同频率的峰值不会被叠加,从而维持每个单频正弦波的形状不被改变,避免了截顶失真,从而减小因谐波失真导致的音源信号受损,且为了保证响度增强效果更优,分别对每个全通滤波器组滤波后的音源信号进行响度值预测,进一步确定响度增强值最大的滤波器组,利用该全通滤波器组不仅能够减少谐波失真对音源音色的影响,还能够显著提升微扬声器重放音频的响度。
图13为本申请实施例提供的一种终端设备2的组成结构示意图,在实际应用中,基于上述实施例的同一公开构思下,如图13所示,本实施例的终端设备2包括处理器20、存储器21和通信总线22。
在具体的实施例过程中,上述获取模块10、赋值模块11、滤波模块12、确定模块13、调节模块14、处理模块、计算模块、输入模块、预处理模块、划分模块、复制模块可由位于终端设备2上的处理器20实现,上述处理器20可以为特定用途集成电路(ASIC,ApplicationSpecific Integrated Circuit)、数字信号处理器(DSP,Digital Signal Processor)、数字信号处理图像处理装置(DSPD,Digital Signal Processing Device)、可编程逻辑图像处理装置(PLD,Programmable Logic Device)、现场可编程门阵列(FPGA,FieldProgrammable Gate Array)、CPU、控制器、微控制器、微处理器中的至少一种。可以理解地,对于不同的设备,用于实现上述处理器功能的电子器件还可以为其它,本实施例不作具体限定。
在本申请实施例中,上述通信总线22用于实现处理器20和存储器21之间的连接通信;上述处理器20执行存储器21中存储的运行程序时实现如下的音频响度调节方法:
获取多条目标候选群时延响应曲线,并确定多条目标候选群时延响应曲线对应的多组滤波器参数;将多组滤波器参数分别赋值给多个全通滤波器组,其中,一组滤波器参数与一个全通滤波器组对应;将预设音源信号分别输入多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号;对滤波音源信号进行响度预测,确定滤波音源信号对应的全通滤波器组的响度预测值;采用响度预测值最大的一组全通滤波器对待播放音频信号进行响度调节。
进一步地,上述处理器20,还用于将滤波音源信号至少依次经过动态范围控制DRC处理、自动增益补偿AGC处理和扬声器振幅保护处理,得到滤波音源信号对应的待评估信号;根据待评估信号,确定对应的一个滤波器组的响度预测值。
进一步地,上述处理器20,还用于计算待评估信号对应的能量值;基于能量值,至少通过求和的方法得到对应的一个滤波器组的响度预测值。
进一步地,上述处理器20,还用于将待评估信号输入预设心理学听觉响度模型中,得到第一响度值;基于第一响度值,至少通过求和的方法得到对应的一个滤波器组的响度预测值。
进一步地,上述处理器20,还用于利用预设均衡滤波器对多个初始音源信号进行预处理,得到多个预设音源信号;将预设音源信号划分为多段音源信号;按照多个全通滤波器组的组数量,将每一段音源信号进行复制,得到每一段音源信号对应的多份音源信号;依次将每一段音源信号对应的多份音源信号,分别输入多个全通滤波器组中,并利用多个全通滤波器组分别对应的一组滤波器参数进行滤波处理,分别得到每个滤波器组对应的滤波音源信号。
进一步地,上述处理器20,还用于在第一预设搜索范围内,根据第一预设搜索步长,调整每个全通滤波器组中每个全通滤波器对应的极点幅度值,确定出每个全通滤波器对应的多个目标极点幅度值;在第二预设搜索范围内,根据第二预设搜索步长,调整每个全通滤波器对应的极点角度值,确定出每个全通滤波器对应的多个目标极点角度值;根据多个目标极点幅度值和多个目标极点角度值,确定多个全通滤波器组对应的多组初始滤波器参数;基于多组初始滤波器参数,确定多条初始候选群时延响应曲线。
进一步地,上述处理器20,还用于基于预设算法对多条初始候选群时延响应曲线进行统计分析,确定出群时延响应曲线簇;基于群时延响应曲线簇,并经人工听音识别,从群时延响应曲线簇中确定多个全通滤波器组对应的多条目标候选群时延响应曲线。
进一步地,上述处理器20,还用于利用预设均衡滤波器对应的群时延响应曲线,至少通过相减的方法对多个全通滤波器组对应的多条目标候选群时延响应曲线进行处理,得到多个全通滤波器组对应的多条目标群时延响应曲线;基于多条目标群时延响应曲线,确定多个目标相位频响参数;利用多个目标相位频响参数,确定多个目标传输函数;利用多个目标传输函数,确定多条目标候选群时延响应曲线对应的一组滤波器参数。
进一步地,上述处理器20,还用于利用多组初始滤波器参数,确定出多个全通滤波器组的多个传输函数;利用多个传输函数,确定多个全通滤波器组的多个相位频响参数;利用多个相位频响参数,确定多条初始候选群时延响应曲线。
基于上述实施例,本申请实施例提供一种存储介质,其上存储有计算机程序,上述计算机可读存储介质存储有一个或者多个程序,上述一个或者多个程序可被一个或者多个处理器执行,应用于终端设备中,该计算机程序实现如上述的数据处理方法。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本公开的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台图像显示设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本公开各个实施例所述的方法。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (12)

1.一种音频响度调节方法,其特征在于,应用于音频响度调节装置,所述音频响度调节装置中包括多个全通滤波器组,每个全通滤波器组中串联了一组全通滤波器,所述方法包括:
获取多条目标候选群时延响应曲线,并确定所述多条目标候选群时延响应曲线对应的多组滤波器参数;
将所述多组滤波器参数分别赋值给所述多个全通滤波器组,其中,一组滤波器参数与一个全通滤波器组对应;
将预设音源信号分别输入所述多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号;
对所述滤波音源信号进行响度预测,确定所述滤波音源信号对应的全通滤波器组的响度预测值;采用响度预测值最大的一组全通滤波器对待播放音频信号进行响度调节。
2.根据权利要求1所述的方法,其特征在于,所述对所述滤波音源信号进行响度预测,确定所述滤波音源信号对应的全通滤波器组的响度预测值,包括:
将所述滤波音源信号至少依次经过动态范围控制DRC处理、自动增益补偿AGC处理和扬声器振幅保护处理,得到滤波音源信号对应的待评估信号;
根据所述待评估信号,确定对应的一个全通滤波器组的响度预测值。
3.根据权利要求2所述的方法,其特征在于,所述根据所述待评估信号,确定对应的一个全通滤波器组的响度预测值,包括:
计算所述待评估信号对应的能量值;
基于所述能量值,至少通过求和的方法得到对应的一个全通滤波器组的响度预测值。
4.根据权利要求2所述的方法,其特征在于,所述根据所述待评估信号,确定对应的一个全通滤波器组的响度预测值,包括:
将所述待评估信号输入预设心理学听觉响度模型中,得到第一响度值;
基于所述第一响度值,至少通过求和的方法得到对应的一个全通滤波器组的响度预测值。
5.根据权利要求1所述的方法,其特征在于,所述将预设音源信号分别输入所述多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号,包括:
利用预设均衡滤波器对多个初始音源信号进行预处理,得到所述多个预设音源信号;
将所述预设音源信号划分为多段音源信号;
按照所述多个全通滤波器组的组数量,将每一段音源信号进行复制,得到每一段音源信号对应的多份音源信号;
依次将每一段音源信号对应的多份音源信号,分别输入所述多个全通滤波器组中进行滤波处理,分别得到每个滤波器组对应的滤波音源信号。
6.根据权利要求1所述的方法,其特征在于,所述获取所述多条目标候选群时延响应曲线之前,所述方法还包括:
在第一预设搜索范围内,根据第一预设搜索步长,调整每个全通滤波器组中每个全通滤波器对应的极点幅度值,确定出所述每个全通滤波器对应的多个目标极点幅度值;
在第二预设搜索范围内,根据第二预设搜索步长,调整所述每个全通滤波器对应的极点角度值,确定出所述每个全通滤波器对应的多个目标极点角度值;
根据所述多个目标极点幅度值和所述多个目标极点角度值,确定多个全通滤波器组对应的多组初始滤波器参数;
基于所述多组初始滤波器参数,确定多条初始候选群时延响应曲线。
7.根据权利要求6所述的方法,其特征在于,所述确定多条初始候选群时延响应曲线之后,所述方法还包括:
基于预设算法对所述多条初始候选群时延响应曲线进行统计分析,确定出群时延响应曲线簇;
基于所述群时延响应曲线簇,并经人工听音识别,从所述群时延响应曲线簇中确定多个全通滤波器组对应的多条目标候选群时延响应曲线。
8.根据权利要求1所述的方法,其特征在于,所述确定所述多条目标候选群时延响应曲线对应的多组滤波器参数,包括:
利用所述预设均衡滤波器对应的群时延响应曲线,至少通过相减的方法对多个全通滤波器组对应的多条目标候选群时延响应曲线进行处理,得到所述多个全通滤波器组对应的多条目标群时延响应曲线;
基于所述多条目标群时延响应曲线,确定多个目标相位频响参数;
利用所述多个目标相位频响参数,确定多个目标传输函数;
利用所述多个目标传输函数,确定所述多条目标候选群时延响应曲线对应的一组滤波器参数。
9.根据权利要求6所述的方法,其特征在于,所述基于所述多组初始滤波器参数,确定多条初始候选群时延响应曲线,包括:
利用所述多组初始滤波器参数,确定出所述多个全通滤波器组的多个传输函数;
利用所述多个传输函数,确定所述多个全通滤波器组的多个相位频响参数;
利用所述多个相位频响参数,确定多条初始候选群时延响应曲线。
10.一种音频响度调节装置,其特征在于,所述音频响度调节装置中包括多个全通滤波器组,每个全通滤波器组中串联了一组全通滤波器,所述音频响度调节装置包括:
获取模块,用于获取多条目标候选群时延响应曲线,并确定所述多条目标候选群时延响应曲线对应的多组滤波器参数;
赋值模块,用于将所述多组滤波器参数分别赋值给所述多个全通滤波器组,其中,一组滤波器参数与一个全通滤波器组对应;
滤波模块,用于将预设音源信号输入所述多个全通滤波器组中进行滤波处理,得到每个全通滤波器组对应的滤波音源信号;
确定模块,用于对所述滤波音源信号进行响度预测,确定所述滤波音源信号对应的全通滤波器组的响度预测值;
调节模块,用于采用响度预测值最大的一组全通滤波器对待播放音频信号进行响度调节。
11.一种终端设备,其特征在于,所述终端设备包括:处理器、存储器及通信总线;所述处理器执行存储器存储的运行程序时实现如权利要求1-9任一项所述的方法。
12.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-9任一项所述的方法。
CN202211652388.4A 2022-12-21 2022-12-21 一种音频响度调节方法、装置、终端设备及存储介质 Pending CN115811690A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211652388.4A CN115811690A (zh) 2022-12-21 2022-12-21 一种音频响度调节方法、装置、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211652388.4A CN115811690A (zh) 2022-12-21 2022-12-21 一种音频响度调节方法、装置、终端设备及存储介质

Publications (1)

Publication Number Publication Date
CN115811690A true CN115811690A (zh) 2023-03-17

Family

ID=85486468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211652388.4A Pending CN115811690A (zh) 2022-12-21 2022-12-21 一种音频响度调节方法、装置、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN115811690A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117119358A (zh) * 2023-10-17 2023-11-24 武汉市聚芯微电子有限责任公司 一种声像偏侧的补偿方法、装置、电子设备及存储设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117119358A (zh) * 2023-10-17 2023-11-24 武汉市聚芯微电子有限责任公司 一种声像偏侧的补偿方法、装置、电子设备及存储设备
CN117119358B (zh) * 2023-10-17 2024-01-19 武汉市聚芯微电子有限责任公司 一种声像偏侧的补偿方法、装置、电子设备及存储设备

Similar Documents

Publication Publication Date Title
TWI535299B (zh) 低音強化系統及其方法
RU2541183C2 (ru) Способ и устройство для поддержки воспринимаемости речи в многоканальном звуковом сопровождении с минимальным влиянием на систему объемного звучания
US9391579B2 (en) Dynamic compensation of audio signals for improved perceived spectral imbalances
KR101681798B1 (ko) 스피커의 인지성 소리 강도를 증가시키는 시스템
RU2666316C2 (ru) Аппарат и способ улучшения аудиосигнала, система улучшения звука
KR100829567B1 (ko) 청각특성을 이용한 저음 음향 신호 보강 처리 방법 및 장치
KR20190143333A (ko) 오디오 디바이스상에서 재생을 위한 오디오 신호 프로세싱을 위한 시스템들 및 방법들
WO2009031871A2 (en) A method and an apparatus of decoding an audio signal
CN108886650A (zh) 用于音频再现的子带空间和串扰消除
CN111970628A (zh) 音频信号的增强方法、装置、存储介质和处理器
CN115866487B (zh) 一种基于均衡放大的音响功放方法及系统
CN115811690A (zh) 一种音频响度调节方法、装置、终端设备及存储介质
CN101422054B (zh) 声像定位装置
Romoli et al. A novel decorrelation approach for multichannel system identification
WO2011117028A1 (en) Method and arrangement for audio signal processing
Rämö et al. Graphic delay equalizer
CN109841223A (zh) 一种音频信号处理方法、智能终端及存储介质
Hoffmann et al. Smart Virtual Bass Synthesis algorithm based on music genre classification
CN115346544A (zh) 音频信号处理方法、装置、存储介质和程序产品
US11950089B2 (en) Perceptual bass extension with loudness management and artificial intelligence (AI)
Hoffmann et al. Towards audio signal equalization based on spectral characteristics of a listening room and music content reproduced
CN117119358B (zh) 一种声像偏侧的补偿方法、装置、电子设备及存储设备
CN113055809B (zh) 一种5.1声道信号生成方法、设备及介质
US20230085013A1 (en) Multi-channel decomposition and harmonic synthesis
Hoffmann et al. A concept of signal equalization method based on music genre and the listener's room characteristics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination