CN112040373B - 一种音频数据处理方法、计算设备及可读存储介质 - Google Patents
一种音频数据处理方法、计算设备及可读存储介质 Download PDFInfo
- Publication number
- CN112040373B CN112040373B CN202011203269.1A CN202011203269A CN112040373B CN 112040373 B CN112040373 B CN 112040373B CN 202011203269 A CN202011203269 A CN 202011203269A CN 112040373 B CN112040373 B CN 112040373B
- Authority
- CN
- China
- Prior art keywords
- data
- audio data
- gain adjustment
- frequency
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 68
- 230000003044 adaptive effect Effects 0.000 claims abstract description 5
- 238000004806 packaging method and process Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 36
- 210000005069 ears Anatomy 0.000 claims description 20
- 230000008447 perception Effects 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 14
- 230000008859 change Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000007723 transport mechanism Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
本发明公开了一种音频数据处理方法,该方法包括:获取目标音频数据;根据音响设备当前的音量值对目标音频数据进行增益调整,获得第一处理数据;对第一处理数据进行插值处理,获得第二处理数据;将第二处理数据封装成与音响设备相适应的音频数据包,并发送给音响设备进行播放。本发明一并公开了相应的计算设备及可读存储介质。
Description
技术领域
本发明涉及音频处理领域,尤其涉及一种音频数据处理方法、计算设备及可读存储介质。
背景技术
随着信息时代音频数据的多样化,人对于声音的要求更加严格,对声音的质量以及声音变化的舒适度有了更高的要求。音量又称响度,人耳感受到的声音强弱,它是人对声音大小的一个主观感觉量,响度的大小决定于声音接收处的声波的振幅,就同一声源来说,声波传播的愈远,响度愈小,当传播距离一定时,声源振幅愈大,响度愈大,所以,声音的大小与音响设备当前输入的功率成线性关系,在保证声音不失真的前提下,输入功率越大,音响输出的声音越强。然而,人耳感受的响度与实际的声音是非线性关系,在小音量的时候,人耳对中高频的听觉会有生理性衰减,音量越小,这种衰减越明显,音响设备,当用户调节音量时(假设音量变化可以从0-100%),在高音量(如75%以上)时,缓慢匀速拖动滑块增大音量,人耳感受到的音量突然急速变大,有爆音的可能,产生导致人耳受到一定伤害的风险。同时,在低音量时(如25%以下),匀速拖动减小音量,人耳感知的音量会急剧减小,严重影响用户实际体验。
如何减轻这种影响,使人耳感知舒适的线性音量变化成为了一个人们在声音设备中需要迫切解决的问题。这里涉及一个等响度的概念,实现等响度控制,可以达到这一目的,等响度控制的作用是在低音量和高音量时提升高频和低频成分的音量,使得低、中、高部分的响度比例保持和在中等音量时的响度比例相同,由于人耳对高频声、特别是低频声的听觉灵敏度差,要求在低音量和高音量时对高频和低频进行听觉补偿,即要求对低频部分和高频部分有一定量的提升。
现阶段,市面上多数终端音乐播放器、智能手机等都未进行系统音量设置和音响设备声音分贝(decibel,dB)的线性匹配,部分音响设备在硬件端通过数字电路实现对声音的补偿,通常通过一个等响度开关控制,高端的音响电路包含多个等级的补偿,以此来降低人耳感受声音的突兀性。但补偿电路较为复杂,且不能通过上层音频相关应用来进行配置,联动性较差。部分上层应用同样采用前置放大的方案。简单的将响度级与音量做幂指转换,最终效果并不理想,因为他们之间的关系并不是简单线性关系。
发明内容
为此,本发明提供了一种音频数据处理方法、计算设备及可读存储介质,以力图解决或者至少缓解上面存在的问题。
根据本发明的一个方面,提供一种音频数据处理方法,方法包括:获取目标音频数据;根据音响设备当前的音量值对目标音频数据进行增益调整,获得第一处理数据;对第一处理数据进行插值处理,获得第二处理数据;将第二处理数据封装成与音响设备相适应的音频数据包,并发送给音响设备进行播放。
可选的,在根据本发明的音频处理方法中,根据音响设备当前的音量值对目标音频数据进行增益调整,获得第一处理数据包括:获取音响设备当前的音量值;根据音量值对目标音频数据进行第一增益调整,获得第一增益调整数据;根据音量值对第一增益调整数据进行第二增益调整,获得第一处理数据。
可选的,在根据本发明的音频处理方法中,根据音量值对目标音频数据进行第一增益调整,获得第一增益调整数据包括:对目标音频数据进行解码,获得PCM音频数据;从PCM音频数据中分离出左声道数据和右声道数据;对左声道数据和右声道数据进行增益调整;将增益调整后的左声道数据和右声道数据进行合并,获得第一增益调整数据。
可选的,在根据本发明的音频处理方法中,对左声道数据和右声道数据进行增益调整包括:对左声道数据和右声道数据进行滤波;根据音响设备当前的音量值计算第一增益系数;获取左声道数据和右声道数据中的低频数据和高频数据;根据第一增益系数对低频数据和高频数据进行增益调整。
可选的,在根据本发明的音频处理方法中,第一增益系数的计算公式为
-2×P’+2(0≤P’≤50%)
P1={
2×P’ (50%<P’≤100%),其中,P’为音响设备当前的音量值。
可选的,在根据本发明的音频处理方法中,获取左声道数据和右声道数据中的低频数据和高频数据包括:对左声道数据和右声道数据进行傅里叶变化,获得当前数据的频率;根据频率获取当前数据的频率属性,频率属性包括低频、中频和高频。
可选的,在根据本发明的音频处理方法中,根据音量值对第一增益调整数据进行第二增益调整,获得第一处理数据包括:获取人耳感知响度与声压值的第一关系;获取当前音响设备的声压值与音量值之间的第二关系;根据第一关系和第二关系获取音量值与人耳感知响度的第三关系;根据第三关系对第一增益数据进行增益调整,以使人耳感知响度随音量值成线性变换。
可选的,在根据本发明的音频处理方法中,对第一处理数据进行插值处理,获得第二处理数据包括:依次获取相邻的两个音频数据;在相邻两各音频数据中间插入第三音频数据,第三音频数据的值A3=(A1+A2)/2,其中,A1为相邻两个音频数据中前一个音频数据的值,A2为相邻两个音频数据中后一个音频数据的值。
根据本发明的另一个方面,提供一种音频数据处理装置,装置包括:音频获取单元,适于获取目标音频数据;第一音频处理单元,根据音响设备当前的音量值对目标音频数据进行增益调整,获得第一处理数据;第二音频处理单元,适于对第一处理数据进行插值处理,获得第二处理数据;第三音频处理单元,对第二处理数据封装成与音响设备相适应的音频数据包,并传递给音响设备进行播放。
根据本发明的另一个方面,提供一种音频播放器,包括:音频数据处理装置,适于本发明的音频数据处理方法;音响设备,适于播放音频处理装置输出的音频数据。
根据本发明的另一个方面,提供一种计算设备,包括:至少一个处理器;以及存储器,存储有程序指令,其中,程序指令被配置为适于由至少一个处理器执行,程序指令包括用于执行本发明的音频数据处理方法的指令。
根据本发明的另一个方面,提供一种存储有程序指令的可读存储介质,当程序指令被计算设备读取并执行时,使得计算设备执行本发明的音频数据处理方法。
根据本发明的音频数据处理方法,在音量调节过程中,根据音响设备当前的音量值对音频数据进行增益调整,实现等响度控制,即在低音量和高音量时提升高频和低频成分的音量,使音频数据中低频、中频、高频部分的响度比例与中等音量时的响度比例保持一致,这样在音量调节过程中,使人耳对声音的感知是线性变化的,而非急剧减小或者增大,提升了用户体验。本发明通过软件的方式实现了与硬件等响补偿电路同样的效果,使得等响度曲线变得平滑,在音量调节过程中使得人耳感知的响度变化呈线性变化,由于软件具有更好的联动性,参数随时可调,对于应用开发者来说更能控和便捷。
另一方面,根据本发明的音频数据处理方法,通过对音频数据进行插值处理,避免了音频数据进行增益放大后相邻个数据之间差异增大导致的声音失真,在相邻两个音频数据中插入一个平均值实现数据平滑过渡。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的计算设备100 的框图;
图2示出了根据本发明一个实施例的音频数据处理方法200的流程图;
图3示出了根据本发明一个实施例的音频数据处理装置300的框图;
图4示出了根据本发明一个实施例的增益系数与音量的关系曲线;
图5示出了根据本发明一个实施例的音频数据处理后的等响度曲线效果图;
图6示出了根据本发明一个实施例的人耳感应到的响度和声音实际响度的线性关系曲线。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的计算设备100的示意图。需要说明的是,图1所示的计算设备100仅为一个示例,在实践中,用于实施本发明的音频数据处理方法的计算设备可以是任意型号的设备,其硬件配置情况可以与图1所示的计算设备100相同,也可以与图1所示的计算设备100不同。实践中用于实施本发明的音频数据处理方法的计算设备可以对图1所示的计算设备100的硬件组件进行增加或删减,本发明对计算设备的具体硬件配置情况不做限制。
如图1所示,在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(µP)、微控制器(µC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。计算设备中的物理内存通常指的是易失性存储器RAM,磁盘中的数据需要加载至物理内存中才能够被处理器104读取。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上由一个或多个处理器104利用程序数据124执行指令。操作系统120例如可以是Linux、Windows等,其包括用于处理基本系统服务以及执行依赖于硬件的任务的程序指令。应用122包括用于实现各种用户期望的功能的程序指令,应用122例如可以是浏览器、即时通讯软件、软件开发工具(例如集成开发环境IDE、编译器等)等,但不限于此。当应用122被安装到计算设备100中时,可以向操作系统120添加驱动模块。
在计算设备100启动运行时,处理器104会从存储器106中读取操作系统120的程序指令并执行。应用122运行在操作系统120之上,利用操作系统120以及底层硬件提供的接口来实现各种用户期望的功能。当用户启动应用122时,应用122会加载至存储器106中,处理器104从存储器106中读取并执行应用122的程序指令。
计算设备100还包括储存设备132,储存设备132包括可移除储存器136和不可移除储存器138,可移除储存器136和不可移除储存器138均与储存接口总线134连接。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
在根据本发明的计算设备100中,应用122包括用于执行本发明的音频数据处理方法200的指令,该指令可以指示处理器104执行本发明的音频数据处理方法200。
图2示出了根据本发明一个实施例的音频数据处理方法200的流程图,适于在计算设备(例如图1中的计算设备)中执行,该计算设备可以内置有音响设备或者与音响设备相连接。
如图2所示,音频数据处理方法200始于步骤S210,在步骤S210中获取音频数据,即要处理的音频数据,也称之为目标音频数据,该音频数据可以是CD格式、wave格式、 MPEG格式等,但不限于此。
随后进入步骤S220,对音频数据进行解码,即将CD格式、wave格式、 MPEG格式的音频文件解码成脉冲编码调制(Pulse Code Modulation,PCM)音频数据。
随后在步骤S230中,将解码后的PCM音频数据进行拆分,拆分成左声道数据和右声道数据。根据本发明的一个实施例,第一个音频数据划分为左声道,第二个音频数据划分为右声道,第三个音频数据划分成左声道,第四个音频数据划分为右声道,以此类推。
随后进入步骤S240,对左声道和右声道中的音频数据进行增益调整。因为人耳的特性,在低音量和高音量时,人耳对低频和高频的信号变得不敏感,这就导致在音量变化特别是音量变得很小的时候,音乐整体变味儿,与中高音量时听到的歌声感觉不一样,通过本步骤,可以对低音量和高音量中的低频和高频信号进行增益调整。
根据本发明的一个实施例,将高频段和低频段的增益系数(即第一增益系数)的取值范围设置成1到2,本发明以最小音量为0,最大音量为100%进行说明,增益系数与音量的关系曲线如图4所示,当音量从0变换到50%时,增益系数从2线性变换为1,当音量从50%变换到100%时,增益系数从1变换成2,因此,第一增益系数P1与音量值P’之间的关系可以表示通过公式1)表示。
-2×P’+2(0≤P’≤50%)
P1={
2×P’ (50%<P’≤100%) 1)
也就是说,音量值P’为50%时不需要增益,当音量趋近0和100%时,增益系数为2。
根据本发明的一个实施例, 在人耳可听到的声音的频率范围在20Hz到20000Hz内,本实施例按照20Hz至200Hz为低频,200Hz至6000Hz为中频,6000Hz至20000Hz为高频的标准划分音频数据的频率属性,本发明对此不做限制,也可以采用其他方式进行划分。每个PCM采样数据记录的是不同时刻采样点的振幅的数据,为了获得采样数据的频率,本实施例通过对每个音频数据包采样数据做快速傅里叶变换(Fast Fourier Transform,FFT)运算,得到当前音频数据包的频率,根据频率获取当前数据所属的频段范围,如果是高频数据或者低频数据,则根据当前音响的音量值对数据进行相应的增益调整,得到新的音频数据。例如,傅里叶变换后的频率为150Hz,属于低频数据,当前音量值为20%时,根据公式1)需要将音频数据乘以增益系数1.6进行调整。
经过步骤S240调整完后的新的音频数据,通过步骤S250进行反向融合,即将左声道数据和右声道数据合成单声道数据,获得第一处理数据。
经过以上步骤处理后的音频数据提高了音色,但对总体音量的线性度影响不大,所以需要继续对数据做线性处理,以保证音量调节时,人耳能感知到音量呈线性变化。
随后在步骤S260中,根据音响设备当前的音量值进行第二增益调整,以达到人耳感知线性的目标。
在音量调节过程中,音量和声音振幅成正比关系,而人耳主观感受到的响度与音量则成幂指关系,因此,听觉主观感知上的线性度,和声信号强度的线性度是两回事。
人耳对声音的感知是通过声压变化产生的,在声波作用下,空气发生胀疏,压强发生正负变化,从而产生声音。但是人耳是不能直接感受到这种压强变化的过程,由于周期性变化很快(可听声频率范围:20Hz-20KHz),人耳只能听到一个稳定声音,这时候声压的实际效果与声波在时间上的平均效果相关,即常说的有效声压,本文中如无特别注明,声压指有效声压。人耳可以听到的声压范围自20微帕斯卡(μPa)至20帕斯卡(Pa),强度范围极广,所以这也是听力器官自我保护的一种手段,不至于声压稍大就影响听觉系统的功能。由于宽广的听觉范围和幂数律的感知系统,用有效声压来衡量声强弱很不方便。所以,在声学领域,通常采用声压级(dB分贝)来衡量声压强弱,以人耳刚刚能听到的声音为基准声压,,求与其比值的对数。这样就把原来与主观感知呈幂指关系的声压转换成与主观感知呈线性关系的分贝,具体为公式2)。
Lp=20lg(P/P0) 2)
声压级本质上还是物理上的波动现象,而另一个概念响度则描述的是人的主观感受了,响度的客观单位为方(phon),其数值和1kHz所代表的声压级相同,简单来说,因为响度是一个主观感受量,并且会随频率不同被人耳感知程度不同,所以,将一个声音在1kHz的声压级数值,作为该声音的响度客观值。如,在1kHz的频率上,声压级为60dBSPL信号的响度为60方。由于这种客观单位只是非常有限地表达了人耳对于响度的反应,因此可以引入一个关于响度的主观概念响度级,单位为“宋(Sone)”,表示人耳在自然状态下,根据声压级的变化所表现出的对于响度听感的变化。“宋”与“方”的关系表现为1宋等于40方(即在等响曲线图中,1kHz处代表40dBSPL),并且以1宋为标准,在2宋时响度增加一倍,在0.5宋时响度减小一倍。对于其他频率的声压级,则要根据等响曲线换算成1000Hz下的声压级。
响度和响度级之间的关系通过公式3)表示,其中N为响度,为响度级。
N=2(L N -40)/10 3)
根据公式2)和3)可以推倒出人耳感知响度与声压值的第一关系,如公式4)所示。
N=(500×P)0.602 4)
其中,P为当前音响设备的声压,声压与声源的振幅、频率、声源与人的距离和环境颗粒物速度有关。在本文中,声源的频率和环境颗粒物速度固定,距离也是固定的,所以声压与振幅呈线性关系,又由于振幅与声音设备的音量值呈线性关系,因而,当前音响设备的声压值P与音量值呈线性关系,即P=kP’(第二关系),P’为当前音响设备的音量值,k为音响设备的系数,系数k根据不同的音响设备会有不同,但是对于同一个音响设备,该系数是固定的。
从而可以推倒出,当前音响设备的音量值与人耳感知到的响度之间的关系(第三关系)可以表示成如公式5所示的关系。
P’=10-9.27/N/k 5)
其中,为当前音响设备的音量值,k为音响设备的系数,N为人耳感知到的响度。
根据公式5)可以得出,当N线性变化时,音响设备音量值的变换规律,因此,在音响设备进行音量调整过程中,要根据公式5)对音频数据进行增益调整,以保证调节音响设备音量值时人耳听到的响度N线性变化。
随后进入步骤S270,对调整后的音频数据进行插帧处理。因为音频数据在增益调整后,相邻两个音频数据之间的差值变大,为了使其平滑过渡,在相邻的两个音频数据中插入一个平均值来使其平滑过渡。
根据本发明的一个实施例,在相邻的两个PCM数据中间插入一个数值,该数据值为相邻两帧的平均值,计算公式如6),其中,A1为相邻两个音频数据中前一个的音频数据的值,A2为后一个的音频数据的值。
A3=(A1+A2)/2 6)
最终通过步骤S280,将讲过前述步骤处理后的PCM音频数据分装成与音响设备相适应的音频数据包发送给音响设备。因为在步骤S270中,插入了新的数据,导致音频数据变长,而底层音响驱动获取的包长度是固定的,直接将变长的数据传输给底层会导致越界或数据丢失,所以需要将新的数据进行拆分,原数据长度理论上扩大了一倍,即将新数据拆分成两个包即可。拆分后按顺序及时传给底层驱动进行播放。
根据本发明的音频处理方法,使得等响度曲线更加平滑,如图5所示,其中灰色曲线是音频数据处理前的等响度曲线,黑色曲线为处理后的等响度曲线。
根据本发明的音频数据处理方法对音频数据处理后,人耳感应到的响度和声音实际的响度呈线性关系,如图6所示。
图3示出了根据本发明一个实施例的音频数据处理装置的框图。如图3所示,音频数据处理装置包括音频获取单元310、第一音频处理单元320、第二音频处理单元330和第三音频处理单元340。
音频获取单元310适于接收音频文件,并将所接收到的音频数据发送给第一音频处理单元320。音频文件可以是CD格式、wave格式、 MPEG格式等,但不限于此。
第一音频处理单元320接收音频获取单元310发送的音频数据,进行增益处理。其中包括第一增益调整和第二增益调整。
第一增益调整包括将音频数据解码成PCM音频数据,并拆分为左声道数据和右声道数据,对所述左声道数据和右声道数据中的低频部分和高频部分根据当前音响设备的音量进行调整,最后将左右两个声道中的数据进行合并。
第二增益调整主要完成在音量调解过程中,使人耳能感知线性变化。
第二音频处理单元330主要完成插值处理,因为在增益调整后,数据之间的差值变大,为了使数据平滑过渡,在相邻两个数据中间插入该相邻两个数值的平均值以达到平滑过渡的效果。
第三音频处理单元340主要完成音频数据分包处理。因为插值操作导致数据长度变大,底层驱动获取的包长度是固定的,直接将变长的数据传输给底层会导致越界或数据丢失,所以需要将新的数据进行拆分,插值操作刚好原数据长度扩大一倍,因此,将新数据拆分成两个包即可,拆分后按顺序及时传给底层驱动。
根据本发明的音频数据处理方法,在音量调节过程中,根据音响设备当前的音量值对音频数据进行增益调整,实现等响度控制,即在低音量和高音量时提升高频和低频成分的音量,使音频数据中低频、中频、高频部分的响度比例与中等音量时的响度比例保持一致,这样在音量调节过程中,使人耳对声音的感知是线性变化的,而非急剧减小或者增大,提升了用户体验。本发明通过软件的方式实现了与硬件等响补偿电路同样的效果,使得等响度曲线变得平滑,在音量调节过程中使得人耳感知的响度变化呈线性变化,由于软件具有更好的联动性,参数随时可调,对于应用开发者来说更能控和便捷。
另一方面,根据本发明的音频数据处理方法,通过对音频数据进行插值处理,避免了音频数据进行增益放大后相邻个数据之间差异增大导致的声音失真,在相邻两个音频数据中插入一个平均值实现数据平滑过渡。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的音频数据处理方法。
以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
Claims (7)
1.一种音频数据处理方法,所述方法包括:
获取目标音频数据;
根据音响设备当前的音量值对所述目标音频数据进行增益调整,获得第一处理数据,具体为:
获取所述音响设备当前的音量值;
根据所述音量值对所述目标音频数据进行第一增益调整,获得第一增益调整数据,包括:对所述目标音频数据进行解码,获得PCM音频数据;从所述PCM音频数据中分离出左声道数据和右声道数据;对所述左声道数据和右声道数据进行滤波;根据所述音响设备当前的音量值计算第一增益系数;获取所述左声道数据和右声道数据中的低频数据和高频数据;根据所述第一增益系数对所述低频数据和高频数据进行增益调整;将增益调整后的左声道数据和右声道数据进行合并,获得第一增益调整数据;
根据所述音量值对所述第一增益调整数据进行第二增益调整,获得第一处理数据;
对所述第一处理数据进行插值处理,获得第二处理数据;
将所述第二处理数据封装成与所述音响设备相适应的音频数据包,并发送给所述音响设备进行播放。
2.如权利要求1所述的方法,其中,所述获取所述左声道数据和右声道数据中的低频数据和高频数据包括:
对所述左声道数据和右声道数据进行傅里叶变化,获得当前数据的频率;
根据所述频率获取当前数据的频率属性,所述频率属性包括低频、中频和高频。
3.如权利要求1或2所述的方法,其中,所述根据所述音量值对所述第一增益调整数据进行第二增益调整,获得第一处理数据包括:
获取人耳感知响度与声压值的第一关系;
获取当前音响设备的声压值与音量值之间的第二关系;
根据所述第一关系和第二关系获取所述音量值与人耳感知响度的第三关系;
根据所述第三关系对所述第一增益调整数据进行增益调整,以使人耳感知响度随音量值呈线性变换。
4.一种音频数据处理装置,所述装置包括:
音频获取单元,适于获取目标音频数据;
第一音频处理单元,根据音响设备当前的音量值对所述目标音频数据进行增益调整,获得第一处理数据;具体为:
获取所述音响设备当前的音量值;
根据所述音量值对所述目标音频数据进行第一增益调整,获得第一增益调整数据,包括:对所述目标音频数据进行解码,获得PCM音频数据;从所述PCM音频数据中分离出左声道数据和右声道数据;对所述左声道数据和右声道数据进行滤波;根据所述音响设备当前的音量值计算第一增益系数;获取所述左声道数据和右声道数据中的低频数据和高频数据;根据所述第一增益系数对所述低频数据和高频数据进行增益调整;将增益调整后的左声道数据和右声道数据进行合并,获得第一增益调整数据;
根据所述音量值对所述第一增益调整数据进行第二增益调整,获得第一处理数据;
第二音频处理单元,适于对所述第一处理数据进行插值处理,获得第二处理数据;
第三音频处理单元,对所述第二处理数据封装成与所述音响设备相适应的音频数据包,并传递给所述音响设备进行播放。
5.一种音频播放器,包括:
音频数据处理装置,适于执行权利要求1-3中任一项所述的方法;
音响设备,适于播放所述音频数据处理装置输出的音频数据。
6.一种计算设备,包括:
至少一个处理器;以及
存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-3中任一项所述方法的指令。
7.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-3中任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011203269.1A CN112040373B (zh) | 2020-11-02 | 2020-11-02 | 一种音频数据处理方法、计算设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011203269.1A CN112040373B (zh) | 2020-11-02 | 2020-11-02 | 一种音频数据处理方法、计算设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112040373A CN112040373A (zh) | 2020-12-04 |
CN112040373B true CN112040373B (zh) | 2021-04-23 |
Family
ID=73572658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011203269.1A Active CN112040373B (zh) | 2020-11-02 | 2020-11-02 | 一种音频数据处理方法、计算设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112040373B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115474927A (zh) * | 2022-08-09 | 2022-12-16 | Oppo广东移动通信有限公司 | 听力检测方法、装置、电子设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101421781A (zh) * | 2006-04-04 | 2009-04-29 | 杜比实验室特许公司 | 音频信号的感知响度和/或感知频谱平衡的计算和调整 |
CN101573866A (zh) * | 2007-01-03 | 2009-11-04 | 杜比实验室特许公司 | 混合数字/模拟响度补偿音量控制 |
CN101577848A (zh) * | 2009-03-12 | 2009-11-11 | 北京中星微电子有限公司 | 一种重低音增强方法及系统 |
EP2334103A2 (en) * | 2009-12-09 | 2011-06-15 | Samsung Electronics Co., Ltd. | Sound enhancement apparatus and method |
CN104378075A (zh) * | 2008-12-24 | 2015-02-25 | 杜比实验室特许公司 | 频域中的音频信号响度确定和修改 |
CN104869503A (zh) * | 2015-03-23 | 2015-08-26 | 深圳市冠旭电子有限公司 | 一种基于等响曲线的动态低频加强方法及系统 |
WO2017206619A1 (zh) * | 2016-05-30 | 2017-12-07 | 华为技术有限公司 | 一种音量调节的方法及装置 |
CN108924447A (zh) * | 2018-08-21 | 2018-11-30 | 青岛海信电器股份有限公司 | 一种音量调节方法及设备 |
CN109040885A (zh) * | 2017-06-09 | 2018-12-18 | 中国科学院声学研究所 | 一种基于音量的个性化响度补偿方法及耳机均衡系统 |
CN109473115A (zh) * | 2018-11-22 | 2019-03-15 | 四川长虹电器股份有限公司 | 数字音频信号音量等响度调节方法 |
US10785569B2 (en) * | 2015-09-30 | 2020-09-22 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI350653B (en) * | 2007-10-19 | 2011-10-11 | Realtek Semiconductor Corp | Automatic gain control device and method |
US8553897B2 (en) * | 2009-06-09 | 2013-10-08 | Dean Robert Gary Anderson | Method and apparatus for directional acoustic fitting of hearing aids |
-
2020
- 2020-11-02 CN CN202011203269.1A patent/CN112040373B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101421781A (zh) * | 2006-04-04 | 2009-04-29 | 杜比实验室特许公司 | 音频信号的感知响度和/或感知频谱平衡的计算和调整 |
CN101573866A (zh) * | 2007-01-03 | 2009-11-04 | 杜比实验室特许公司 | 混合数字/模拟响度补偿音量控制 |
CN104378075A (zh) * | 2008-12-24 | 2015-02-25 | 杜比实验室特许公司 | 频域中的音频信号响度确定和修改 |
CN101577848A (zh) * | 2009-03-12 | 2009-11-11 | 北京中星微电子有限公司 | 一种重低音增强方法及系统 |
EP2334103A2 (en) * | 2009-12-09 | 2011-06-15 | Samsung Electronics Co., Ltd. | Sound enhancement apparatus and method |
CN104869503A (zh) * | 2015-03-23 | 2015-08-26 | 深圳市冠旭电子有限公司 | 一种基于等响曲线的动态低频加强方法及系统 |
US10785569B2 (en) * | 2015-09-30 | 2020-09-22 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
WO2017206619A1 (zh) * | 2016-05-30 | 2017-12-07 | 华为技术有限公司 | 一种音量调节的方法及装置 |
CN109040885A (zh) * | 2017-06-09 | 2018-12-18 | 中国科学院声学研究所 | 一种基于音量的个性化响度补偿方法及耳机均衡系统 |
CN108924447A (zh) * | 2018-08-21 | 2018-11-30 | 青岛海信电器股份有限公司 | 一种音量调节方法及设备 |
CN109473115A (zh) * | 2018-11-22 | 2019-03-15 | 四川长虹电器股份有限公司 | 数字音频信号音量等响度调节方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112040373A (zh) | 2020-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9729969B2 (en) | System and method for bass enhancement | |
US9837971B2 (en) | Method and system for excursion protection of a speaker | |
JP6026751B2 (ja) | 振幅値を利用した音響−触覚効果変換システム | |
US8116480B2 (en) | Filter coefficient calculation device, filter coefficient calculation method, control program, computer-readable storage medium, and audio signal processing apparatus | |
JP6436934B2 (ja) | 動的閾値を用いた周波数帯域圧縮 | |
US20190199309A1 (en) | Techniques for Distortion Reducing Multi-Band Compressor with Timbre Preservation | |
US8275152B2 (en) | Dynamic bass boost filter | |
WO2017215657A1 (zh) | 音效处理方法及终端设备 | |
JP2017055406A (ja) | ラウドネスに基づくオーディ信号補償 | |
US20170026771A1 (en) | Audio Signal Processing | |
JP2001168665A (ja) | デジタル・グラフイックイコライザー制御システム及びその方法 | |
JP2013102411A (ja) | 音声信号処理装置、および音声信号処理方法、並びにプログラム | |
CN109686347A (zh) | 音效处理方法、音效处理装置、电子设备和可读介质 | |
JP2012235310A (ja) | 信号処理装置および方法、プログラム、並びにデータ記録媒体 | |
JP2015050685A (ja) | オーディオ信号処理装置および方法、並びにプログラム | |
CN111508510B (zh) | 音频处理方法、装置、存储介质及电子设备 | |
CN112040373B (zh) | 一种音频数据处理方法、计算设备及可读存储介质 | |
JP2008507934A (ja) | 音声強調 | |
JP5459556B2 (ja) | 音響特性調整装置、音響特性調整方法およびコンピュータプログラム | |
CN102576560B (zh) | 电子音频设备 | |
WO2013064311A1 (en) | Numeric audio signal equalization | |
EP3603106A1 (en) | Dynamically extending loudspeaker capabilities | |
JP5714039B2 (ja) | 測定装置および測定方法 | |
JP5205526B1 (ja) | 測定装置および測定方法 | |
US11343635B2 (en) | Stereo audio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |