CN108174031A - 一种音量调节方法、终端设备及计算机可读存储介质 - Google Patents

一种音量调节方法、终端设备及计算机可读存储介质 Download PDF

Info

Publication number
CN108174031A
CN108174031A CN201711439914.8A CN201711439914A CN108174031A CN 108174031 A CN108174031 A CN 108174031A CN 201711439914 A CN201711439914 A CN 201711439914A CN 108174031 A CN108174031 A CN 108174031A
Authority
CN
China
Prior art keywords
loudness
audio
target
perceived
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711439914.8A
Other languages
English (en)
Other versions
CN108174031B (zh
Inventor
郑�和
邓岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Chuanying Information Technology Co Ltd
Original Assignee
Shanghai Spreadrise Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Spreadrise Technologies Co Ltd filed Critical Shanghai Spreadrise Technologies Co Ltd
Priority to CN201711439914.8A priority Critical patent/CN108174031B/zh
Publication of CN108174031A publication Critical patent/CN108174031A/zh
Application granted granted Critical
Publication of CN108174031B publication Critical patent/CN108174031B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions

Landscapes

  • Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种音量调节的方法、终端设备及计算机可读存储介质,其中方法包括:获取参考音频的感知响度作为参考响度;获取目标音频的感知响度作为目标响度;利用所述参考响度与所述目标响度得到响度增益;利用所述响度增益对所述目标音频的幅度值进行线性计算,得到处理后的目标音频。本发明实施例通过计算目标音频与参考音频的差值得到目标音频的响度增益,再利用该响度增益对目标音频进行处理,使得目标音频的感知响度与参考音频的感知响度一致,从而可以提高音量调节的效率。

Description

一种音量调节方法、终端设备及计算机可读存储介质
技术领域
本发明涉及通信技术领域,尤其涉及一种音量调节的方法、终端设备及计算机可读存储介质。
背景技术
音频应用内包含的音频文件由于来源不同,音量会有所不同,并且为了表达情感的起伏,即使在同一个音频文件内,音量也不是自始至终都保持一个大小。当音频播放时,人能主观感受到响度的差异。而响度为人耳对声音强弱感知的一个参量,是一个重要的心理声学参数。且响度不仅与音频的强度有关,还与声音的频率有关。
音频应用在播放音频的时候,往往不考虑前后两首歌曲的感知响度的变化,导致在音频软件在播放完一个音频文件,然后播放下一个音频文件的时候感知响度陡增。
如果前后两个音频文件的感知响度差异较大时,即使用户在播放前一个音频文件时调整出了在当前环境下对于用户来说最舒适的音量,但如果后一个音频的感知响度出现较大变化,用户就需要重新调整音量。播放的歌曲风格和数量越多,就需要更多次的手动调整,因此当前终端设备的音量调节的效率较低。
发明内容
本发明实施例提供一种音量调节方法,可提高终端设备的音量调节的效率。
第一方面,本发明实施例提供了一种音量调节的方法,该方法包括:
获取参考音频的感知响度作为参考响度;
获取目标音频的感知响度作为目标响度;
利用所述参考响度与所述目标响度得到响度增益;
利用所述响度增益对所述目标音频的幅度值进行线性计算,得到处理后的目标音频。
结合第一方面,在第一方面第一种实现中,所述获取参考音频的感知响度作为参考响度之前,还包括:
接收音量调节指令;
响应所述音量调节指令;
获取当前播放的音频作为所述参考音频。
结合第一方面,在第一方面第二种实现中,所述获取参考音频的感知响度作为参考响度,包括:
获取所述参考音频;
对所述参考音频进行心理声学分析扫描,获得所述参考音频的感知响度;
将所述参考音频的感知响度作为所述参考响度。
结合第一方面,在第一方面第三种实现中,所述获取目标音频的感知响度作为目标响度,包括:
获取目标音频;
对所述目标音频进行心理声学分析扫描,获得所述目标音频的感知响度;
将所述目标音频的感知响度作为所述目标响度。
结合第一方面第二种实现,在第一方面第四种实现中,所述对所述参考音频进行心理声学分析扫描,获得所述参考音频的感知响度,包括:
将所述参考音频通过A计权网络;
计算得到所述参考音频的感知响度;
所述L为所述参考音频的感知响度,所述LRMS为所述通过A计权网络的参考音频的每个采样点的幅度值的均方根,所述Lp-p为所述通过A计权网络的参考音频的的幅度值的平方的峰峰值。
结合第一方面,在第一方面第五种实现中,所述利用所述参考响度与所述目标响度得到响度增益,包括:
计算PG=L(Xi)-L(ref),得到所述增益响度;
所述PG为所述响度增益,所述L(Xi)为所述目标响度,所述L(ref)为所述参考响度。
结合第一方面至第一方面第六种实现中的任意一种实现,在第一方面第六种实现中,所述利用所述响度增益对所述目标音频的幅度值进行线性计算,得到处理后的目标音频,包括:
计算得到所述处理后的目标音频;
所述A(o)为所述经过线性计算的目标音频的各个采样点的幅度值,所述A(i)为所述目标音频的各个采样点的幅度值,所述PG为所述响度增益。
第二方面,本发明实施例提供了一种终端设备,该终端设备包括用于执行上述第一方面的方法的单元,该终端设备包括:
获取单元,用于获取参考音频的感知响度作为参考响度;还用于获取目标音频的感知响度作为目标响度。
计算单元,用于利用所述参考响度与所述目标响度得到响度增益;还用于利用所述响度增益对所述目标音频的幅度值进行线性计算,得到处理后的目标音频。
结合第二方面,在第二方面第一种实现中,还包括:
接收单元,用于在获取单元获取参考音频的感知响度作为参考响度之前,接收音量调节指令;
响应单元,用于响应所述音量调节指令。
相应的,获取单元,还用于获取当前播放的音频作为所述参考音频。
结合第二方面,在第二方面第二种实现中:
获取单元,还用于获取所述参考音频;
还包括控制单元,用于对所述参考音频进行心理声学分析扫描;
相应的,获取单元,还用于获得所述参考音频的感知响度;将所述参考音频的感知响度作为所述参考响度。
结合第二方面,在第二方面第三种实现中:
获取单元,还用于获取目标音频;
还包括控制单元,用于对所述目标音频进行心理声学分析扫描;
相应的,获取单元,还用于获得所述目标音频的感知响度;将所述目标音频的感知响度作为所述目标响度。
结合第二方面第二种实现,在第二方面第四种实现中:
控制单元,还用于将所述参考音频通过A计权网络;
计算单元,还用于计算得到所述参考音频的感知响度;所述L为所述参考音频的感知响度,所述LRMS为所述通过A计权网络的参考音频的每个采样点的幅度值的均方根,所述Lp-p为所述通过A计权网络的参考音频的的幅度值的平方的峰峰值。
结合第二方面,在第二方面第五种实现中:
计算单元,还用于计算PG=L(Xi)-L(ref);所述PG为所述响度增益,所述L(Xi)为所述目标响度,所述L(ref)为所述参考响度;
相应的,获取单元,还用于获取PG=L(Xi)-L(ref)的结果为所述增益响度。
结合第二方面至第二方面第六种实现中的任意一种实现,在第二方面第六种实现中:
计算单元,用于计算所述A(o)为所述经过线性计算的目标音频的各个采样点的幅度值,所述A(i)为所述目标音频的各个采样点的幅度值,所述PG为所述响度增益;
相应的,获取单元,还用于获取所述处理后的目标音频。
第三方面,本发明实施例提供了另一种终端设备,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持终端设备执行上述方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
本发明实施例通过计算目标音频与参考音频的差值得到目标音频的响度增益,再利用该响度增益对目标音频进行处理,使得目标音频的感知响度与参考音频的感知响度一致,从而可以提高音量调节的效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1是本发明实施例提供的一种音量调节的方法的示意流程图;
图2是本发明另一实施例提供的一种音量调节的方法的示意流程图;
图3是本发明实施例提供的一种终端设备的示意性框图;
图4是本发明另一实施例提供的一种终端设备示意性框图;
图5是本发明实施例提供的一种终端设备的结构示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
具体实现中,本发明实施例中描述的终端设备包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
在接下来的讨论中,描述了包括显示器和触摸敏感表面的终端设备。然而,应当理解的是,终端设备可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其它物理用户接口设备。
终端设备支持各种应用程序,例如以下中的一个或多个:绘图应用程序、演示应用程序、文字处理应用程序、网站创建应用程序、盘刻录应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、照片管理应用程序、数码相机应用程序、数字摄影机应用程序、web浏览应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。
可以在终端设备上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端设备上显示的相应信息。这样,终端设备的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。
参见图1,是本发明实施例提供一种音量调节的方法的示意流程图,如图所示方法可包括:
101:获取参考音频的感知响度作为参考响度。
在本发明实施例中,首先获取参考音频的感知响度作为参考响度,参考音频可以是被用户或者程序指定的任意一个音频文件,其中,感知响度为人耳对声音强弱感知的一个参量,响度描述的是声音的响亮程度,表示人耳对声音的主观感受,不仅考虑到人主观感受到的声音的大小与音频的强度有关,还与声音的频率有关。
进一步的,上述获取参考音频的感知响度作为参考响度之前,还包括:接收音量调节指令;响应音量调节指令;获取当前播放的音频作为参考音频。
在本发明实施例中,关于获取上述参考音频的过程,可以是在终端设备接收到音量调节指令,再响应该音量调节指令之后,便获取当前音频播放应用正在播放的音频作为参考音频。
需要说明的是,上述音量调节指令包括按下音量调节的按键,以及在显示屏上滑动或者点击音量调节图标等,上述响应音量调节指令为按照音量调节指令调大或者调小音量,上述音频播放应用包括音乐应用、收音机应用和外语学习应用等。
可选的,上述获取参考音频的感知响度作为参考响度,包括:获取参考音频;对参考音频进行心理声学分析扫描,获得参考音频的感知响度;将参考音频的感知响度作为参考响度。
在本发明实施例中,关于上述获取参考音频的感知响度作为参考响度的过程,可以是先获取参考音频,再利用心理声学分析扫描技术得到参考音频的感知响度,最后把该感知响度作为参考响度。
需要说明的是,上述心理声学分析扫描是将音频通过响度计算模型,从而得感知响度,以衡量人耳对不同强弱的声音的主观感受。其中,响度计算模型包括Stevens响度模型,Zwicker响度模型以及Moore响度模型等。
可选的,上述对参考音频进行心理声学分析扫描,获得参考音频的感知响度,包括:将参考音频通过A计权网络;计算得到参考音频的感知响度;L为参考音频的感知响度,LRMS为通过A计权网络的参考音频的每个采样点的幅度值的均方根,Lp-p为通过A计权网络的参考音频的的幅度值的平方的峰峰值。
在本发明实施例中,关于上述对参考音频进行心理声学分析扫描,获得参考音频的感知响度,可以是先将参考音频通过A计权网络,然后利用公式计算参考音频的感知响度,其中,L为参考音频的感知响度,上述LRMS为通过A计权网络的参考音频的每个采样点的幅度值的均方根,上述Lp-p为通过A计权网络的参考音频的的幅度值的平方的峰峰值。
需要说明的是,上述A计权网络为对不同频率的声音信号实行不同程度的衰减,能模拟人耳听觉在不同频率有不同的灵敏性的特性,是一种能把音频信号修正为与人耳听感近似值的电信号的网络。令参考音频通过A计权网络之后的音频为特殊音频,上述LRMS为该特殊音频的每个采样点的幅度值的均方根,具体的:
其中,n为采样点个数,L1为第一个采样点的幅度值,L2为第二个采样点的幅度值......Ln为第n个采样点的幅度值。
上述Lp-p为该特殊音频的的幅度值的平方的峰峰值,具体的:
Lp-p=2A2
其中,A为上述特殊音频的最大幅度值。
102:获取目标音频的感知响度作为目标响度。
在本发明实施例中,获取目标音频的感知响度作为目标响度,其中,目标音频可以为用户或者系统任意指定的非参考音频的音频。
举例来说,用户打开音乐应用之后播放任意一首歌曲,然后调节了音量的大小,手机在接收到音量调节指令并响应该音量调节指令之后,将用户在调节音量时播放的歌曲作为参考音频,在之后若手机未接收到音量调节指令,则后续播放的其他音乐都是目标音频,只有手机再次接收到音量调节的指令的时候,手机再重新确定参考音频和目标音频。
可选的,上述获取目标音频的感知响度作为目标响度,包括:获取目标音频;对目标音频进行心理声学分析扫描,获得目标音频的感知响度;将目标音频的感知响度作为目标响度。
在本发明实施例中,上述关于获取目标音频的感知响度作为目标响度的方法,可以由上述获取参考音频的感知响度作为参考响度的方法类似得到,具体过程不再赘述。
103:利用参考响度与目标响度得到响度增益。
在本发明实施例中,上述目标响度与参考响度的差值为响度增益。
具体的,上述利用参考响度与目标响度得到响度增益,包括:计算PG=L(Xi)-L(ref),得到增益响度;PG为响度增益,L(Xi)为目标响度,L(ref)为参考响度。
需要说明的是,上述响度增益大于零时,表示目标音频的感知响度比参考音频的感知响度大,因此终端设备需要将目标音频的感知响度调低;当响度增益小于零时,表示目标音频的感知响度比参考音频的感知响度小,因此终端设备需要将目标音频的感知响度调高;当响度增益等于零时,表示目标音频的感知响度比参考音频的感知响度一致,因此不用进行响度调节。
104:利用响度增益对目标音频的幅度值进行线性计算,得到处理后的目标音频。
需要说明的是,上述线性计算表示对目标音频的幅度值进行整体的缩放。
具体的,上述利用响度增益对目标音频的幅度值进行线性计算,得到处理后的目标音频,包括:计算得到处理后的目标音频;A(o)为经过线性计算的目标音频的各个采样点的幅度值,A(i)为目标音频的各个采样点的幅度值,PG为响度增益。
本发明实施例通过计算目标音频与参考音频的差值得到目标音频的响度增益,再利用该响度增益对目标音频进行处理,使得目标音频的感知响度与参考音频的感知响度一致,从而可以提高音量调节的效率。
参见图2,是本发明另一实施例提供一种音量调节的方法的示意流程图,如图所示方法可包括:
201:接收音量调节指令。
在本发明实施例中,上述音量调节指令包括按下音量调节的按键,以及在显示屏上滑动或者点击音量调节图标等。
202:响应音量调节指令。
在本发明实施例中,上述响应音量调节指令为按照音量调节指令调大或者调小音量。
203:获取当前播放的音频作为参考音频。
204:获取参考音频的感知响度作为参考响度。
在本发明实施例中,首先获取参考音频的感知响度作为参考响度,参考音频可以是被用户或者程序指定的任意一个音频文件,其中,感知响度为人耳对声音强弱感知的一个参量,响度描述的是声音的响亮程度,表示人耳对声音的主观感受,不仅考虑到人主观感受到的声音的大小与音频的强度有关,还与声音的频率有关。
可选的,上述获取参考音频的感知响度作为参考响度,包括:获取参考音频;对参考音频进行心理声学分析扫描,获得参考音频的感知响度;将参考音频的感知响度作为参考响度。
在本发明实施例中,关于上述获取参考音频的感知响度作为参考响度的过程,可以是先获取参考音频,再利用心理声学分析扫描技术得到参考音频的感知响度,最后把该感知响度作为参考响度。
需要说明的是,上述心理声学分析扫描是将音频通过响度计算模型,从而得感知响度,以衡量人耳对不同强弱的声音的主观感受。其中,响度计算模型包括Stevens响度模型,Zwicker响度模型以及Moore响度模型等。
可选的,上述对参考音频进行心理声学分析扫描,获得参考音频的感知响度,包括:将参考音频通过A计权网络;计算得到参考音频的感知响度;L为参考音频的感知响度,LRMS为通过A计权网络的参考音频的每个采样点的幅度值的均方根,Lp-p为通过A计权网络的参考音频的的幅度值的平方的峰峰值。
在本发明实施例中,关于上述对参考音频进行心理声学分析扫描,获得参考音频的感知响度,可以是先将参考音频通过A计权网络,然后利用公式计算参考音频的感知响度,其中,L为参考音频的感知响度,上述LRMS为通过A计权网络的参考音频的每个采样点的幅度值的均方根,上述Lp-p为通过A计权网络的参考音频的的幅度值的平方的峰峰值。
需要说明的是,上述A计权网络为对不同频率的声音信号实行不同程度的衰减,能模拟人耳听觉在不同频率有不同的灵敏性的特性,是一种能把音频信号修正为与人耳听感近似值的电信号的网络。令参考音频通过A计权网络之后的音频为特殊音频,上述LRMS为该特殊音频的每个采样点的幅度值的均方根,具体的:
其中,n为采样点个数,L1为第一个采样点的幅度值,L2为第二个采样点的幅度值......Ln为第n个采样点的幅度值。
上述Lp-p为该特殊音频的的幅度值的平方的峰峰值,具体的:
Lp-p=2A2
其中,A为上述特殊音频的最大幅度值。
205:获取目标音频的感知响度作为目标响度。
在本发明实施例中,获取目标音频的感知响度作为目标响度,其中,目标音频可以为用户或者系统任意指定的非参考音频的音频。
举例来说,用户打开音乐应用之后播放任意一首歌曲,然后调节了音量的大小,手机在接收到音量调节指令并响应该音量调节指令之后,将用户在调节音量时播放的歌曲作为参考音频,在之后若手机未接收到音量调节指令,则后续播放的其他音乐都是目标音频,只有手机再次接收到音量调节的指令的时候,手机再重新确定参考音频和目标音频。
可选的,上述获取目标音频的感知响度作为目标响度,包括:获取目标音频;对目标音频进行心理声学分析扫描,获得目标音频的感知响度;将目标音频的感知响度作为目标响度。
在本发明实施例中,上述关于获取目标音频的感知响度作为目标响度的方法,可以由上述获取参考音频的感知响度作为参考响度的方法类似得到,具体过程不再赘述。
206:利用参考响度与目标响度得到响度增益;
在本发明实施例中,上述目标响度与参考响度的差值为响度增益。
具体的,上述利用参考响度与目标响度得到响度增益,包括:计算PG=L(Xi)-L(ref),得到增益响度;PG为响度增益,L(Xi)为目标响度,L(ref)为参考响度。
需要说明的是,上述响度增益大于零时,表示目标音频的感知响度比参考音频的感知响度大,因此终端设备需要将目标音频的感知响度调低;当响度增益小于零时,表示目标音频的感知响度比参考音频的感知响度小,因此终端设备需要将目标音频的感知响度调高;当响度增益等于零时,表示目标音频的感知响度比参考音频的感知响度一致,因此不用进行响度调节。
207:利用响度增益对目标音频的幅度值进行线性计算,得到处理后的目标音频。
需要说明的是,上述线性计算表示对目标音频的幅度值进行整体的缩放。
具体的,上述利用响度增益对目标音频的幅度值进行线性计算,得到处理后的目标音频,包括:计算得到处理后的目标音频;A(o)为经过线性计算的目标音频的各个采样点的幅度值,A(i)为目标音频的各个采样点的幅度值,PG为响度增益。
本发明实施例与上一实施例的不同之处在于,在获取目标音频时候,是通过收到音量调节指令来触发的,即在终端设备每次接收到音量调节指令时,重新确定当前播放的音频为目标音频,从而通过计算目标音频与参考音频的差值得到目标音频的响度增益,再利用该响度增益对目标音频进行处理,使得目标音频的感知响度与参考音频的感知响度一致,从而进一步的可以提高音量调节的效率。
本发明实施例还提供一种终端设备,该终端设备用于执行前述任一项的方法的单元。具体地,参见图3,是本发明实施例提供的一种终端设备的示意框图。本实施例的终端设备包括:获取单元301以及计算单元302。具体的:
获取单元301,用于获取参考音频的感知响度作为参考响度;还用于获取目标音频的感知响度作为目标响度;还用于获取目标音频;还用于获取参考音频。
计算单元302,用于利用参考响度与目标响度得到响度增益;还用于利用响度增益对目标音频的幅度值进行线性计算,得到处理后的目标音频。
具体的,计算单元302用于计算PG=L(Xi)-L(ref),其中,PG为响度增益,L(Xi)为目标响度,L(ref)为参考响度;用于计算其中,A(o)为经过线性计算的目标音频的各个采样点的幅度值,A(i)为目标音频的各个采样点的幅度值,PG为响度增益。
本发明实施例通过获取单元获取参考音频的感知响度为参考响度以及获取目标音频的感知响度为目标响度,然后计算单元计算目标音频与参考音频的差值得到目标音频的响度增益,计算单元再利用该响度增益对目标音频进行处理,使得目标音频的感知响度与参考音频的感知响度一致,从而可以提高音量调节的效率。
请一并参阅图4,图4是本发明实施例公开的另一种终端设备的结构示意图。其中,图4所示的终端设备是由图3所示的终端设备进行优化得到的。与图3所示的终端设备相比较,图4所示的终端设备中,还包括接收单元303、响应单元304以及控制单元305。具体的:
接收单元303,用于获取单元301获取参考音频的感知响度作为参考响度之前,接收音量调节指令。
响应单元304,用于响应上述音量调节指令。
相应的,获取单元301,用于获取当前播放的音频作为参考音频。
控制单元305,对参考音频以及目标音频进行心理声学分析扫描。
具体的,将参考音频以及目标音频分别通过A计权网络。
相应的,计算单元302,用于计算L为参考音频的感知响度,LRMS为通过A计权网络的参考音频的每个采样点的幅度值的均方根,Lp-p为通过A计权网络的参考音频的的幅度值的平方的峰峰值。
相应的,获取单元301,用于获得参考音频以及目标音频的感知响度。
本发明实施例与上一实施例的不同之处在于,本发明实施例所描述的终端设备还包括接收单元、响应单元以及控制单元。具体的,获取单元在获取目标音频时候,是通过接收单元收到音量调节指令来触发的,即在接收单元每次接收到音量调节指令时,获取单元重新确定当前播放的音频为目标音频,从而通过计算单元计算目标音频与参考音频的差值得到目标音频的响度增益,计算单元再利用该响度增益对目标音频进行处理,使得目标音频的感知响度与参考音频的感知响度一致,从而进一步的可以提高音量调节的效率。
参见图5,是本发明另一实施例提供的一种终端设备示意框图。如图所示的本实施例中的终端设备可以包括:一个或多个处理器501;一个或多个输入设备502,一个或多个输出设备503和存储器504。上述处理器501、输入设备502、输出设备503和存储器504通过总线505连接。存储器502用于存储计算机程序,计算机程序包括程序指令,处理器501用于执行存储器502存储的程序指令。
处理器,用于执行获取单元301与计算单元302的功能。
具体的,用于执行获取单元301的功能,用于获取参考音频的感知响度作为参考响度,获取目标音频的感知响度作为目标响度,以及获取目标音频和参考音频;还用于执行计算单元302的功能,用于利用参考响度与目标响度得到响度增益;还用于利用响度增益对目标音频的幅度值进行线性计算,得到处理后的目标音频。
进一步具体的,用于执行计算单元302的功能,用于计算PG=L(Xi)-L(ref),其中,PG为响度增益,L(Xi)为目标响度,L(ref)为参考响度;用于计算其中,A(o)为经过线性计算的目标音频的各个采样点的幅度值,A(i)为目标音频的各个采样点的幅度值,PG为响度增益。
输入设备,用于执行接收单元303的功能,用于获取单元301获取参考音频的感知响度作为参考响度之前,接收音量调节指令。
输出设备,用于执行响应单元304的功能,用于响应上述音量调节指令。
相应的,处理器,用于获取当前播放的音频作为参考音频;对参考音频以及目标音频进行心理声学分析扫描;将参考音频以及目标音频分别通过A计权网络;计算其中,L为参考音频的感知响度,LRMS为通过A计权网络的参考音频的每个采样点的幅度值的均方根,Lp-p为通过A计权网络的参考音频的的幅度值的平方的峰峰值,获得参考音频以及目标音频的感知响度。
应当理解,在本发明实施例中,所称处理器501可以是中央处理单元(CentralProcessing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备502可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等,输出设备503可以包括显示器(LCD等)、扬声器等。
该存储器504可以包括只读存储器和随机存取存储器,并向处理器501提供指令和数据。存储器504的一部分还可以包括非易失性随机存取存储器。例如,存储器504还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器501、输入设备502、输出设备503可执行本发明实施例提供的音量调节的方法的第一实施例和第二实施例中所描述的实现方式,也可执行本发明实施例所描述的终端设备的实现方式,在此不再赘述。
在本发明的另一实施例中提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,程序指令被处理器执行。
计算机可读存储介质可以是前述任一实施例的终端设备的内部存储单元,例如终端设备的硬盘或内存。计算机可读存储介质也可以是终端设备的外部存储设备,例如终端设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,计算机可读存储介质还可以既包括终端设备的内部存储单元也包括外部存储设备。计算机可读存储介质用于存储计算机程序以及终端设备所需的其他程序和数据。计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端设备和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (10)

1.一种音量调节的方法,其特征在于,包括:
获取参考音频的感知响度作为参考响度;
获取目标音频的感知响度作为目标响度;
利用所述参考响度与所述目标响度得到响度增益;
利用所述响度增益对所述目标音频的幅度值进行线性计算,得到处理后的目标音频。
2.根据权利要求1所述的方法,其特征在于,所述获取参考音频的感知响度作为参考响度之前,还包括:
接收音量调节指令;
响应所述音量调节指令;
获取当前播放的音频作为所述参考音频。
3.根据权利要求1所述的方法,其特征在于,所述获取参考音频的感知响度作为参考响度,包括:
获取所述参考音频;
对所述参考音频进行心理声学分析扫描,获得所述参考音频的感知响度;
将所述参考音频的感知响度作为所述参考响度。
4.根据权利要求1所述的方法,其特征在于,所述获取目标音频的感知响度作为目标响度,包括:
获取所述目标音频;
对所述目标音频进行心理声学分析扫描,获得所述目标音频的感知响度;
将所述目标音频的感知响度作为所述目标响度。
5.根据权利要求3所述的方法,其特征在于,所述对所述参考音频进行心理声学分析扫描,获得所述参考音频的感知响度,包括:
将所述参考音频通过A计权网络;
计算得到所述参考音频的感知响度;
所述L为所述参考音频的感知响度,所述LRMS为所述通过A计权网络的参考音频的每个采样点的幅度值的均方根,所述Lp-p为所述通过A计权网络的参考音频的的幅度值的平方的峰峰值。
6.根据权利要求1所述的方法,其特征在于,所述利用所述参考响度与所述目标响度得到响度增益,包括:
计算PG=L(Xi)-L(ref),得到所述增益响度;
所述PG为所述响度增益,所述L(Xi)为所述目标响度,所述L(ref)为所述参考响度。
7.根据权利要求1-6任意一项所述的方法,其特征在于,所述利用所述响度增益对所述目标音频的幅度值进行线性计算,得到处理后的目标音频,包括:
计算得到所述处理后的目标音频;
所述A(o)为所述经过线性计算的目标音频的各个采样点的幅度值,所述A(i)为所述目标音频的各个采样点的幅度值,所述PG为所述响度增益。
8.一种终端设备,其特征在于,包括用于执行如权利要求1-7任一权利要求所述的方法的单元。
9.一种终端设备,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
CN201711439914.8A 2017-12-26 2017-12-26 一种音量调节方法、终端设备及计算机可读存储介质 Active CN108174031B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711439914.8A CN108174031B (zh) 2017-12-26 2017-12-26 一种音量调节方法、终端设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711439914.8A CN108174031B (zh) 2017-12-26 2017-12-26 一种音量调节方法、终端设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN108174031A true CN108174031A (zh) 2018-06-15
CN108174031B CN108174031B (zh) 2020-12-01

Family

ID=62521908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711439914.8A Active CN108174031B (zh) 2017-12-26 2017-12-26 一种音量调节方法、终端设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN108174031B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109217834A (zh) * 2018-10-19 2019-01-15 歌尔科技有限公司 增益调整方法、音频设备及可读存储介质
CN109658942A (zh) * 2018-12-27 2019-04-19 腾讯音乐娱乐科技(深圳)有限公司 一种音频数据处理方法、装置以及相关设备
CN110231087A (zh) * 2019-06-06 2019-09-13 江苏省广播电视集团有限公司 一种高清电视音频响度分析报警及归一化制作方法和设备
CN111048063A (zh) * 2019-12-13 2020-04-21 集奥聚合(北京)人工智能科技有限公司 音频合成方法及装置
CN111767022A (zh) * 2020-06-30 2020-10-13 成都极米科技股份有限公司 音频调节方法、装置、电子设备及计算机可读存储介质
CN112951266A (zh) * 2021-02-05 2021-06-11 杭州网易云音乐科技有限公司 齿音调整方法、装置、电子设备及计算机可读存储介质
CN113470692A (zh) * 2020-03-31 2021-10-01 北京字节跳动网络技术有限公司 音频处理方法、装置、可读介质及电子设备
CN114708872A (zh) * 2022-03-22 2022-07-05 青岛海尔科技有限公司 语音指令的响应方法及装置、存储介质及电子装置
CN116033314A (zh) * 2023-02-15 2023-04-28 南昌航天广信科技有限责任公司 一种音频自动增益补偿方法、系统、计算机及存储介质
WO2024207714A1 (zh) * 2023-04-07 2024-10-10 海能达通信股份有限公司 一种终端通信方法及设备、存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101573866A (zh) * 2007-01-03 2009-11-04 杜比实验室特许公司 混合数字/模拟响度补偿音量控制
CN102999492A (zh) * 2011-09-08 2013-03-27 百度在线网络技术(北京)有限公司 一种调整媒体文件音量的方法与设备
CN103618514A (zh) * 2013-10-31 2014-03-05 小米科技有限责任公司 音量调节方法、装置和电子设备
CN103841241A (zh) * 2012-11-21 2014-06-04 联想(北京)有限公司 音量调整方法及装置
CN104393848A (zh) * 2014-10-27 2015-03-04 常州听觉工坊智能科技有限公司 音量调节方法及装置
CN104471855A (zh) * 2012-07-12 2015-03-25 Dts公司 具有噪声检测和响度下降检测的响度控制
CN104636111A (zh) * 2015-02-15 2015-05-20 联想(北京)有限公司 信息处理方法及电子设备
US20160191007A1 (en) * 2014-12-31 2016-06-30 Stmicroelectronics Asia Pacific Pte Ltd Adaptive loudness levelling method for digital audio signals in frequency domain
CN105825859A (zh) * 2011-05-13 2016-08-03 三星电子株式会社 比特分配、音频编码和解码
CN106354469A (zh) * 2016-08-24 2017-01-25 北京奇艺世纪科技有限公司 一种响度调节方法及装置
CN106658327A (zh) * 2015-10-28 2017-05-10 音乐集团公司 声级估计
CN106980487A (zh) * 2017-04-05 2017-07-25 深圳天珑无线科技有限公司 音频控制方法和音频控制装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101573866A (zh) * 2007-01-03 2009-11-04 杜比实验室特许公司 混合数字/模拟响度补偿音量控制
CN105825859A (zh) * 2011-05-13 2016-08-03 三星电子株式会社 比特分配、音频编码和解码
CN102999492A (zh) * 2011-09-08 2013-03-27 百度在线网络技术(北京)有限公司 一种调整媒体文件音量的方法与设备
CN104471855A (zh) * 2012-07-12 2015-03-25 Dts公司 具有噪声检测和响度下降检测的响度控制
CN103841241A (zh) * 2012-11-21 2014-06-04 联想(北京)有限公司 音量调整方法及装置
CN103618514A (zh) * 2013-10-31 2014-03-05 小米科技有限责任公司 音量调节方法、装置和电子设备
CN104393848A (zh) * 2014-10-27 2015-03-04 常州听觉工坊智能科技有限公司 音量调节方法及装置
US20160191007A1 (en) * 2014-12-31 2016-06-30 Stmicroelectronics Asia Pacific Pte Ltd Adaptive loudness levelling method for digital audio signals in frequency domain
CN104636111A (zh) * 2015-02-15 2015-05-20 联想(北京)有限公司 信息处理方法及电子设备
CN106658327A (zh) * 2015-10-28 2017-05-10 音乐集团公司 声级估计
CN106354469A (zh) * 2016-08-24 2017-01-25 北京奇艺世纪科技有限公司 一种响度调节方法及装置
CN106980487A (zh) * 2017-04-05 2017-07-25 深圳天珑无线科技有限公司 音频控制方法和音频控制装置

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109217834A (zh) * 2018-10-19 2019-01-15 歌尔科技有限公司 增益调整方法、音频设备及可读存储介质
CN109217834B (zh) * 2018-10-19 2022-06-21 歌尔科技有限公司 增益调整方法、音频设备及可读存储介质
CN109658942A (zh) * 2018-12-27 2019-04-19 腾讯音乐娱乐科技(深圳)有限公司 一种音频数据处理方法、装置以及相关设备
CN110231087A (zh) * 2019-06-06 2019-09-13 江苏省广播电视集团有限公司 一种高清电视音频响度分析报警及归一化制作方法和设备
CN110231087B (zh) * 2019-06-06 2021-07-23 江苏省广播电视集团有限公司 一种高清电视音频响度分析报警及归一化制作方法和设备
CN111048063A (zh) * 2019-12-13 2020-04-21 集奥聚合(北京)人工智能科技有限公司 音频合成方法及装置
CN113470692B (zh) * 2020-03-31 2024-02-02 抖音视界有限公司 音频处理方法、装置、可读介质及电子设备
CN113470692A (zh) * 2020-03-31 2021-10-01 北京字节跳动网络技术有限公司 音频处理方法、装置、可读介质及电子设备
WO2022001569A1 (zh) * 2020-06-30 2022-01-06 成都极米科技股份有限公司 音频调节方法、装置、电子设备及计算机可读存储介质
CN111767022B (zh) * 2020-06-30 2023-08-08 成都极米科技股份有限公司 音频调节方法、装置、电子设备及计算机可读存储介质
CN111767022A (zh) * 2020-06-30 2020-10-13 成都极米科技股份有限公司 音频调节方法、装置、电子设备及计算机可读存储介质
CN112951266A (zh) * 2021-02-05 2021-06-11 杭州网易云音乐科技有限公司 齿音调整方法、装置、电子设备及计算机可读存储介质
CN112951266B (zh) * 2021-02-05 2024-02-06 杭州网易云音乐科技有限公司 齿音调整方法、装置、电子设备及计算机可读存储介质
CN114708872A (zh) * 2022-03-22 2022-07-05 青岛海尔科技有限公司 语音指令的响应方法及装置、存储介质及电子装置
CN116033314A (zh) * 2023-02-15 2023-04-28 南昌航天广信科技有限责任公司 一种音频自动增益补偿方法、系统、计算机及存储介质
WO2024207714A1 (zh) * 2023-04-07 2024-10-10 海能达通信股份有限公司 一种终端通信方法及设备、存储介质

Also Published As

Publication number Publication date
CN108174031B (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN108174031A (zh) 一种音量调节方法、终端设备及计算机可读存储介质
CN109087669B (zh) 音频相似度检测方法、装置、存储介质及计算机设备
CN104538011B (zh) 一种音调调节方法、装置及终端设备
EP2939151B1 (en) Method and apparatus for generating audio information
CN109982231B (zh) 一种信息处理方法、设备及存储介质
US20230252964A1 (en) Method and apparatus for determining volume adjustment ratio information, device, and storage medium
KR20040022442A (ko) 스피커 등화 툴
CN110809214B (zh) 音频播放方法、音频播放装置及终端设备
CN110599989B (zh) 音频处理方法、装置及存储介质
CN113921022B (zh) 音频信号分离方法、装置、存储介质和电子设备
CN105139848B (zh) 数据转换方法和装置
CN107169920A (zh) 一种智能修图方法及终端
CN106714033A (zh) 一种防止音频设备破音的方法及终端
CN111508510A (zh) 音频处理方法、装置、存储介质及电子设备
CN101714861A (zh) 谐波产生装置及其产生方法
CN109147816A (zh) 对音乐进行音量调节的方法及设备
CN110675848A (zh) 音频处理方法、装置及存储介质
US20120053937A1 (en) Generalizing text content summary from speech content
CN114879929A (zh) 多媒体文件播放方法及其装置
Swift et al. Extending sharpness calculation for an alternative loudness metric input
CN111782859B (zh) 一种音频可视化方法、装置和存储介质
CN106658232B (zh) 标签编辑的方法及电子终端
KR100580783B1 (ko) 측정 모드에 따른 음질 평가 장치 및 방법
CN110660376B (zh) 音频处理方法、装置及存储介质
CN107978014A (zh) 一种粒子渲染方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221220

Address after: 201203 1st floor, building 1, Lane 36, Xuelin Road, Pudong New Area Free Trade Zone, Shanghai

Patentee after: SHANGHAI TRANSSION INFORMATION TECHNOLOGY Ltd.

Address before: Room 922 / 926, block a, No.1 Lane 399, shengxia Road, Pudong New Area pilot Free Trade Zone, Shanghai 201203

Patentee before: SHANGHAI SPREADRISE COMMUNICATION TECHNOLOGY Ltd.