CN109547848B - 响度调整方法、装置、电子设备以及存储介质 - Google Patents
响度调整方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN109547848B CN109547848B CN201811409335.3A CN201811409335A CN109547848B CN 109547848 B CN109547848 B CN 109547848B CN 201811409335 A CN201811409335 A CN 201811409335A CN 109547848 B CN109547848 B CN 109547848B
- Authority
- CN
- China
- Prior art keywords
- loudness
- sound signal
- value
- target
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
- H04N21/2335—Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4398—Processing of audio elementary streams involving reformatting operations of audio signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/27—Server based end-user applications
- H04N21/274—Storing end-user multimedia data in response to end-user request, e.g. network recorder
- H04N21/2743—Video hosting of uploaded data from client
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本公开是关于一种响度调整方法、装置、电子设备以及存储介质,主要涉及多媒体技术领域,所述方法包括:将多媒体资源的声音信号转换为第一频域信号;基于第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,第二频域信号用于体现第一频域信号在当前电子设备上播放时的响度;基于第二频域信号和目标响度,对声音信号的响度进行调整,得到多媒体资源的目标声音信号。本公开考虑到当前电子设备的频率响应信息,将原始信号转换为能够体现信号在当前电子设备上播放时的响度的频域信号,从而调整后的声音信号在该当前电子设备上进行播放时的响度接近于目标响度,而不仅仅是调整声音信号本身的响度,与用户听觉特性匹配,响度调整的效果好。
Description
技术领域
本公开涉及多媒体技术领域,尤其涉及一种响度调整方法、装置、电子设备以及存储介质。
背景技术
随着多媒体技术的发展,人们通常会通过多媒体应用观看或收听各种多媒体资源,其中,短视频应用即是一种多媒体应用。在这种多媒体应用中,多媒体资源多是用户原创内容(User Generated Content,UGC),则一个多媒体资源内部可能声音响度不同,导致用户听到的声音响度忽大忽小,且多个多媒体资源的声音响度也可能不同,用户在多媒体资源切换过程中,可能听到的声音响度也忽大忽小,因而通常会对多媒体资源的响度进行调整。
相关技术中,第一种响度调整方法通常是:对于一个多媒体资源,计算该多媒体资源的声音信号的平均值,从而通过调整增益,将该多媒体资源的声音信号的响度均调整到平均值。还有第二种响度调整方法是利用自动增益控制(Automatic Gain Control,AGC)的方式,实时根据输入的声音信号的幅度和目标幅度自动调节增益值,使得根据增益值调整后的声音信号的幅度接近于目标幅度,该目标幅度实时根据输入的声音信号的幅度确定。
上述响度调整方法中仅是通过声音幅度或能量进行调整,并未考虑到设备的频率响应,不同设备的频率响应可能不同,同一多媒体资源在不同设备上播放时可能因频率响应不同用户听到的声音的响度可能也不同,因而上述方法中调整后的响度不能够完全匹配人的听觉特性。且上述第一种方法中也仅是考虑到单个多媒体资源内的响度调整,多个多媒体资源的响度还是可能不一致,因而上述响度调整方法的效果差。
发明内容
本公开提供一种响度调整方法、装置、电子设备以及存储介质,能够克服上述调整后的响度不完全匹配人的听觉特性和效果差的问题。
根据本公开实施例的第一方面,提供一种响度调整方法,包括:
将多媒体资源的声音信号转换为第一频域信号;
基于所述第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,所述第二频域信号用于体现所述第一频域信号在所述当前电子设备上播放时的响度;
基于所述第二频域信号和目标响度,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号。
在一种可能实现方式中,所述基于所述第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,包括:
基于所述第一频域信号和所述当前电子设备的第一信息,获取第三频域信号,所述第一信息用于体现声音信号的幅度随频率的变化而变化的情况;
基于所述第三频域信号和所述当前电子设备的第二信息,获取所述第二频域信号,所述第二信息用于体现声音信号的响度随频率的变化而变化的情况。
在一种可能实现方式中,所述基于所述第二频域信号和目标响度,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号,包括:
基于所述第二频域信号和目标响度,获取所述声音信号的响度调整值;
基于所述响度调整值,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号。
在一种可能实现方式中,所述基于所述第二频域信号和目标响度,获取所述声音信号的响度调整值,包括:
获取所述第二频域信号的响度的最大值和平均值;
基于所述最大值、所述平均值和所述目标响度,获取所述声音信号的响度调整值。
在一种可能实现方式中,所述基于所述最大值、所述平均值和所述目标响度,获取所述声音信号的响度调整值,包括:
获取所述目标响度和所述平均值的第一差值;
获取响度阈值与所述最大值的第二差值;
基于所述第一差值与所述第二差值,获取所述声音信号的响度调整值。
在一种可能实现方式中,所述基于所述第一差值与所述第二差值,获取所述声音信号的响度调整值,包括:
当所述第一差值和所述第二差值满足目标条件时,对所述第一差值和第二差值进行加权求和,得到所述声音信号的响度调整值,所述目标条件为所述第一差值大于或等于零且所述第一差值大于所述第二差值;或,
当所述第一差值和所述第二差值不满足目标条件时,获取所述第一差值作为所述声音信号的响度调整值。
在一种可能实现方式中,所述基于所述响度调整值,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号,包括:
基于响度阈值与所述响度调整值,获取压缩器的阈值;
基于所述响度调整值,获取所述压缩器的增益值;
将所述声音信号输入所述压缩器中,由所述压缩器基于所述阈值和所述增益值,对所述声音信号的响度进行调整,输出所述多媒体资源的目标声音信号。
在一种可能实现方式中,所述方法还包括:
当所述目标声音信号中包括响度大于所述响度阈值的至少一帧目标声音信号时,将所述至少一帧目标声音信号的响度调整为所述响度阈值。
在一种可能实现方式中,所述当所述目标声音信号中包括响度大于所述响度阈值的至少一帧目标声音信号时,将所述至少一帧目标声音信号的响度调整为所述响度阈值,包括:
将所述目标声音信号输入限幅器中,由所述限幅器将所述目标声音信号中响度大于所述响度阈值的至少一帧目标声音信号进行调整,输出调整后的目标声音信号。
根据本公开实施例的第二方面,提供一种响度调整装置,包括:
转换模块,被配置为执行将多媒体资源的声音信号转换为第一频域信号;
获取模块,被配置为执行基于所述第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,所述第二频域信号用于体现所述第一频域信号在所述当前电子设备上播放时的响度;
调整模块,被配置为执行基于所述第二频域信号和目标响度,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号。
在一种可能实现方式中,所述获取模块被配置为执行:
基于所述第一频域信号和所述当前电子设备的第一信息,获取第三频域信号,所述第一信息用于体现声音信号的幅度随频率的变化而变化的情况;
基于所述第三频域信号和所述当前电子设备的第二信息,获取所述第二频域信号,所述第二信息用于体现声音信号的响度随频率的变化而变化的情况。
在一种可能实现方式中,所述调整模块被配置为执行:
基于所述第二频域信号和目标响度,获取所述声音信号的响度调整值;
基于所述响度调整值,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号。
在一种可能实现方式中,所述调整模块被配置为执行:
获取所述第二频域信号的响度的最大值和平均值;
基于所述最大值、所述平均值和所述目标响度,获取所述声音信号的响度调整值。
在一种可能实现方式中,所述调整模块被配置为执行:
获取所述目标响度和所述平均值的第一差值;
获取响度阈值与所述最大值的第二差值;
基于所述第一差值与所述第二差值,获取所述声音信号的响度调整值。
在一种可能实现方式中,所述调整模块被配置为执行:
当所述第一差值和所述第二差值满足目标条件时,对所述第一差值和第二差值进行加权求和,得到所述声音信号的响度调整值,所述目标条件为所述第一差值大于或等于零且所述第一差值大于所述第二差值;或,
当所述第一差值和所述第二差值不满足目标条件时,获取所述第一差值作为所述声音信号的响度调整值。
在一种可能实现方式中,所述调整模块被配置为执行:
基于响度阈值与所述响度调整值,获取压缩器的阈值;
基于所述响度调整值,获取所述压缩器的增益值;
将所述声音信号输入所述压缩器中,由所述压缩器基于所述阈值和所述增益值,对所述声音信号的响度进行调整,输出所述多媒体资源的目标声音信号。
在一种可能实现方式中,所述调整模块还被配置为当所述目标声音信号中包括响度大于所述响度阈值的至少一帧目标声音信号时,执行将所述至少一帧目标声音信号的响度调整为所述响度阈值。
在一种可能实现方式中,所述调整模块还被配置为执行将所述目标声音信号输入限幅器中,由所述限幅器将所述目标声音信号中响度大于所述响度阈值的至少一帧目标声音信号进行调整,输出调整后的目标声音信号。
根据本公开实施例的第三方面,提供一种电子设备,该电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
将多媒体资源的声音信号转换为第一频域信号;
基于所述第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,所述第二频域信号用于体现所述第一频域信号在所述当前电子设备上播放时的响度;
基于所述第二频域信号和目标响度,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,该非临时性计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种响度调整方法,所述方法包括:
将多媒体资源的声音信号转换为第一频域信号;
基于所述第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,所述第二频域信号用于体现所述第一频域信号在所述当前电子设备上播放时的响度;
基于所述第二频域信号和目标响度,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号。
根据本公开实施例的第五方面,提供一种应用程序,包括一条或多条指令,该一条或多条指令可以由电子设备的处理器执行时,使得电子设备能够执行一种响度调整方法,所述方法包括:
将多媒体资源的声音信号转换为第一频域信号;
基于所述第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,所述第二频域信号用于体现所述第一频域信号在所述当前电子设备上播放时的响度;
基于所述第二频域信号和目标响度,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号。
本公开的实施例提供的技术方案可以包括以下有益效果:本公开实施例中考虑到了当前电子设备的频率响应信息,将原始信号转换为能够体现该信号在当前电子设备上播放时的响度的频域信号,从而基于该频域信号和目标响度,对原始信号进行调整,从而调整后的声音信号在该当前电子设备上进行播放时的响度接近于目标响度,而不仅仅是调整声音信号本身的响度,与用户听觉特性匹配,且该目标声音信号的响度基于目标响度调整,对多个多媒体资源进行调整时,得到的响度均一致,可以有效解决用户听到的声音时大时小的问题,响度调整的效果好。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种响度调整方法的流程图。
图2是根据一示例性实施例示出的一种响度调整方法的流程图。
图3是根据一示例性实施例示出的一种电子设备的第一信息的示意图。
图4是根据一示例性实施例示出的一种电子设备的第二信息的示意图。
图5是根据一示例性实施例示出的一种响度调整方法的流程图。
图6是根据一示例性实施例示出的一种响度调整装置的框图。
图7是根据一示例性实施例示出的一种终端的结构框图。
图8是根据一示例性实施例示出的一种服务器的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种响度调整方法的流程图,如图1所示,该响度调整方法用于电子设备中,包括以下步骤。
在步骤S11中,电子设备将多媒体资源的声音信号转换为第一频域信号。
在步骤S12中,电子设备基于该第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,该第二频域信号用于体现该第一频域信号在该当前电子设备上播放时的响度。
在步骤S13中,电子设备基于该第二频域信号和目标响度,对该声音信号的响度进行调整,得到该多媒体资源的目标声音信号。
本公开实施例中考虑到了当前电子设备的频率响应信息,将原始信号转换为能够体现该信号在当前电子设备上播放时的响度的频域信号,从而基于该频域信号和目标响度,对原始信号进行调整,从而调整后的声音信号在该当前电子设备上进行播放时的响度接近于目标响度,而不仅仅是调整声音信号本身的响度,与用户听觉特性匹配,且该目标声音信号的响度基于目标响度调整,对多个多媒体资源进行调整时,得到的响度均一致,可以有效解决用户听到的声音时大时小的问题,响度调整的效果好。
在一种可能实现方式中,该基于该第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,包括:
基于该第一频域信号和该当前电子设备的第一信息,获取第三频域信号,该第一信息用于体现声音信号的幅度随频率的变化而变化的情况;
基于该第三频域信号和该当前电子设备的第二信息,获取该第二频域信号,该第二信息用于体现声音信号的响度随频率的变化而变化的情况。
在一种可能实现方式中,该基于该第二频域信号和目标响度,对该声音信号的响度进行调整,得到该多媒体资源的目标声音信号,包括:
基于该第二频域信号和目标响度,获取该声音信号的响度调整值;
基于该响度调整值,对该声音信号的响度进行调整,得到该多媒体资源的目标声音信号。
在一种可能实现方式中,该基于该第二频域信号和目标响度,获取该声音信号的响度调整值,包括:
获取该第二频域信号的响度的最大值和平均值;
基于该最大值、该平均值和该目标响度,获取该声音信号的响度调整值。
在一种可能实现方式中,该基于该最大值、该平均值和该目标响度,获取该声音信号的响度调整值,包括:
获取该目标响度和该平均值的第一差值;
获取响度阈值与该最大值的第二差值;
基于该第一差值与该第二差值,获取该声音信号的响度调整值。
在一种可能实现方式中,该基于该第一差值与该第二差值,获取该声音信号的响度调整值,包括:
当该第一差值和该第二差值满足目标条件时,对该第一差值和第二差值进行加权求和,得到该声音信号的响度调整值,该目标条件为该第一差值大于或等于零且该第一差值大于该第二差值;或,
当该第一差值和该第二差值不满足目标条件时,获取该第一差值作为该声音信号的响度调整值。
在一种可能实现方式中,该基于该响度调整值,对该声音信号的响度进行调整,得到该多媒体资源的目标声音信号,包括:
基于响度阈值与该响度调整值,获取压缩器的阈值;
基于该响度调整值,获取该压缩器的增益值;
将该声音信号输入该压缩器中,由该压缩器基于该阈值和该增益值,对该声音信号的响度进行调整,输出该多媒体资源的目标声音信号。
在一种可能实现方式中,该方法还包括:
当该目标声音信号中包括响度大于该响度阈值的至少一帧目标声音信号时,将该至少一帧目标声音信号的响度调整为该响度阈值。
在一种可能实现方式中,该当该目标声音信号中包括响度大于该响度阈值的至少一帧目标声音信号时,将该至少一帧目标声音信号的响度调整为该响度阈值,包括:
将该目标声音信号输入限幅器中,由该限幅器将该目标声音信号中响度大于该响度阈值的至少一帧目标声音信号进行调整,输出调整后的目标声音信号。
图2是根据一示例性实施例示出的一种响度调整方法的流程图,该响度调整方法应用于电子设备上,该电子设备可以为终端,也可以为服务器,本公开实施例对此不作限定。如图2所示,该响度调整方法可以包括以下步骤:
在步骤S21中,电子设备获取多媒体资源的声音信号。
在本公开实施例中,电子设备可以对多媒体资源的声音信号进行处理,调整声音信号的强度,使得强度在一个固定的响度值左右。当然,对于多个多媒体资源,电子设备也可以将多个多媒体资源的声音信号的响度均调整到该一个固定的响度值左右,从而在该电子设备上播放多媒体资源时,可以播放响度调整后的声音信号,从而用户听到的声音不会时大时小。
在需要对多媒体资源进行处理时,电子设备可以执行该步骤S21,获取多媒体资源的声音信号。例如,该电子设备可以获取该多媒体资源音轨上的信号,当然,也可以采用其他方式获取该多媒体资源的声音信号,本公开实施例在此不多做赘述。其中,电子设备可以在获取到该多媒体资源时即执行该步骤S21,也可以在需要播放该多媒体资源时再执行该步骤S21,从而再通过下述步骤,对该多媒体资源的声音信号的响度进行调整,本公开实施例对该步骤S21的执行时机不作限定。
在步骤S22中,电子设备将多媒体资源的声音信号转换为第一频域信号。
通常地,在对信号进行分析时,在时域上对信号进行分析时计算方式复杂繁琐,通常可以将信号转换至频域,从而在频域上分析该信号的一些特性。在本公开实施例中,电子设备在获取到声音信号后,可以将该声音信号转换为第一频域信号,从而基于该第一频域信号,可以进一步分析如何对声音信号进行响度调整。
具体地,该步骤S22可以通过快速傅里叶变换(Fast Fourier Transformation,FFT)实现。电子设备可以对该声音信号进行快速傅里叶变换,得到第一频域信号。例如,假设声音信号为s(t),第一频域信号为S0(k),该步骤S22可以通过公式一实现,该公式一可以为S0(k)=FFT(s(t)),其中,S0(k)为第一频域信号,FFT()为快速傅里叶变换函数,s(t)为声音信号,t为时间,k为频率信息,该频率信息通常为快速傅里叶变换后的频点下标,该频点下标表示的频率通常可以该由频点下标、采样率和快速傅里叶变换长度等共同决定。这样通过该公式一,可以分帧将该声音信号变换到频域。
需要说明的是,上述声音信号可以包括至少一帧声音信号,该步骤S22可以将每一帧声音信号均转换为一帧第一频域信号,从而得到至少一帧第一频域信号。在一种可能实现方式中,在该步骤S22中,该电子设备在对该声音信号进行快速傅里叶变换之前,还可以对该声音信号进行分帧和加窗,从而将该声音信号看作一个个的平稳信号,从而可以进行快速傅里叶变换,将其变换到频域,以分析声音信号的特性。具体地,该分帧和加窗的方式可以采用分帧方式或窗函数实现,本公开实施例对此不作限定,也不作过多赘述。
在步骤S23中,电子设备基于该第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,该第二频域信号用于体现该第一频域信号在该当前电子设备上播放时的响度。
不同的电子设备的频率响应信息可能不同,同一多媒体资源在不同电子设备上播放时,用户听到的声音的响度可能不同,且该多媒体资源的频率不同时,同样的响度的声音信号播放出来用户听到的响度也可能不同。因而,电子设备在对该多媒体资源的声音信号的响度进行调整时,可以考虑当前电子设备的频率响应信息,得到能够体现该声音信号在该电子设备上播放时的真实响度,从而基于该真实响度进行调整,可以使得响度调整更准确,使得调整后的声音信号在当前电子设备上播放时用户听到的响度恒定。
其中,频率响应是指将一个以恒电压输出的音频信号与电子设备的系统相连接时,音箱产生的声压级随频率的变化而发生增大或衰减、相位随频率的变化而发生变化的现象,通常可以将声压级或相位与频率的变换关系称为频率响应。声压级即可以用于表示声音的大小,也即是响度。
电子设备可以获取当前电子设备的频率响应信息,并基于获取到的频率响应信息和上述转换得到的第一频域信号,获取第二频域信号。具体地,该电子设备的频率响应信息可以包括第一信息和第二信息,则在该步骤S23中,该电子设备考虑自身的频率响应信息,获取第二频域信号的过程可以通过下述步骤一和步骤二实现:
步骤一、电子设备基于该第一频域信号和该当前电子设备的第一信息,获取该第三频域信号,该第一信息用于体现声音信号的幅度随频率的变化而变化的情况。
在声音信号的频率不同时,该电子设备播放该声音信号时,该声音信号的幅度可能会与其原本的幅度不同,且不同的电子设备上,该声音信号的幅度随频率的变化而变化的情况也可能不同。因而,电子设备可以先执行该步骤一,得到能体现上述声音信号在该电子设备上播放时的真实幅度的信号。
需要说明的是,该声音信号的幅度可以用于体现该声音信号的能量,则上述第一信息也即是用于体现该声音信号的能量随频率的变化而变化的情况。声音信号的幅度或能量发生变化时,则该声音信号播放出来的响度也可能会发生变化。这样通过该步骤一,考虑了该声音信号在该电子设备上进行播放时能量可能的变化情况,从而考虑到了声音信号在该电子设备上的一种响度可能变化的影响因素,则分析得到的该声音信号的响度更贴近真正播放时的响度,后续再对该声音信号进行响度调整后,调整后的声音信号在该电子设备上播放时响度也即更准确,能更准确地保持在一个固定的响度左右。
在一种可能实现方式中,该第一频域信号包括至少一帧第一频域信号,对于每一帧第一频域信号,该电子设备可以将该当前电子设备的第一信息作为该第一频域信号的权重,从而基于该当前电子设备的第一信息,对该第一频域信号进行加权,得到第三频域信号。具体地,对于每一帧第一频域信号,该第一频域信号对应的第三频域信号的每个频率信息对应的值为该频率信息对应的第一信息的值与该频率信息对应的第一频域信号的值的乘积。进一步地,该步骤一可以基于均衡器(Equalizer,EQ),对第一频域信号和当前电子设备的第一信息进行处理,得到第三频域信号。
例如,如图3所示,以三个不同的电子设备为例,该三个电子设备的第一信息不相同,也即是该三个电子设备中声音信号的幅度随频率的变化而变化的情况不相同。则该第一信息可以为电子设备的幅度-频率曲线,也即是频率特性曲线,也即是,该幅度-频率曲线的横坐标为频率(Frequency),单位为赫兹(Hz),纵坐标为幅度(Magnitude),单位为分贝(dB)。电子设备在获取到第一频域信号后,可以获取当前电子设备的通过公式二,获取第三频域信号。具体地,该公式二可以为:S1(k)=D(k)S0(k)。其中,该S1(k)为第三频域信号,D(k)为电子设备的第一信息,在此仅以该第一信息为幅度-频率曲线为例,S0(k)为第一频域信号,k为频率信息,该频率信息通常为快速傅里叶变换后的频点下标。
步骤二、电子设备基于该第三频域信号和该当前电子设备的第二信息,获取该第二频域信号,该第二信息用于体现声音信号的响度随频率的变化而变化的情况。
在步骤一中,已经考虑到当前电子设备中声音信号随频率的变化而变化的情况,也即是,考虑到了声音信号的能量的变化情况,然而能量仅为响度变化的一种因素,并不是响度,该电子设备还需要将其转换为响度的变化情况,因而电子设备还可以基于该当前电子设备的第二信息和上述第三频域信号,获取第二频域信号,从而第二频域信号能够体现声音信号在该电子设备上播放时的真实响度。
在一种可能实现方式中,该第一频域信号包括至少一帧第一频域信号,相应地,上述步骤一得到的第三频域信号也可以包括至少一帧第三频域信号。对于每一帧第三频域信号,该电子设备可以将该当前电子设备的第二信息作为该第三频域信号的权重,从而基于该当前电子设备的第二信息,对该第三频域信号进行加权,得到第二频域信号。具体地,对于每一帧第三频域信号,该第三频域信号对应的第二频域信号的每个频率信息对应的值为该频率信息对应的第二信息的值与该频率信息对应的第三频域信号的值的乘积。进一步地,该步骤二也可以基于均衡器(Equalizer,EQ),对第三频域信号和当前电子设备的第二信息进行处理,得到第二频域信号。
例如,如图4所示,该第二信息可以为电子设备的声压级-频率曲线,也即是频响曲线,其中,该声压级即为声音的大小,可以用于反映声音信号的响度。该声压级-频率曲线的横坐标为频率,单位为Hz,纵坐标为声压级,单位为dBRe2*10-5。在该声压级-频率曲线中,还有双耳最小可闻阈(Minimum Audible Field,MAF),其中,该双耳最小可闻阈可以用于表示人的双耳能够听到的响度的范围。电子设备在获取到第三频域信号后,可以获取当前电子设备的通过公式三,获取第二频域信号。具体地,该公式三可以为:S2(k)=L(k)S1(k)。其中,该S1(k)为第三频域信号,L(k)为电子设备的第二信息,在此仅以该第一信息为幅度-频率曲线为例,S2(k)为第二频域信号,k为频率信息,该频率信息通常为快速傅里叶变换后的频点下标。
需要说明的是,通过上述步骤一和步骤二,即可获取到第一频域信号对应的第二频域信号,该第二频域信号可以体现该第一频域信号在该当前电子设备上播放时的真实响度,从而基于该真实响度,确定响度调整值,可以使得调整后的声音信号的响度更真实地贴近一个固定的响度,播放效果更佳。
当然,上述仅以该当前电子设备的频率响应信息包括第一信息和第二信息,从而执行上述步骤一和步骤二为例进行说明,该步骤S23还可以通过其他方式实现,例如,电子设备还可以基于上述第一信息和第二信息,获取第三信息,该第三信息即可以包括该声音信号的幅度以及响度在该电子设备上的变化情况,从而基于第三信息和第一频域信息,获取第二频域信息,当然,该电子设备上还可以存储有该电子设备的频率响应信息,从而可以直接执行该步骤S23,本公开实施例在此不多做赘述。
在步骤S24中,电子设备获取第二频域信号的响度的最大值和平均值。
电子设备在获取到能够体现声音信号在该电子设备上播放时的真实响度的第二频域信号后,则可以基于该第二频域信号,确定如何进行响度调整,例如,可以确定响度调整值,该响度调整值基于上述真实响度确定,从而可以使得响度调整更准确。
具体地,该电子设备确定响度调整值时,还可以考虑到该声音信号的响度与目标响度之间的差距,也可以考虑如何在响度过程中可能出现的声音信号失真问题,因而可以通过该步骤S24和下述步骤S25,基于该第二频域信号的响度信息和目标响度,确定响度调整值。其中,该目标响度为想要调整后的声音信号的响度。该目标响度可以由相关技术人员预先设置,也可以由用户根据自身习惯进行调整,例如,该目标响度可以为-10dB至-13dB之间的一个数值,用户听到该目标响度的声音信号时的响度体验较好,当然,该目标响度也可以为其他数值,本公开实施例对该目标响度的取值不作限定。
具体地,该第二频域信号的响度信息可以为该第二频域信号的响度的最大值和平均值,且该第二频域信号也可以包括至少一帧第二频域信号,则该电子设备获取该最大值和平均值的过程可以通过下述步骤一至步骤三实现:
步骤一、电子设备获取每一帧第二频域信号的响度,得到至少一个响度。
在一种可能实现方式中,电子设备可以通过公式四获取每一帧第二频域信号的响度,该公式四可以为:Loudness(i)=10*log10(Sum(S2(k)*S2(k))),其中,该Loudness(i)为第i帧第二频域信号的响度,i为帧的标识,log为对数函数,Sum()为求和函数,S2(k)为第二频域信号,k为频率信息,该频率信息通常为快速傅里叶变换后的频点下标。则在该公式四中,Sum(S2(k)*S2(k))是指从最小频点至最大频点的第二频域信号的值的平方值进行求和。
当然,该步骤一还可以通过其他实现方式实现,本公开实施例对每一帧第二频域信号的响度获取方式不作限定。电子设备获取到至少一帧第二频域信号的至少一个响度后,即可执行下述步骤二和步骤三。
步骤二、电子设备获取该至少一个响度中最大的响度作为该第二频域信号的响度的最大值。
在一种可能实现方式中,该步骤二可以通过公式五实现,该公式五可以为:Loudness_max=Max(Loudness(i)),其中,Loudness_max为第二频域信号的响度的最大值,Max()为取最大值的函数,Loudness(i)为第i帧第二频域信号的响度,i为帧的标识。当然,该步骤二还可以通过其他实现方式实现,本公开实施例对此不作限定。
步骤三、电子设备获取该至少一个响度的平均值作为该第二频域信号的响度的平均值。
在一种可能实现方式中,该步骤三可以通过公式六实现,该公式六可以为:Loudness_avg=Average(Loudness(i)),其中,Loudness_avg为第二频域信号的响度的平均值,Average()为求平均值的函数,Loudness(i)为第i帧第二频域信号的响度,i为帧的标识。当然,该步骤二还可以通过其他实现方式实现,本公开实施例对此不作限定。
需要说明的是,电子设备可以同时执行上述步骤二和步骤三,也可以先执行步骤二再执行步骤三,也可以先执行步骤三,再执行步骤二,本公开实施例对上述两个步骤的执行顺序不作限定。
在步骤S25中,电子设备基于该最大值、该平均值和该目标响度,获取该声音信号的响度调整值。
电子设备获取到第二频域信号的响度信息后,即可确定该第二频域信号当前的响度情况以及调整后的目标响度,确定对声音信号进行调整的响度调整值。具体地,该步骤S25可以通过下述步骤一至步骤三实现:
步骤一、电子设备获取该目标响度和该平均值的第一差值。
该第一差值可以体现出目标响度与该第二频域信号的响度的平均值的差距,如果该第一差值大于或等于0,说明该第二频域信号的平均响度要小于目标响度,如果要将其调整为目标响度,有一些声音信号的响度则需要被放大,如果该第一差值小于0,说明该第二频域信号的平均响度要大于目标响度,则进行响度调整时需要放大的声音信号可能比较少,甚至没有。
例如,电子设备获取第一差值的过程可以通过公式七实现,该公式七可以为:Loudness_diff1=Loudness_target-Loudness_avg,其中,Loudness_diff1为第一差值,Loudness为响度,diff用于表示差值,其全称为差别、区别(difference)。Loudness_target为目标响度,Loudness_avg为响度的平均值,avg为average的缩写。
步骤二、电子设备获取响度阈值与该最大值的第二差值。
该响度阈值可以为最大不失真响度值或接近于最大不失真响度值的数值,例如,一般声音信号的最大不失真响度值为0dB,则该响度阈值可以为0dB,可以基于该响度阈值,控制声音信号的响度,减少或避免响度调整过程可能导致的失真情况。当然,该响度阈值还可以被设置为其他接近于0dB的数值,例如,-1dB,这样可以更好地保证响度调整过程声音信号不失真。该响度阈值的取值可以由相关技术人员预先设置,本公开实施例对该响度阈值的取值不作具体限定。该第二差值也可以体现该第二频域信号的响度的最大值与响度阈值的差距。
例如,电子设备获取第二差值的过程可以通过公式八实现,该公式八可以为:Loudness_diff2=Loudness_thd-Loudness_max,其中,Loudness_diff2为第二差值。Loudness_thd为响度阈值,thd为threshold的缩写,Loudness_max为响度的最大值。
步骤三、电子设备基于该第一差值与该第二差值,获取该声音信号的响度调整值。
电子设备获取到第一差值和第二差值后,可以基于这两个差值来确定声音信号的响度调整值。上述第一差值与零的大小关系可以在一定程度上体现该声音信号的响度与目标响度之间的差距,而第一差值与第二差值的大小关系可以体现如果将声音信号的响度调整为目标响度时可能会出现的饱和非线性失真情况。因而在确定响度调整值时,电子设备可以考虑该第一差值与零的大小关系以及第一差值和第二差值的大小关系。
该第一差值与零的大小关系以及第一差值和第二差值的大小关系不同时,电子设备获取响度调整值的过程可以不同,具体可以包括以下两种情况:
第一种情况、当该第一差值和该第二差值满足目标条件时,电子设备对该第一差值和第二差值进行加权求和,得到该声音信号的响度调整值,该目标条件为该第一差值大于或等于零且该第一差值大于该第二差值。
第一差值大于或等于零,则说明该第二频域信号的平均响度要小于目标响度,如果要将其调整为目标响度,该声音信号中有很多帧的响度均需要被放大,而且第一差值大于第二差值,将声音信号的响度放大时,可能会有部分帧的声音信号的响度会超过响度阈值,这种情况下,则可能会出现饱和非线性失真,因而,该电子设备在获取响度调整值时,可以权衡该第一差值和第二差值,使得调整后的声音信号的响度与目标响度的差距与饱和非线性失真之间争取一个较为平衡的状态。
例如,电子设备可以通过公式九,对该第一差值和第二差值进行加权求和。公式九可以为:Loudness_diff=a*Loudness_diff1+(1-a)*Loudness_diff2,其中,Loudness_diff为响度调整值,Loudness_diff1为第一差值,a为第一差值的权重,Loudness_diff2为第二差值,1-a为第二差值的权重。其中,a为一个调节因子,该a的取值范围可以为[0,1)。a越接近于1,调整后的响度则越接近于目标响度,但可能出现的饱和非线性失真越大;a越接近于0,可能出现的饱和非线性失真越小,但调整后的响度离目标响度的偏差越大。也即是,如果Loudness_diff1>=0且Loudness_diff1>Loudness_diff2,则可以通过上述公式九,获取得到响度调整值。
其中,该调节因子可以由相关技术人员根据自身经验进行设置,也即是上述第一差值和第二差值的权重可以由相关技术人员根据自身经验设置,例如,a可以取值为0.8,则第一差值的权重为0.8,第二差值的权重为0.2,本公开实施例对此不作限定。
第二种情况、当该第一差值和该第二差值不满足目标条件时,电子设备获取该第一差值作为该声音信号的响度调整值。
在该第二种情况中,第一差值和第二差值不满足目标条件,则可能包括三种可能场景。第一种场景:第一差值大于或等于零,但第一差值小于或等于第二差值。第二种场景:第一差值小于零,第一差值小于或等于第二差值。第三种场景:第一差值小于零,第一差值大于第二差值。在这三种场景中,将声音信号的响度调整到目标响度附近时,可能的饱和费线性失真比较小,则该电子设备可以无需考虑第二差值,而是直接将第一差值作为响度调整值即可。也即是,Loudness_diff=Loudness_diff1。
上述仅通过两种情况对该步骤S25的响度调整值获取过程进行说明,该步骤S25还可以通过其他方式实现,例如,该电子设备可以直接对第一差值和第二差值进行加权求和,当该第一差值和第二差值满足目标条件时,上述调节因子a取值为1,也即是,第一差值的权重为1,第二差值的权重为0即可。本公开实施例对该响度调整值的获取过程具体采用哪种实现方式不作限定。
该步骤S24和步骤S25为基于该第二频域信号和目标响度,获取该声音信号的响度调整值的过程,该第二频域信号可以体现第一频域信号在当前电子设备上进行播放时的真实响度,基于该真实响度确定的响度调整值更准确,从而后续进行响度调整时,调整后的声音信号的响度也更准确,更符合预期。进一步地,通过上述响度调整值的获取过程,既考虑到了调整后的声音信号的响度与目标响度的接近程度,也考虑到了调整后的声音信号可能出现的饱和非线性失真的程度,可以在保证调整后的声音信号失真较小的同时,响度接近于目标响度。
在步骤S26中,电子设备基于该响度调整值,对该声音信号的响度进行调整,得到该多媒体资源的目标声音信号。
电子设备确定了响度调整值后,即可对声音信号的响度进行调整,将该声音信号的响度调整至目标响度左右,得到多媒体资源的目标声音信号。
在一种可能实现方式中,该响度调整过程可以基于压缩器实现,则相应地,该压缩器的参数可以基于该响度调整值确定。该压缩器的主要参数可以为阈值和增益值,该阈值和增益值可以基于上述响度调整值确定,具体地,该步骤S26可以包括以下步骤:
步骤一、电子设备基于响度阈值与该响度调整值,获取压缩器的阈值。
具体地,该电子设备可以获取响度阈值与响度调整值的第三差值作为压缩器(Compressor)的阈值。例如,该步骤一可以通过公式十实现,该公式十可以为:Threshold=Loudness_thd-Loudness_diff,其中,Threshold为压缩器的阈值,Loudness_thd为响度阈值,Loudness_diff为响度调整值。
步骤二、电子设备基于该响度调整值,获取该压缩器的增益值。
具体地,电子设备可以通过公式十一,获取该压缩器的增益值。例如,该公式十一可以为:MakeupGain=pow(10,Loudness_diff/10),其中,MakeupGain为压缩器的增益值,pow()为求次方的函数,该公式十一也即是,MakeupGain=10Loudness_diff/10。
步骤三、电子设备将该声音信号输入该压缩器中,由该压缩器基于该阈值和该增益值,对该声音信号的响度进行调整,输出该多媒体资源的目标声音信号。
电子设备在获取到压缩器的参数后,可以将上述步骤S21获取到的多媒体资源的声音信号输入压缩器中,由压缩器基于自身的参数,对声音信号的响度进行调整,并输出调整后得到的目标声音信号。其中,该压缩器进行响度调整的过程可以为,压缩器基于阈值,将该声音信号的响度调整为目标数值,再基于该增益值对该已调整的声音信号进行放大,得到目标声音信号。由于该压缩器的参数基于响度调整值确定,且该响度调整值考虑到了当前电子设备的频率响应信息,也即是考虑到了该声音信号在电子设备上进行播放时响度的可能变化情况,因而通过上述步骤得到的目标声音信号的响度更符合用户听觉特性,播放效果更佳。
上述仅提供了一种压缩器的参数的确定方式,从而基于压缩器实现响度调整的过程,该压缩器的参数还可以包括其他参数,参数的确定方式也可以采用其他方式,压缩器基于参数,对声音信号的响度进行调整,使得调整后的目标声音信号的响度接近于目标响度,且尽量失真很小。当然,压缩器的类型不同时,该步骤S26也可能有不同的实现方式。在另一种可能实现方式中,该步骤S26还可以不使用压缩器,而是直接基于响度调整值,对该声音信号的响度进行调整,本公开实施例对具体采用哪种实现方式不作限定。
需要说明的是,通过上述步骤得到的目标声音信号中可能还存在少量的失真现象,则该电子设备还可以对该目标声音信号的响度进行进一步调整,以避免失真现象。具体地,当该目标声音信号中包括响度大于该响度阈值的至少一帧目标声音信号时,电子设备可以将该至少一帧目标声音信号的响度调整为该响度阈值。
在一种可能实现方式中,电子设备可以基于限幅器(Limiter)对该目标声音信号进行调整,具体地,电子设备可以将该目标声音信号输入限幅器中,由该限幅器将该目标声音信号中响度大于该响度阈值的至少一帧目标声音信号进行调整,输出调整后的目标声音信号。其中,该限幅器的阈值可以为该响度阈值,从而在该限幅器中,如果某一帧声音信号的响度大于该响度阈值,则限幅器可以将该声音信号的响度置为响度阈值。这样通过限幅器进一步避免出现饱和溢出失真,得到的目标声音信号的播放效果会更好。
例如,图5中示出了上述响度调整方法的一个具体示例,如图5所示,电子设备可以输入信号s(t),该信号s(t)即为多媒体资源的声音信号,从而电子设备可以对该声音信号进行快速傅里叶变换(FFT),也即对应于上述步骤S22,并通过设备曲线EQ和响度曲线EQ,该设备曲线和响度曲线也即是对应于上述步骤S23中的第一信息和第二信息,至此,电子设备得到了第二频域信号,然后电子设备可以计算平均响度和最大响度,也即是对应于上述步骤S24中获取响度的最大值和平均值的过程,电子设备得到平均响度和最大响度后,可以确定强度调整值,也即是对应于步骤S25,之后,电子设备基于响度调整值,确定压缩器(Compressor)的参数,从而电子设备可以使用压缩器对输入的信号s(t)进行处理,并将该压缩器输出的信息输入限幅器(Limiter),由限幅器进一步进行处理,最终输出信号,该输出的信息即为该步骤S26中,获取得到的目标声音信号。
该步骤S24至步骤S26为基于该第二频域信号和目标响度,对该声音信号的响度进行调整,得到该多媒体资源的目标声音信号的过程,该第二频域信号可以体现第一频域信号在该电子设备上进行播放时的响度,也即是可以体现该多媒体资源的声音信号在该电子设备上进行播放时的响度,从而考虑到这一点,结合目标响度对声音信号的响度进行处理,得到的目标声音信号的响度更符合预期,也更符合用户听觉特性,播放效果更佳。
该步骤S23至步骤S26为基于该第一频域信号、当前电子设备的频率响应信息和目标响度,对该声音信号的响度进行调整,得到该多媒体资源的目标声音信号的过程,不会出现声音忽大忽小的情况,且考虑到了电子设备的频率响应信息,得到的目标声音信号的响度更符合预期,也更符合用户听觉特性,播放效果更佳。
通过上述步骤S21至步骤S26,电子设备对多媒体资源的声音信号进行响度调整,得到了目标声音信号,当接收到对该多媒体资源的播放指令时,电子设备可以播放该多媒体资源的目标声音信号,这样该目标声音信号的获取过程中,考虑到了当前电子设备的频率响应信息,得到的目标声音信号播放时的响度更接近于目标响度,能够匹配用户的听觉特性,效果更佳。
本公开实施例中考虑到了当前电子设备的频率响应信息,将原始信号转换为能够体现该信号在当前电子设备上播放时的响度的频域信号,从而基于该频域信号和目标响度,对原始信号进行调整,从而调整后的声音信号在该当前电子设备上进行播放时的响度接近于目标响度,而不仅仅是调整声音信号本身的响度,与用户听觉特性匹配,且该目标声音信号的响度基于目标响度调整,对多个多媒体资源进行调整时,得到的响度均一致,可以有效解决用户听到的声音时大时小的问题,响度调整的效果好。
图6是根据一示例性实施例示出的一种响度调整装置的框图。参照图6,该装置包括转换模块601、获取模块602和调整模块603。
该转换模块601,被配置为执行将多媒体资源的声音信号转换为第一频域信号;
该获取模块602,被配置为执行基于该第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,该第二频域信号用于体现该第一频域信号在该当前电子设备上播放时的响度;
该调整模块603,被配置为执行基于该第二频域信号和目标响度,对该声音信号的响度进行调整,得到该多媒体资源的目标声音信号。
在一种可能实现方式中,该获取模块602被配置为执行:
基于该第一频域信号和该当前电子设备的第一信息,获取第三频域信号,该第一信息用于体现声音信号的幅度随频率的变化而变化的情况;
基于该第三频域信号和该当前电子设备的第二信息,获取该第二频域信号,该第二信息用于体现声音信号的响度随频率的变化而变化的情况。
在一种可能实现方式中,该调整模块603被配置为执行:
基于该第二频域信号和目标响度,获取该声音信号的响度调整值;
基于该响度调整值,对该声音信号的响度进行调整,得到该多媒体资源的目标声音信号。
在一种可能实现方式中,该调整模块603被配置为执行:
获取该第二频域信号的响度的最大值和平均值;
基于该最大值、该平均值和该目标响度,获取该声音信号的响度调整值。
在一种可能实现方式中,该调整模块603被配置为执行:
获取该目标响度和该平均值的第一差值;
获取响度阈值与该最大值的第二差值;
基于该第一差值与该第二差值,获取该声音信号的响度调整值。
在一种可能实现方式中,该调整模块603被配置为执行:
当该第一差值和该第二差值满足目标条件时,对该第一差值和第二差值进行加权求和,得到该声音信号的响度调整值,该目标条件为该第一差值大于或等于零且该第一差值大于该第二差值;或,
当该第一差值和该第二差值不满足目标条件时,获取该第一差值作为该声音信号的响度调整值。
在一种可能实现方式中,该调整模块603被配置为执行:
基于响度阈值与该响度调整值,获取压缩器的阈值;
基于该响度调整值,获取该压缩器的增益值;
将该声音信号输入该压缩器中,由该压缩器基于该阈值和该增益值,对该声音信号的响度进行调整,输出该多媒体资源的目标声音信号。
在一种可能实现方式中,该调整模块603还被配置为当该目标声音信号中包括响度大于该响度阈值的至少一帧目标声音信号时,执行将该至少一帧目标声音信号的响度调整为该响度阈值。
在一种可能实现方式中,该调整模块603还被配置为执行将该目标声音信号输入限幅器中,由该限幅器将该目标声音信号中响度大于该响度阈值的至少一帧目标声音信号进行调整,输出调整后的目标声音信号。
本公开实施例提供的装置,考虑到了当前电子设备的频率响应信息,将原始信号转换为能够体现该信号在当前电子设备上播放时的响度的频域信号,从而基于该频域信号和目标响度,对原始信号进行调整,从而调整后的声音信号在该当前电子设备上进行播放时的响度接近于目标响度,而不仅仅是调整声音信号本身的响度,与用户听觉特性匹配,且该目标声音信号的响度基于目标响度调整,对多个多媒体资源进行调整时,得到的响度均一致,可以有效解决用户听到的声音时大时小的问题,响度调整的效果好。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
上述电子设备可以被提供为下述图7所示的终端,也可以被提供为下述图8所示的服务器,本公开实施例对此不作限定。
图7是根据一示例性实施例示出的一种终端的结构框图。该终端700可以是:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端700还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端700包括有:处理器701和存储器702。
处理器701可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器701可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器701可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器701还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器702还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器702中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器701所执行以实现本公开中方法实施例提供的响度调整方法。
在一些实施例中,终端700还可选包括有:外围设备接口703和至少一个外围设备。处理器701、存储器702和外围设备接口703之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口703相连。具体地,外围设备包括:射频电路704、触摸显示屏705、摄像头706、音频电路707、定位组件708和电源709中的至少一种。
外围设备接口703可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器701和存储器702。在一些实施例中,处理器701、存储器702和外围设备接口703被集成在同一芯片或电路板上;在一些其他实施例中,处理器701、存储器702和外围设备接口703中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路704用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路704通过电磁信号与通信网络以及其他通信设备进行通信。射频电路704将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路704包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路704可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路704还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本公开对此不加以限定。
显示屏705用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏705是触摸显示屏时,显示屏705还具有采集在显示屏705的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器701进行处理。此时,显示屏705还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏705可以为一个,设置终端700的前面板;在另一些实施例中,显示屏705可以为至少两个,分别设置在终端700的不同表面或呈折叠设计;在再一些实施例中,显示屏705可以是柔性显示屏,设置在终端700的弯曲表面上或折叠面上。甚至,显示屏705还可以设置成非矩形的不规则图形,也即异形屏。显示屏705可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件706用于采集图像或视频。可选地,摄像头组件706包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件706还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路707可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器701进行处理,或者输入至射频电路704以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端700的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器701或射频电路704的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路707还可以包括耳机插孔。
定位组件708用于定位终端700的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件708可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源709用于为终端700中的各个组件进行供电。电源709可以是交流电、直流电、一次性电池或可充电电池。当电源709包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端700还包括有一个或多个传感器710。该一个或多个传感器710包括但不限于:加速度传感器711、陀螺仪传感器712、压力传感器713、指纹传感器714、光学传感器715以及接近传感器716。
加速度传感器711可以检测以终端700建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器711可以用于检测重力加速度在三个坐标轴上的分量。处理器701可以根据加速度传感器711采集的重力加速度信号,控制触摸显示屏705以横向视图或纵向视图进行用户界面的显示。加速度传感器711还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器712可以检测终端700的机体方向及转动角度,陀螺仪传感器712可以与加速度传感器711协同采集用户对终端700的3D动作。处理器701根据陀螺仪传感器712采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器713可以设置在终端700的侧边框和/或触摸显示屏705的下层。当压力传感器713设置在终端700的侧边框时,可以检测用户对终端700的握持信号,由处理器701根据压力传感器713采集的握持信号进行左右手识别或快捷操作。当压力传感器713设置在触摸显示屏705的下层时,由处理器701根据用户对触摸显示屏705的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器714用于采集用户的指纹,由处理器701根据指纹传感器714采集到的指纹识别用户的身份,或者,由指纹传感器714根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器701授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器714可以被设置终端700的正面、背面或侧面。当终端700上设置有物理按键或厂商Logo时,指纹传感器714可以与物理按键或厂商Logo集成在一起。
光学传感器715用于采集环境光强度。在一个实施例中,处理器701可以根据光学传感器715采集的环境光强度,控制触摸显示屏705的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏705的显示亮度;当环境光强度较低时,调低触摸显示屏705的显示亮度。在另一个实施例中,处理器701还可以根据光学传感器715采集的环境光强度,动态调整摄像头组件706的拍摄参数。
接近传感器716,也称距离传感器,通常设置在终端700的前面板。接近传感器716用于采集用户与终端700的正面之间的距离。在一个实施例中,当接近传感器716检测到用户与终端700的正面之间的距离逐渐变小时,由处理器701控制触摸显示屏705从亮屏状态切换为息屏状态;当接近传感器716检测到用户与终端700的正面之间的距离逐渐变大时,由处理器701控制触摸显示屏705从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图7中示出的结构并不构成对终端700的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图8是根据一示例性实施例示出的一种服务器的结构示意图,该服务器800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)801和一个或一个以上的存储器802,其中,该存储器802中存储有至少一条指令,该至少一条指令由该处理器801加载并执行以实现上述各个方法实施例提供的响度调整方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种非临时性计算机可读存储介质,当该非临时性计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种响度调整方法,该方法包括:
将多媒体资源的声音信号转换为第一频域信号;
基于该第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,该第二频域信号用于体现该第一频域信号在该当前电子设备上播放时的响度;
基于该第二频域信号和目标响度,对该声音信号的响度进行调整,得到该多媒体资源的目标声音信号。
在示例性实施例中,还提供了一种应用程序,包括一条或多条指令,该一条或多条指令可以由电子设备的处理器执行,以完成上述实施例中提供的响度调整方法的方法步骤,该方法步骤可以包括:
将多媒体资源的声音信号转换为第一频域信号;
基于该第一频域信号和当前电子设备的频率响应信息,获取第二频域信号,该第二频域信号用于体现该第一频域信号在该当前电子设备上播放时的响度;
基于该第二频域信号和目标响度,对该声音信号的响度进行调整,得到该多媒体资源的目标声音信号。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (18)
1.一种响度调整方法,其特征在于,包括:
将多媒体资源的声音信号转换为第一频域信号;
基于所述第一频域信号和当前电子设备的第一信息,获取第三频域信号,所述第一信息用于体现声音信号的幅度随频率的变化而变化的情况;
基于所述第三频域信号和所述当前电子设备的第二信息,获取第二频域信号,所述第二信息用于体现声音信号的响度随频率的变化而变化的情况,所述第二频域信号用于体现所述第一频域信号在所述当前电子设备上播放时的响度;
基于所述第二频域信号和目标响度,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号。
2.根据权利要求1所述的响度调整方法,其特征在于,所述基于所述第二频域信号和目标响度,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号,包括:
基于所述第二频域信号和目标响度,获取所述声音信号的响度调整值;
基于所述响度调整值,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号。
3.根据权利要求2所述的响度调整方法,其特征在于,所述基于所述第二频域信号和目标响度,获取所述声音信号的响度调整值,包括:
获取所述第二频域信号的响度的最大值和平均值;
基于所述最大值、所述平均值和所述目标响度,获取所述声音信号的响度调整值。
4.根据权利要求3所述的响度调整方法,其特征在于,所述基于所述最大值、所述平均值和所述目标响度,获取所述声音信号的响度调整值,包括:
获取所述目标响度和所述平均值的第一差值;
获取响度阈值与所述最大值的第二差值;
基于所述第一差值与所述第二差值,获取所述声音信号的响度调整值。
5.根据权利要求4所述的响度调整方法,其特征在于,所述基于所述第一差值与所述第二差值,获取所述声音信号的响度调整值,包括:
当所述第一差值和所述第二差值满足目标条件时,对所述第一差值和第二差值进行加权求和,得到所述声音信号的响度调整值,所述目标条件为所述第一差值大于或等于零且所述第一差值大于所述第二差值;或,
当所述第一差值和所述第二差值不满足目标条件时,获取所述第一差值作为所述声音信号的响度调整值。
6.根据权利要求2所述的响度调整方法,其特征在于,所述基于所述响度调整值,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号,包括:
基于响度阈值与所述响度调整值,获取压缩器的阈值;
基于所述响度调整值,获取所述压缩器的增益值;
将所述声音信号输入所述压缩器中,由所述压缩器基于所述阈值和所述增益值,对所述声音信号的响度进行调整,输出所述多媒体资源的目标声音信号。
7.根据权利要求6所述的响度调整方法,其特征在于,所述方法还包括:
当所述目标声音信号中包括响度大于所述响度阈值的至少一帧目标声音信号时,将所述至少一帧目标声音信号的响度调整为所述响度阈值。
8.根据权利要求7所述的响度调整方法,其特征在于,所述当所述目标声音信号中包括响度大于所述响度阈值的至少一帧目标声音信号时,将所述至少一帧目标声音信号的响度调整为所述响度阈值,包括:
将所述目标声音信号输入限幅器中,由所述限幅器将所述目标声音信号中响度大于所述响度阈值的至少一帧目标声音信号进行调整,输出调整后的目标声音信号。
9.一种响度调整装置,其特征在于,包括:
转换模块,被配置为执行将多媒体资源的声音信号转换为第一频域信号;
获取模块,被配置为执行基于所述第一频域信号和当前电子设备的第一信息,获取第三频域信号,所述第一信息用于体现声音信号的幅度随频率的变化而变化的情况;
所述获取模块,还被配置为执行基于所述第三频域信号和所述当前电子设备的第二信息,获取第二频域信号,所述第二信息用于体现声音信号的响度随频率的变化而变化的情况,所述第二频域信号用于体现所述第一频域信号在所述当前电子设备上播放时的响度;
调整模块,被配置为执行基于所述第二频域信号和目标响度,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号。
10.根据权利要求9所述的响度调整装置,其特征在于,所述调整模块被配置为执行:
基于所述第二频域信号和目标响度,获取所述声音信号的响度调整值;
基于所述响度调整值,对所述声音信号的响度进行调整,得到所述多媒体资源的目标声音信号。
11.根据权利要求10所述的响度调整装置,其特征在于,所述调整模块被配置为执行:
获取所述第二频域信号的响度的最大值和平均值;
基于所述最大值、所述平均值和所述目标响度,获取所述声音信号的响度调整值。
12.根据权利要求11所述的响度调整装置,其特征在于,所述调整模块被配置为执行:
获取所述目标响度和所述平均值的第一差值;
获取响度阈值与所述最大值的第二差值;
基于所述第一差值与所述第二差值,获取所述声音信号的响度调整值。
13.根据权利要求12所述的响度调整装置,其特征在于,所述调整模块被配置为执行:
当所述第一差值和所述第二差值满足目标条件时,对所述第一差值和第二差值进行加权求和,得到所述声音信号的响度调整值,所述目标条件为所述第一差值大于或等于零且所述第一差值大于所述第二差值;或,
当所述第一差值和所述第二差值不满足目标条件时,获取所述第一差值作为所述声音信号的响度调整值。
14.根据权利要求10所述的响度调整装置,其特征在于,所述调整模块被配置为执行:
基于响度阈值与所述响度调整值,获取压缩器的阈值;
基于所述响度调整值,获取所述压缩器的增益值;
将所述声音信号输入所述压缩器中,由所述压缩器基于所述阈值和所述增益值,对所述声音信号的响度进行调整,输出所述多媒体资源的目标声音信号。
15.根据权利要求14所述的响度调整装置,其特征在于,所述调整模块还被配置为当所述目标声音信号中包括响度大于所述响度阈值的至少一帧目标声音信号时,执行将所述至少一帧目标声音信号的响度调整为所述响度阈值。
16.根据权利要求15所述的响度调整装置,其特征在于,所述调整模块还被配置为执行将所述目标声音信号输入限幅器中,由所述限幅器将所述目标声音信号中响度大于所述响度阈值的至少一帧目标声音信号进行调整,输出调整后的目标声音信号。
17.一种电子设备,其特征在于,包括:
一个或多个处理器;
用于存储一个或多个处理器可执行指令的一个或多个存储器;
其中,所述可执行指令由所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至权利要求8任一项所述的响度调整方法的方法步骤。
18.一种非临时性计算机可读存储介质,其特征在于,当所述非临时性计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至权利要求8任一项所述的响度调整方法的方法步骤。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811409335.3A CN109547848B (zh) | 2018-11-23 | 2018-11-23 | 响度调整方法、装置、电子设备以及存储介质 |
PCT/CN2019/104576 WO2020103527A1 (zh) | 2018-11-23 | 2019-09-05 | 响度调整方法、装置、电子设备以及存储介质 |
US17/295,735 US11284151B2 (en) | 2018-11-23 | 2019-09-05 | Loudness adjustment method and apparatus, and electronic device and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811409335.3A CN109547848B (zh) | 2018-11-23 | 2018-11-23 | 响度调整方法、装置、电子设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109547848A CN109547848A (zh) | 2019-03-29 |
CN109547848B true CN109547848B (zh) | 2021-02-12 |
Family
ID=65849453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811409335.3A Active CN109547848B (zh) | 2018-11-23 | 2018-11-23 | 响度调整方法、装置、电子设备以及存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11284151B2 (zh) |
CN (1) | CN109547848B (zh) |
WO (1) | WO2020103527A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109547848B (zh) | 2018-11-23 | 2021-02-12 | 北京达佳互联信息技术有限公司 | 响度调整方法、装置、电子设备以及存储介质 |
CN110109644B (zh) * | 2019-04-10 | 2020-11-17 | 广州视源电子科技股份有限公司 | 电子设备的均衡参数确定处理方法、装置及系统 |
CN110493636A (zh) * | 2019-08-30 | 2019-11-22 | 母国标 | 音视频调节方法、装置、终端设备及存储介质 |
CN110928518B (zh) * | 2019-11-26 | 2020-12-25 | 北京达佳互联信息技术有限公司 | 音频数据处理方法、装置、电子设备和存储介质 |
CN112185414A (zh) * | 2020-09-22 | 2021-01-05 | 苏州科达科技股份有限公司 | 音频播放音量的调节方法、装置及存储介质 |
CN112669797B (zh) * | 2020-12-30 | 2023-11-14 | 北京达佳互联信息技术有限公司 | 音频处理方法、装置、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011019339A1 (en) * | 2009-08-11 | 2011-02-17 | Srs Labs, Inc. | System for increasing perceived loudness of speakers |
CN102946520A (zh) * | 2012-10-30 | 2013-02-27 | 深圳创维数字技术股份有限公司 | 一种自动控制频道音量的方法及数字电视终端 |
CN103414990A (zh) * | 2013-05-21 | 2013-11-27 | 杭州联汇数字科技有限公司 | 室内扩声设备检测方法 |
CN103686555A (zh) * | 2013-11-19 | 2014-03-26 | 歌尔声学股份有限公司 | 微型扬声器模组和增强其频率响应的方法以及电子设备 |
CN103702253A (zh) * | 2013-12-16 | 2014-04-02 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN105357613A (zh) * | 2015-11-03 | 2016-02-24 | 广东欧珀移动通信有限公司 | 音频输出设备播放参数的调整方法及装置 |
WO2018139793A1 (en) * | 2017-01-25 | 2018-08-02 | Samsung Electronics Co., Ltd. | Electronic apparatus and power controlling method thereof |
CN108668009A (zh) * | 2018-03-30 | 2018-10-16 | 广东欧珀移动通信有限公司 | 输入操作控制方法、装置、终端、耳机及可读存储介质 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5506910A (en) * | 1994-01-13 | 1996-04-09 | Sabine Musical Manufacturing Company, Inc. | Automatic equalizer |
MXPA05012785A (es) * | 2003-05-28 | 2006-02-22 | Dolby Lab Licensing Corp | Metodo, aparato y programa de computadora para el calculo y ajuste de la sonoridad percibida de una senal de audio. |
US7529377B2 (en) * | 2005-07-29 | 2009-05-05 | Klipsch L.L.C. | Loudspeaker with automatic calibration and room equalization |
JP4753821B2 (ja) * | 2006-09-25 | 2011-08-24 | 富士通株式会社 | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
EP2320683B1 (en) * | 2007-04-25 | 2017-09-06 | Harman Becker Automotive Systems GmbH | Sound tuning method and apparatus |
US8538042B2 (en) * | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
JP4892077B2 (ja) * | 2010-05-07 | 2012-03-07 | 株式会社東芝 | 音響特性補正係数算出装置及びその方法、並びに音響特性補正装置 |
US9391579B2 (en) * | 2010-09-10 | 2016-07-12 | Dts, Inc. | Dynamic compensation of audio signals for improved perceived spectral imbalances |
US8855322B2 (en) * | 2011-01-12 | 2014-10-07 | Qualcomm Incorporated | Loudness maximization with constrained loudspeaker excursion |
US9509267B2 (en) * | 2011-11-08 | 2016-11-29 | Nokia Technologies Oy | Method and an apparatus for automatic volume leveling of audio signals |
JP5269175B2 (ja) * | 2011-11-28 | 2013-08-21 | 株式会社東芝 | 音量制御装置、音声制御方法及び電子機器 |
JP6544234B2 (ja) * | 2013-04-11 | 2019-07-17 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
US9543917B2 (en) * | 2014-01-24 | 2017-01-10 | Fabrice Gabriel Paumier | Software for manipulating equalization curves |
EP2930954B1 (en) * | 2014-04-07 | 2020-07-22 | Harman Becker Automotive Systems GmbH | Adaptive filtering |
CN106878866B (zh) * | 2017-03-03 | 2020-01-10 | Oppo广东移动通信有限公司 | 音频信号处理方法、装置及终端 |
CN107154263B (zh) * | 2017-05-25 | 2020-10-16 | 宇龙计算机通信科技(深圳)有限公司 | 声音处理方法、装置及电子设备 |
CN107479851B (zh) * | 2017-08-18 | 2019-07-16 | Oppo广东移动通信有限公司 | 音量调节方法、装置、终端设备及存储介质 |
CN109547848B (zh) * | 2018-11-23 | 2021-02-12 | 北京达佳互联信息技术有限公司 | 响度调整方法、装置、电子设备以及存储介质 |
-
2018
- 2018-11-23 CN CN201811409335.3A patent/CN109547848B/zh active Active
-
2019
- 2019-09-05 US US17/295,735 patent/US11284151B2/en active Active
- 2019-09-05 WO PCT/CN2019/104576 patent/WO2020103527A1/zh active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011019339A1 (en) * | 2009-08-11 | 2011-02-17 | Srs Labs, Inc. | System for increasing perceived loudness of speakers |
CN102946520A (zh) * | 2012-10-30 | 2013-02-27 | 深圳创维数字技术股份有限公司 | 一种自动控制频道音量的方法及数字电视终端 |
CN103414990A (zh) * | 2013-05-21 | 2013-11-27 | 杭州联汇数字科技有限公司 | 室内扩声设备检测方法 |
CN103686555A (zh) * | 2013-11-19 | 2014-03-26 | 歌尔声学股份有限公司 | 微型扬声器模组和增强其频率响应的方法以及电子设备 |
CN103702253A (zh) * | 2013-12-16 | 2014-04-02 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN105357613A (zh) * | 2015-11-03 | 2016-02-24 | 广东欧珀移动通信有限公司 | 音频输出设备播放参数的调整方法及装置 |
WO2018139793A1 (en) * | 2017-01-25 | 2018-08-02 | Samsung Electronics Co., Ltd. | Electronic apparatus and power controlling method thereof |
CN108668009A (zh) * | 2018-03-30 | 2018-10-16 | 广东欧珀移动通信有限公司 | 输入操作控制方法、装置、终端、耳机及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109547848A (zh) | 2019-03-29 |
US11284151B2 (en) | 2022-03-22 |
US20210368230A1 (en) | 2021-11-25 |
WO2020103527A1 (zh) | 2020-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109547848B (zh) | 响度调整方法、装置、电子设备以及存储介质 | |
CN111050250B (zh) | 降噪方法、装置、设备和存储介质 | |
WO2019114514A1 (zh) | 在直播间显示音高信息的方法及装置、存储介质 | |
CN108335703B (zh) | 确定音频数据的重音位置的方法和装置 | |
CN110688082B (zh) | 确定音量的调节比例信息的方法、装置、设备及存储介质 | |
CN110764730A (zh) | 播放音频数据的方法和装置 | |
CN112133332B (zh) | 播放音频的方法、装置及设备 | |
CN109951398B (zh) | 数据发送方法、装置及计算机设备 | |
CN110708630B (zh) | 控制耳机的方法、装置、设备及存储介质 | |
CN112965683A (zh) | 调节音量的方法、装置、电子设备及介质 | |
CN109065068B (zh) | 音频处理方法、装置及存储介质 | |
CN110996305A (zh) | 连接蓝牙设备的方法、装置、电子设备及介质 | |
CN111445901A (zh) | 音频数据获取方法、装置、电子设备及存储介质 | |
CN110618805A (zh) | 调整设备电量的方法、装置、电子设备及介质 | |
CN109192223B (zh) | 音频对齐的方法和装置 | |
US11272304B2 (en) | Method and terminal for playing audio data, and storage medium thereof | |
CN109243479B (zh) | 音频信号处理方法、装置、电子设备及存储介质 | |
US20230014836A1 (en) | Method for chorus mixing, apparatus, electronic device and storage medium | |
CN111984222A (zh) | 调节音量的方法、装置、电子设备及可读存储介质 | |
CN112269559A (zh) | 音量调整方法、装置、电子设备及存储介质 | |
CN109961802B (zh) | 音质比较方法、装置、电子设备及存储介质 | |
CN110933454B (zh) | 处理直播萌脸礼物的方法、装置、设备及存储介质 | |
CN112133319A (zh) | 音频生成的方法、装置、设备及存储介质 | |
CN109587603B (zh) | 音量控制方法、装置及存储介质 | |
CN113963707A (zh) | 音频处理方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |