CN109872710A - 音效调制方法、装置及存储介质 - Google Patents
音效调制方法、装置及存储介质 Download PDFInfo
- Publication number
- CN109872710A CN109872710A CN201910188494.3A CN201910188494A CN109872710A CN 109872710 A CN109872710 A CN 109872710A CN 201910188494 A CN201910188494 A CN 201910188494A CN 109872710 A CN109872710 A CN 109872710A
- Authority
- CN
- China
- Prior art keywords
- audio
- audio file
- frequency spectrum
- domain data
- barycenter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请公开了一种音效调制方法、装置及存储介质,所述方法包括:获取风格相同的音频文件;提取所述音频文件中的多个特征数据;将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。本申请实施例通过自动分析某种风格的音频文件,提取出多个特征数据,并根据提取到的多个特征数据与预设标准特征数据的比较得到对应风格的目标音效,提升了音效调制的自动化和标准化,且能解放人力,使生成音效这一本来需要一定专业基础的工作简化为一般人都能完成的工作,且本申请实施例能够提供更多的音频特征,提供了持续扩展特征的框架能力。
Description
技术领域
本申请实施例涉及音频处理领域,尤其涉及音效调制领域,具体涉及一种音效调制方法、装置及存储介质。
背景技术
音效是人工制造或加强的声音,用来增强对电影、电子游戏、音乐或其他媒体的艺术或其他内容的声音处理。效果器是音效的载体,为用于对声音进行处理的算法。
现有技术调制音效是人工通过工具分析歌曲频谱、声场等特征,再手工调试效果器的参数以达到相同的效果。例如,人工使用工具得到频谱、声场特征对应的特征图,然后根据特征图进行人工调试,并结合听感来确定最终的音效参数。整个调制音效的过程高度依赖人工,且从工具中得到的特征信息比较有限也比较难量化。因此,有必要提出一种新的音效调制方法。
发明内容
本申请实施例提供一种音效调制方法、装置及存储介质,提升了音效调制的自动化和标准化。
本申请实施例提供一种音效调制方法,所述方法包括:
获取风格相同的音频文件;
提取所述音频文件中的多个特征数据;
将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。
本申请实施例还提供一种音效调制装置,所述装置包括:
获取单元,用于获取风格相同的音频文件;
提取单元,用于提取所述音频文件中的多个特征数据;
处理单元,用于将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。
本申请实施例还提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,执行本申请实施例所提供的任一种所述的音效调制方法中的步骤。
本申请实施例通过获取风格相同的音频文件;提取所述音频文件中的多个特征数据;将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。本申请实施例通过自动分析某种风格的音频文件,提取出多个特征数据,并根据提取到的多个特征数据与预设标准特征数据的比较得到对应风格的目标音效,提升了音效调制的自动化和标准化,且能解放人力,使生成音效这一本来需要一定专业基础的工作简化为一般人都能完成的工作,且本申请实施例能够提供更多的音频特征,提供了持续扩展特征的框架能力。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术提供的特征图。
图2为本申请实施例提供的一种音效调制方法的流程示意图。
图3为本申请实施例提供的特征数据检测器的结构示意图。
图4为本申请实施例提供的频谱重心的特征示意图。
图5为本申请实施例提供的一种音效调制装置的结构示意图。
图6为本申请实施例提供的一种服务器的结构示意图。
图7为本申请实施例提供的一种终端的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”和“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
由于现有的音效调制方法,是人工通过工具分析歌曲频谱、声场等特征,再手工调试效果器的参数以达到相同的效果。例如,人工使用工具得到频谱、声场特征对应的特征图,如图1所示,上半部分为频谱图,下半部分为声场图,由特征图可知,该音频的中频比较突出,低频和高频比较弱化,另外声场比较窄。为了调制此种风格的音效,需要人工提升中频,削弱低频和高频,缩窄声场,并结合听感来确定最终的音效参数。整个调制音效的过程高度依赖人工,且从工具中得到的特征信息比较有限也比较难量化。因而,本申请实施例提供了一种音效调制方法、装置及存储介质,通过自动分析某种风格的音频文件,提取出多个特征数据,并根据提取到的多个特征数据与预设标准特征数据的比较得到对应风格的目标音效,提升了音效调制的自动化和标准化,且能解放人力,使生成音效这一本来需要一定专业基础的工作简化为一般人都能完成的工作,且本申请实施例能够提供更多的音频特征,提供了持续扩展特征的框架能力。
本申请实施例提供的音效调制方法,可实现在音效调制装置中,该音效调制装置具体可以集成在电子设备或其他具有音视频数据处理功能的设备中,电子设备包括但不限于智能手机、智能电视、智能音箱、车载音频播放器等设备。
以下将分别进行详细说明,以下各个实施例的描述先后顺序并不构成对具体实施先后顺序的限定。
请参阅图2至图4,图2至图4均为本申请实施例提供的一种音效调制方法的流程示意图,图3为本申请实施例提供的特征数据检测器的结构示意图,图4为本申请实施例提供的频谱重心的特征示意图。所述方法包括:
步骤101,获取风格相同的音频文件。
其中,编辑某个风格的预置音效时,可以先收集此类风格的歌曲、音乐等音频文件。音乐风格是指在音乐范畴中曲调、节奏、音色、力度、和声、织体和曲式等各种音乐要素富有个性的结合方式,一般主要指的是曲调。这些要素的特殊结合方式能产生一种显著的或独特的音响。例如,音乐风格包括但不限于合成乐、摇滚、民谣、金属乐、迪斯科、电子、说唱、轻音乐、古典乐、蓝调等,有相同或相似的明显特征的音乐或歌曲集合都可以构成某个音乐风格。有明显特征的歌曲集合都可以达到调制相应音效的效果。例如,可以利用摇滚风格的音频文件来调制摇滚风格的音效。
步骤102,提取所述音频文件中的多个特征数据。
在一些实施例,所述多个特征数据包括频谱重心、频谱广度、以及音调能量比例,所述提取所述音频文件中的多个特征数据,包括:
提取所述音频文件中的频谱重心、频谱广度、以及音调能量比例。
在一些实施例,所述提取所述音频文件中的频谱重心、频谱广度、以及音调能量比例,包括:
基于所述音频文件的频域数据,计算权重和振幅积之和与振幅之和的比值,以得到所述频谱重心;
基于所述音频文件的频域数据,先求取所述频谱重心,再计算所述音频文件的频谱相对于所述频谱重心的分布形状,以得到所述频谱广度;
基于所述音频文件的频域数据,先查找所述音频文件中所有大于能量阈值的振幅极大值并求和,再除以所有值的平方和,以得到所述音调能量比例。
其中,频谱重心的重心越高代表高频信号越多,影响人对声音明亮度的判断。可以基于所述音频文件的频域数据,计算权重和振幅积之和与振幅之和的比值,以得到所述频谱重心。具体的,可以将频域数据输入公式一中进行计算,求出频率重心所在的位置,即得出所述频谱重心。其中,公式一为:
其中,Centroid表示频谱重心,xi为第i个频域数据,n为大于等于1的正整数,samplerate为采样率。
其中,频谱广度是频率相对于频谱重心的分散度。可以基于所述音频文件的频域数据,先求取所述频谱重心,再计算所述音频文件的频谱相对于所述频谱重心的分布形状,以得到所述频谱广度。具体的,可以将频域数据输入公式二中进行计算,先求频谱重心频率,然后求分散度。其中,公式二为:
其中,Spread表示频谱广度,centroid表示频谱重心,xi为第i个频域数据,n为大于等于1的正整数,samplerate为采样率。
其中,音调能量比例用于表示:音调能量比例越高,代表合奏的乐器数越少。可以基于所述音频文件的频域数据,先查找所述音频文件中所有大于能量阈值的振幅极大值并求和,再除以所有值的平方和,以得到所述音调能量比例。可以将频域数据输入公式三中进行计算,先统计音频文件中所有大于能量阈值(5e-4)的振幅极大值P序列,再求和,并除以所有值的平方和。其中,公式三为:
其中,Tonal表示音调能量比例,Pi表示音频文件中第i个大于能量阈值(5e-4)的振幅极大值,xi为第i个频域数据,n为大于等于1的正整数。
在一些实施例,所述多个特征数据还包括响度和声场,所述提取所述音频文件中的多个特征数据,还包括:
提取所述音频文件中的响度和声场。
在一些实施例,所述提取所述音频文件中的响度和声场,包括:
基于所述音频文件的时域数据,计算所述时域数据的均方根,以得到所述响度;
基于所述音频文件的时域数据,统计所述时域数据在左声道和右声道两个维度上的边界,以得到所述声场。
其中,响度用于表示人耳对所听到的声音大小强弱的主观感受。可以基于所述音频文件的时域数据,计算所述时域数据的均方根,以得到所述响度。具体的,可以将时域数据输入公式四中求时域数据的平均值,然后再将时域数据及其平均值输入公式五中求取响度。其中,公式四为:
其中,表示时域数据的平均值,xi为第i个频域数据,n为大于等于1的正整数。
其中,公式五为:
rms表示响度,表示时域数据的平均值,xi为第i个频域数据,n为大于等于1的正整数。
其中,声场可以影响人对声音空间的判断。可以基于所述音频文件的时域数据,统计所述时域数据在左声道和右声道两个维度上的边界,以得到所述声场。例如,根据左右声道的振幅,通过三角函数计算其在左右两边的投影,统计出左右边界作为声场的边界,以得到所述声场。
步骤103,将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。
在一些实施例中,所述将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效,包括:
将所述多个特征数据与预设标准特征数据进行比较,得到与所述多个特征数据相对应的音效调制效果器的音效参数;
将所有音效调制效果器的音效参数进行打包,以得到与所述音频文件风格相同的目标音效。
例如,如图3所示,将某一组风格相同的音频文件输入特征数据检测器进行音频数据的分析,以得到所述多个不同的特征数据。其中,作为分析对象的音频文件为多个风格相同的音频文件,将音频文件输入特征数据检测器,将该音频文件分成时域数据和频域数据,其中所述频域数据为音频文件通过傅里叶变换后得到的数据,然后所述时域数据和频域数据输入对应的子检测器中进行分析,以得到多个不同的特征数据,其中,每个子检测器输出一个特征数据。例如,所述多个不同的特征数据包括响度、声场、频谱重心、频谱广度、以及音调能量比例。例如,第一子检测器用于检测响度,第二子检测器用于检测声场,第三子检测器用于检测频谱重心,第四子检测器用于检测频谱广度,第五子检测器用于检测音调能量比例。通过对应的子检测器对音频数据进行分析后,得出响度、声场、频谱重心、频谱广度、以及音调能量比例等特征数据。
其中,对于特征数据,是一组数值。如图4所示,以频谱重心为例,图中示出的A曲线为美国传统摇滚的频谱重心频率,B曲线为美国传统民谣的频谱重心频率。
其中,上述多个特征数据均具有对应的音效调制效果器,例如,响度对应的音效调制效果器为音量调节器,声场对应的音效调制效果器为立体声增强,频谱重心对应的音效调制效果器为高架滤波器(High-Shelf),频谱广度对应的音效调制效果器为激励器,音调能量比例对应的音效调制效果器为滤波器。根据上述提取到的特征数据与预设标准特征数据对比,可以得到相应音效调制效果器的音效参数,再将所有音效调制效果器的音效参数进行打包,就可以得到与所述音频文件风格相同的目标音效。例如,当分析的是摇滚风格的音频文件时,最终得到的是摇滚风格的音效。当用户制作某个风格音效或制作歌单音效时,可通过本申请实施例提供的音频调制方法来完成相应工作,实现音效调试的自动化与标准化。
上述所有的技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
本申请实施例通过获取风格相同的音频文件;提取所述音频文件中的多个特征数据;将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。本申请实施例通过自动分析某种风格的音频文件,提取出多个特征数据,并根据提取到的多个特征数据与预设标准特征数据的比较得到对应风格的目标音效,提升了音效调制的自动化和标准化,且能解放人力,使生成音效这一本来需要一定专业基础的工作简化为一般人都能完成的工作,且本申请实施例能够提供更多的音频特征,提供了持续扩展特征的框架能力。
本申请实施例还提供一种音效调制装置,如图5所示,图5为本申请实施例提供的一种音效调制装置的结构示意图。所述音效调制装置300可以包括获取单元301,提取单元302,以及处理单元303。
其中,所述获取单元301,用于获取风格相同的音频文件。
其中,编辑某个风格的预置音效时,可以先收集此类风格的歌曲、音乐等音频文件。音乐风格是指在音乐范畴中曲调、节奏、音色、力度、和声、织体和曲式等各种音乐要素富有个性的结合方式,一般主要指的是曲调。这些要素的特殊结合方式能产生一种显著的或独特的音响。例如,音乐风格包括但不限于合成乐、摇滚、民谣、金属乐、迪斯科、电子、说唱、轻音乐、古典乐、蓝调等,有相同或相似的明显特征的音乐或歌曲集合都可以构成某个音乐风格。有明显特征的歌曲集合都可以达到调制相应音效的效果。例如,可以利用摇滚风格的音频文件来调制摇滚风格的音效。
所述提取单元302,用于提取所述音频文件中的多个特征数据。
在一些实施例,所述多个特征数据包括频谱重心、频谱广度、以及音调能量比例,所述提取单元302,用于提取所述音频文件中的频谱重心、频谱广度、以及音调能量比例。
在一些实施例,所述提取单元302,用于提取所述音频文件中的频谱重心、频谱广度、以及音调能量比例,具体为:
基于所述音频文件的频域数据,计算权重和振幅积之和与振幅之和的比值,以得到所述频谱重心;
基于所述音频文件的频域数据,先求取所述频谱重心,再计算所述音频文件的频谱相对于所述频谱重心的分布形状,以得到所述频谱广度;
基于所述音频文件的频域数据,先查找所述音频文件中所有大于能量阈值的振幅极大值并求和,再除以所有值的平方和,以得到所述音调能量比例。
其中,频谱重心的重心越高代表高频信号越多,影响人对声音明亮度的判断。所述提取单元302可以基于所述音频文件的频域数据,计算权重和振幅积之和与振幅之和的比值,以得到所述频谱重心。具体的,可以将频域数据输入公式一中进行计算,求出频率重心所在的位置,即得出所述频谱重心。其中,公式一为:
其中,Centroid表示频谱重心,xi为第i个频域数据,n为大于等于1的正整数,samplerate为采样率。
其中,频谱广度是频率相对于频谱重心的分散度。所述提取单元302可以基于所述音频文件的频域数据,先求取所述频谱重心,再计算所述音频文件的频谱相对于所述频谱重心的分布形状,以得到所述频谱广度。具体的,可以将频域数据输入公式二中进行计算,先求频谱重心频率,然后求分散度。其中,公式二为:
其中,Spread表示频谱广度,centroid表示频谱重心,xi为第i个频域数据,n为大于等于1的正整数,samplerate为采样率。
其中,音调能量比例用于表示:音调能量比例越高,代表合奏的乐器数越少。所述提取单元302可以基于所述音频文件的频域数据,先查找所述音频文件中所有大于能量阈值的振幅极大值并求和,再除以所有值的平方和,以得到所述音调能量比例。可以将频域数据输入公式三中进行计算,先统计音频文件中所有大于能量阈值(5e-4)的振幅极大值P序列,再求和除以所有值的平方和。其中,公式三为:
其中,Tonal表示音调能量比例,Pi表示音频文件中第i个大于能量阈值(5e-4)的振幅极大值,xi为第i个频域数据,n为大于等于1的正整数。
在一些实施例,所述多个特征数据还包括响度和声场,所述提取单元302,还用于提取所述音频文件中的响度和声场。
在一些实施例,所述提取单元302,还用于提取所述音频文件中的响度和声场,具体为:
基于所述音频文件的时域数据,计算所述时域数据的均方根,以得到所述响度;
基于所述音频文件的时域数据,统计所述时域数据在左声道和右声道两个维度上的边界,以得到所述声场。
其中,响度用于表示人耳对所听到的声音大小强弱的主观感受。所述提取单元302可以基于所述音频文件的时域数据,计算所述时域数据的均方根,以得到所述响度。具体的,可以将时域数据输入公式四中求时域数据的平均值,然后再将时域数据及其平均值输入公式五中求取响度。其中,公式四为:
其中,表示时域数据的平均值,xi为第i个频域数据,n为大于等于1的正整数。
其中,公式五为:
rms表示响度,表示时域数据的平均值,xi为第i个频域数据,n为大于等于1的正整数。
其中,声场可以影响人对声音空间的判断。所述提取单元302可以基于所述音频文件的时域数据,统计所述时域数据在左声道和右声道两个维度上的边界,以得到所述声场。例如,根据左右声道的振幅,通过三角函数计算其在左右两边的投影,统计出左右边界作为声场的边界,以得到所述声场。
所述处理单元303,用于将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。
在一些实施例中,所述处理单元303,用于:
将所述多个特征数据与预设标准特征数据进行比较,得到与所述多个特征数据相对应的音效调制效果器的音效参数;
将所有音效调制效果器的音效参数进行打包,以得到与所述音频文件风格相同的目标音效。
例如,如图3所示,所述提取单元302将某一组风格相同的音频文件输入特征数据检测器进行音频数据的分析,以得到所述多个不同的特征数据。其中,作为分析对象的音频文件为多个风格相同的音频文件,提取单元302将音频文件输入特征数据检测器,将该音频文件分成时域数据和频域数据,其中所述频域数据为音频文件通过傅里叶变换后得到的数据,然后所述时域数据和频域数据输入对应的子检测器中进行分析,以得到多个不同的特征数据,其中,每个子检测器输出一个特征数据。例如,所述多个不同的特征数据包括响度、声场、频谱重心、频谱广度、以及音调能量比例。例如,第一子检测器用于检测响度,第二子检测器用于检测声场,第三子检测器用于检测频谱重心,第四子检测器用于检测频谱广度,第五子检测器用于检测音调能量比例。通过对应的子检测器对音频数据进行分析后,得出响度、声场、频谱重心、频谱广度、以及音调能量比例等特征数据。
其中,对于特征数据,是一组数值。如图4所示,以频谱重心为例,图中示出的A曲线为美国传统摇滚的频谱重心频率,B曲线为美国传统民谣的频谱重心频率。
其中,上述多个特征数据均具有对应的音效调制效果器,例如,响度对应的音效调制效果器为音量调节器,声场对应的音效调制效果器为立体声增强,频谱重心对应的音效调制效果器为高架滤波器(High-Shelf),频谱广度对应的音效调制效果器为激励器,音调能量比例对应的音效调制效果器为滤波器。所述处理单元303根据上述提取到的特征数据与预设标准特征数据对比,可以得到相应音效调制效果器的音效参数,再将所有音效调制效果器的音效参数进行打包,就可以得到与所述音频文件风格相同的目标音效。例如,当分析的是摇滚风格的音频文件时,最终得到的是摇滚风格的音效。当用户制作某个风格音效或制作歌单音效时,可通过本申请实施例提供的音频调制方法来完成相应工作,实现音效调试的自动化与标准化。
上述所有的技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
本申请实施例提供的音效调制装置300,通过获取单元301获取风格相同的音频文件,然后提取单元302提取所述音频文件中的多个特征数据,处理单元303将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。本申请实施例的音效调制装置300通过自动分析某种风格的音频文件,提取出多个特征数据,并根据提取到的多个特征数据与预设标准特征数据的比较得到对应风格的目标音效,提升了音效调制的自动化和标准化,且能解放人力,使生成音效这一本来需要一定专业基础的工作简化为一般人都能完成的工作,且本申请实施例能够提供更多的音频特征,提供了持续扩展特征的框架能力。
本申请实施例还提供一种服务器,如图6所示,其示出了本申请实施例所涉及的服务器的结构示意图,具体来讲:
该服务器可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图6中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
服务器还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该服务器还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,服务器还可以包括显示单元等,在此不再赘述。具体在本实施例中,服务器中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
获取风格相同的音频文件;提取所述音频文件中的多个特征数据;将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。
以上操作具体可参见前面的实施例,在此不作赘述。
由上可知,本实施例提供的服务器,获取风格相同的音频文件;提取所述音频文件中的多个特征数据;将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。本申请实施例通过自动分析某种风格的音频文件,提取出多个特征数据,并根据提取到的多个特征数据与预设标准特征数据的比较得到对应风格的目标音效,提升了音效调制的自动化和标准化,且能解放人力,使生成音效这一本来需要一定专业基础的工作简化为一般人都能完成的工作,且本申请实施例能够提供更多的音频特征,提供了持续扩展特征的框架能力。
相应的,本申请实施例还提供一种终端,如图7所示,该终端可以包括射频(RF,Radio Frequency)电路501、包括有一个或一个以上计算机可读存储介质的存储器502、输入单元503、显示单元504、传感器505、音频电路506、无线保真(WiFi,Wireless Fidelity)模块507、包括有一个或者一个以上处理核心的处理器508、以及电源509等部件。本领域技术人员可以理解,图7中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路501可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器508处理;另外,将涉及上行的数据发送给基站。通常,RF电路501包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM,Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA,Low Noise Amplifier)、双工器等。此外,RF电路501还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GSM,Global System of Mobile communication)、通用分组无线服务(GPRS,GeneralPacket Radio Service)、码分多址(CDMA,Code Division MultipleAccess)、宽带码分多址(WCDMA,Wideband Code Division Multiple Access)、长期演进(LTE,Long TermEvolution)、电子邮件、短消息服务(SMS,Short Messaging Service)等。
存储器502可用于存储软件程序以及模块,处理器508通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器508和输入单元503对存储器502的访问。
输入单元503可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元503可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器508,并能接收处理器508发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元503还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元504可用于显示由用户输入的信息或提供给用户的信息以及终端的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元504可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器508以确定触摸事件的类型,随后处理器508根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图7中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
终端还可包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在终端移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路506、扬声器,传声器可提供用户与终端之间的音频接口。音频电路506可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路506接收后转换为音频数据,再将音频数据输出处理器508处理后,经RF电路501以发送给比如另一终端,或者将音频数据输出至存储器502以便进一步处理。音频电路506还可能包括耳塞插孔,以提供外设耳机与终端的通信。
WiFi属于短距离无线传输技术,终端通过WiFi模块507可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图7示出了WiFi模块507,但是可以理解的是,其并不属于终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器508是终端的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行终端的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器508可包括一个或多个处理核心;优选的,处理器508可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器508中。
终端还包括给各个部件供电的电源509(比如电池),优选的,电源可以通过电源管理系统与处理器508逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源509还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端中的处理器508会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器508来运行存储在存储器502中的应用程序,从而实现各种功能:
获取训练样本;获取风格相同的音频文件;提取所述音频文件中的多个特征数据;将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。
以上操作具体可参见前面的实施例,在此不作赘述。
由上可知,本实施例提供的终端,获取风格相同的音频文件;提取所述音频文件中的多个特征数据;将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。本申请实施例通过自动分析某种风格的音频文件,提取出多个特征数据,并根据提取到的多个特征数据与预设标准特征数据的比较得到对应风格的目标音效,提升了音效调制的自动化和标准化,且能解放人力,使生成音效这一本来需要一定专业基础的工作简化为一般人都能完成的工作,且本申请实施例能够提供更多的音频特征,提供了持续扩展特征的框架能力。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种音效调制方法中的步骤。例如,该指令可以执行如下步骤:
获取风格相同的音频文件;提取所述音频文件中的多个特征数据;将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种音效调制方法中的步骤,因此,可以实现本申请实施例所提供的任一种音效调制方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种音效调制方法、装置和系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种音效调制方法,其特征在于,所述方法包括:
获取风格相同的音频文件;
提取所述音频文件中的多个特征数据;
将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。
2.如权利要求1所述的音效调制方法,其特征在于,所述多个特征数据包括频谱重心、频谱广度、以及音调能量比例,所述提取所述音频文件中的多个特征数据,包括:
提取所述音频文件中的频谱重心、频谱广度、以及音调能量比例。
3.如权利要求2所述的音效调制方法,其特征在于,所述提取所述音频文件中的频谱重心、频谱广度、以及音调能量比例,包括:
基于所述音频文件的频域数据,计算权重和振幅积之和与振幅之和的比值,以得到所述频谱重心;
基于所述音频文件的频域数据,先求取所述频谱重心,再计算所述音频文件的频谱相对于所述频谱重心的分布形状,以得到所述频谱广度;
基于所述音频文件的频域数据,先查找所述音频文件中所有大于能量阈值的振幅极大值并求和,再除以所有值的平方和,以得到所述音调能量比例。
4.如权利要求2所述的音效调制方法,其特征在于,所述多个特征数据还包括响度和声场,所述提取所述音频文件中的多个特征数据,还包括:
提取所述音频文件中的响度和声场。
5.如权利要求4所述的音效调制方法,其特征在于,所述提取所述音频文件中的响度和声场,包括:
基于所述音频文件的时域数据,计算所述时域数据的均方根,以得到所述响度;
基于所述音频文件的时域数据,统计所述时域数据在左声道和右声道两个维度上的边界,以得到所述声场。
6.如权利要求1所述的音效调制方法,其特征在于,所述将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效,包括:
将所述多个特征数据与预设标准特征数据进行比较,得到与所述多个特征数据相对应的音效调制效果器的音效参数;
将所有音效调制效果器的音效参数进行打包,以得到与所述音频文件风格相同的目标音效。
7.一种音效调制装置,其特征在于,所述装置包括:
获取单元,用于获取风格相同的音频文件;
提取单元,用于提取所述音频文件中的多个特征数据;
处理单元,用于将所述多个特征数据与预设标准特征数据进行比较,以得到目标音效。
8.如权利要求7所述的音效调制装置,其特征在于,所述多个特征数据包括频谱重心、频谱广度、以及音调能量比例,所述提取单元,用于提取所述音频文件中的频谱重心、频谱广度、以及音调能量比例,具体为:
基于所述音频文件的频域数据,计算权重和振幅积之和与振幅之和的比值,以得到所述频谱重心;
基于所述音频文件的频域数据,先求取所述频谱重心,再计算所述音频文件的频谱相对于所述频谱重心的分布形状,以得到所述频谱广度;
基于所述音频文件的频域数据,先查找所述音频文件中所有大于能量阈值的振幅极大值并求和,再除以所有值的平方和,以得到所述音调能量比例。
9.如权利要求8所述的音效调制装置,其特征在于,所述多个特征数据还包括响度和声场,所述提取单元,还用于提取所述音频文件中的响度和声场,具体为:
基于所述音频文件的时域数据,计算所述时域数据的均方根,以得到所述响度;
基于所述音频文件的时域数据,统计所述时域数据在左声道和右声道两个维度上的边界,以得到所述声场。
10.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至6任一项所述的音效调制方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910188494.3A CN109872710B (zh) | 2019-03-13 | 2019-03-13 | 音效调制方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910188494.3A CN109872710B (zh) | 2019-03-13 | 2019-03-13 | 音效调制方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109872710A true CN109872710A (zh) | 2019-06-11 |
CN109872710B CN109872710B (zh) | 2021-01-08 |
Family
ID=66920420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910188494.3A Active CN109872710B (zh) | 2019-03-13 | 2019-03-13 | 音效调制方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109872710B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110444185A (zh) * | 2019-08-05 | 2019-11-12 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音乐生成方法及装置 |
CN110853606A (zh) * | 2019-11-26 | 2020-02-28 | Oppo广东移动通信有限公司 | 一种音效配置方法、装置及计算机可读存储介质 |
CN111326132A (zh) * | 2020-01-22 | 2020-06-23 | 北京达佳互联信息技术有限公司 | 音频处理方法、装置、存储介质及电子设备 |
CN113641329A (zh) * | 2021-08-10 | 2021-11-12 | 广州艾美网络科技有限公司 | 音效配置方法和装置、智能音箱、计算机设备及存储介质 |
CN116913328A (zh) * | 2023-09-11 | 2023-10-20 | 荣耀终端有限公司 | 音频处理方法、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030014246A1 (en) * | 2001-07-12 | 2003-01-16 | Lg Electronics Inc. | Apparatus and method for voice modulation in mobile terminal |
CN103796136A (zh) * | 2012-10-30 | 2014-05-14 | 广州三星通信技术研究有限公司 | 保证不同音效模式输出响度及音质的设备和方法 |
CN106157962A (zh) * | 2016-06-16 | 2016-11-23 | 广东欧珀移动通信有限公司 | 一种音效处理方法及移动终端 |
CN106775686A (zh) * | 2016-12-01 | 2017-05-31 | 努比亚技术有限公司 | 音效程序集成装置和方法 |
CN107066477A (zh) * | 2016-12-13 | 2017-08-18 | 合网络技术(北京)有限公司 | 一种智能推荐视频的方法及装置 |
CN107249080A (zh) * | 2017-06-26 | 2017-10-13 | 维沃移动通信有限公司 | 一种调整音效的方法、装置及移动终端 |
-
2019
- 2019-03-13 CN CN201910188494.3A patent/CN109872710B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030014246A1 (en) * | 2001-07-12 | 2003-01-16 | Lg Electronics Inc. | Apparatus and method for voice modulation in mobile terminal |
CN103796136A (zh) * | 2012-10-30 | 2014-05-14 | 广州三星通信技术研究有限公司 | 保证不同音效模式输出响度及音质的设备和方法 |
CN106157962A (zh) * | 2016-06-16 | 2016-11-23 | 广东欧珀移动通信有限公司 | 一种音效处理方法及移动终端 |
CN106775686A (zh) * | 2016-12-01 | 2017-05-31 | 努比亚技术有限公司 | 音效程序集成装置和方法 |
CN107066477A (zh) * | 2016-12-13 | 2017-08-18 | 合网络技术(北京)有限公司 | 一种智能推荐视频的方法及装置 |
CN107249080A (zh) * | 2017-06-26 | 2017-10-13 | 维沃移动通信有限公司 | 一种调整音效的方法、装置及移动终端 |
Non-Patent Citations (4)
Title |
---|
NICOLETA ROMAN ET AL.: "Speech segregation based on sound localization", 《INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS》 * |
丁康等: "离散频谱的能量重心校正法", 《振动工程学报》 * |
刘宇翔: "基于内容的音乐分析研究", 《中国博士学位论文全文数据库信息科技辑》 * |
李允公等: "《振动信号的听觉模型分析方法》", 30 November 2017, 东北大学出版社 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110444185A (zh) * | 2019-08-05 | 2019-11-12 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音乐生成方法及装置 |
CN110444185B (zh) * | 2019-08-05 | 2024-01-12 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音乐生成方法及装置 |
CN110853606A (zh) * | 2019-11-26 | 2020-02-28 | Oppo广东移动通信有限公司 | 一种音效配置方法、装置及计算机可读存储介质 |
CN111326132A (zh) * | 2020-01-22 | 2020-06-23 | 北京达佳互联信息技术有限公司 | 音频处理方法、装置、存储介质及电子设备 |
CN111326132B (zh) * | 2020-01-22 | 2021-10-22 | 北京达佳互联信息技术有限公司 | 音频处理方法、装置、存储介质及电子设备 |
US11636836B2 (en) | 2020-01-22 | 2023-04-25 | Beijing Dajia Internet Information Technology Co., Ltd. | Method for processing audio and electronic device |
CN113641329A (zh) * | 2021-08-10 | 2021-11-12 | 广州艾美网络科技有限公司 | 音效配置方法和装置、智能音箱、计算机设备及存储介质 |
CN116913328A (zh) * | 2023-09-11 | 2023-10-20 | 荣耀终端有限公司 | 音频处理方法、电子设备及存储介质 |
CN116913328B (zh) * | 2023-09-11 | 2023-11-28 | 荣耀终端有限公司 | 音频处理方法、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109872710B (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109872710A (zh) | 音效调制方法、装置及存储介质 | |
CN106024005B (zh) | 一种音频数据的处理方法及装置 | |
CN106571151B (zh) | 挑战录歌方法及装置 | |
CN109166593A (zh) | 音频数据处理方法、装置及存储介质 | |
CN105363201B (zh) | 提示信息的显示方法及装置 | |
CN108304758A (zh) | 人脸特征点跟踪方法及装置 | |
CN106210755B (zh) | 一种播放直播视频的方法、装置和系统 | |
CN110197662A (zh) | 语音控制方法、可穿戴设备及计算机可读存储介质 | |
CN105549740B (zh) | 一种播放音频数据的方法和装置 | |
CN109256146A (zh) | 音频检测方法、装置及存储介质 | |
CN106845390A (zh) | 视频标题生成方法及装置 | |
CN105224556B (zh) | 瀑布流界面显示方法及装置 | |
CN109903773A (zh) | 音频处理方法、装置及存储介质 | |
CN108470571A (zh) | 一种音频检测方法、装置及存储介质 | |
CN106782600A (zh) | 音频文件的评分方法及装置 | |
CN105447124B (zh) | 虚拟物品分享方法和装置 | |
CN106384599B (zh) | 一种破音识别的方法和装置 | |
CN109616135A (zh) | 音频处理方法、装置及存储介质 | |
CN110097895A (zh) | 一种纯音乐检测方法、装置及存储介质 | |
CN105550316B (zh) | 音频列表的推送方法及装置 | |
CN109067981A (zh) | 分屏应用切换方法、装置、存储介质和电子设备 | |
CN109817241A (zh) | 音频处理方法、装置及存储介质 | |
CN108958629A (zh) | 分屏退出方法、装置、存储介质和电子设备 | |
CN109672775A (zh) | 调节唤醒灵敏度的方法、装置及终端 | |
CN107731241A (zh) | 处理音频信号的方法、装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |