CN108198572A

CN108198572A - 一种音频处理方法及装置

Info

Publication number: CN108198572A
Application number: CN201711475931.7A
Authority: CN
Inventors: 徐胜明
Original assignee: Zhuhai Juntian Electronic Technology Co Ltd
Current assignee: Zhuhai Juntian Electronic Technology Co Ltd
Priority date: 2017-12-29
Filing date: 2017-12-29
Publication date: 2018-06-22

Abstract

本发明实施例提供了一种音频处理方法及装置，其中，该音频处理方法包括：获取待播放的目标混音音频，所述目标混音音频由多个待播放的音频段混合形成的，所述每个音频段中的每个音符存有能量值；获取所述目标混音音频的总能量值；判断所述目标混音音频的总能量值是否大于预设能量值，所述预设能量值小于爆音对应的能量值；如果所述目标混音音频的总能量值大于所述预设能量值，则调整所述目标混音音频的总能量值至小于或等于所述预设能量值。以实现减小音频的能量，避免出现爆音。

Description

一种音频处理方法及装置

技术领域

本发明涉及多媒体处理技术领域，特别是涉及一种音频处理方法及装置。

背景技术

目前生活中有一些集娱乐与益智于一体的游戏。这些游戏能够缓解人们日常的生活压力。比如，模拟钢琴的游戏。这个模拟钢琴的游戏中的每个模拟钢琴键对应控制一个音频段。每个音频段有多个音符。如果同时播放的音符数量超过32个时，播放的音频能量会很大，可能会超出播放器所能承受的信号能量范围。此时，播放器就会产生爆音。具体在实际使用中，在屏幕上同时显示的多个模拟钢琴黑键，可能被用户一次全部点击，这样多个模拟钢琴黑键可能被用户同时按下，控制同时播放各自的音符。

在其他类似游戏或者有音频播放的应用中，音频能量过大，也会出现爆音，影响用户体验。

发明内容

本发明实施例的目的在于提供一种音频处理方法及装置，以实现减小音频的能量，避免出现爆音。

第一方面，本发明实施例提供了一种音频处理方法，包括：获取待播放的目标混音音频，所述目标混音音频由多个待播放的音频段混合形成的，所述每个音频段中的每个音符存有能量值；

获取所述目标混音音频的总能量值；

判断所述目标混音音频的总能量值是否大于预设能量值，所述预设能量值小于爆音对应的能量值；

如果所述目标混音音频的总能量值大于所述预设能量值，则调整所述目标混音音频的总能量值至小于或等于所述预设能量值。

可选的，所述调整所述目标混音音频的总能量值至小于或等于所述预设能量值，包括：

获取预设待减小的第一能量值；

获取所述目标混音音频的每个音频段的能量值；

将所述目标混音音频的每个音频段的能量值，减小所述第一能量值，得到调整后的目标混音音频所有音频段的总能量值，所述调整后的目标混音音频所有音频段的总能量值小于所述预设能量值。

获取所述目标混音音频的每个音频段的能量值及音频段的总数量；

将所述目标混音音频的总能量值与所述预设能量值之差，除以所述总数量，得到预设待减小的第二能量值；

将所述目标混音音频的每个音频段的能量值，减小所述第二能量值，得到调整后的目标混音音频所有音频段的总能量值，所述调整后的目标混音音频所有音频段的总能量值等于所述预设能量值。

可选的，所述获取待播放的目标混音音频，包括：

从预设存储的音频数据文件中，获取多个所述待播放的音频段；

将所述待播放的音频段混合形成所述目标混音音频，所述音频数据文件包括：所述待播放的音频段及每个音频段对应的能量值。

所述获取所述目标混音音频的总能量值，包括：

获得所述目标混音音频的多个待播放的每个音频段的能量值，其中，每个音频段的能量值为每个音频段各自的所有音符的能量总和；

将所有所述音频段的能量值求和，获得所述目标混音音频的总能量值。

可选的，所述调整所述目标混音音频的总能量值至小于或等于所述预设能量值之后，所述方法还包括：

播放调整后的目标混音音频。

第二方面，本发明实施例提供了一种音频处理装置，包括：

第一获取模块，用于获取待播放的目标混音音频，所述目标混音音频由多个待播放的音频段混合形成的，所述每个音频段中的每个音符存有能量值；

第二获取模块，用于获取所述目标混音音频的总能量值；

判断模块，用于判断所述目标混音音频的总能量值是否大于预设能量值，所述预设能量值小于爆音对应的能量值；

调整模块，用于如果所述目标混音音频的总能量值大于所述预设能量值，则调整所述目标混音音频的总能量值至小于或等于所述预设能量值。

可选的，所述调整模块用于：

获取预设待减小的第一能量值；

获取所述目标混音音频的每个音频段的能量值；

可选的，所述调整模块用于：

可选的，所述第一获取模块，用于：

所述第二获取模块，用于：

可选的，所述装置还包括：

播放模块，用于所述调整所述目标混音音频的总能量值至小于或等于所述预设能量值之后，播放调整后的目标混音音频。

第三方面，本发明实施例提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序，实现第一方面所述的方法步骤。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现第一方面所述的步骤。

本发明实施例提供的一种音频处理方法及装置，获取待播放的目标混音音频，目标混音音频由多个待播放的音频段混合形成的，每个音频段中的每个音符存有能量值；获取所述目标混音音频的总能量值；判断目标混音音频的总能量值是否大于预设能量值，预设能量值小于爆音对应的能量值；如果目标混音音频的总能量值大于预设能量值，则调整目标混音音频的总能量值至小于或等于预设能量值。

通过将目标混音音频的总能量值调整至小于或等于预设能量值，并且预设能量值小于爆音对应的能量值，这样将总能量值减小到小于爆音对应的能量值，这样，这个目标混音音频被同时播放时，能够保证总能量值不超过爆音对应的能量值，避免出现爆音。

当然，实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例的音频处理方法的流程示意图；

图2为本发明实施例的音频处理方法的具体实现流程示意图；

图3为本发明实施例的音频处理装置的结构示意图；

图4为本发明实施例的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了解决现有技术中音频能量过大，也会出现爆音，影响用户体验的问题，本发明实施例提供了一种音频处理方法及装置，通过将目标混音音频的总能量值调整至小于或等于预设能量值，并且预设能量值小于爆音对应的能量值，这样将总能量值减小到小于爆音对应的能量值，即使这个目标混音音频被同时播放，也会保证不超过爆音对应的能量值，避免出现爆音。

第一方面，下面先对本发明实施例所提供的音频处理方法进行介绍。

本发明实施例所提供的一种音频处理方法可以应用于电子设备上。具体的，电子设备可以为：台式计算机、便携式计算机、智能移动终端。在此不作限定，任何可以实现本发明的电子设备，均属于本发明的保护范围。

参见图1所示，图1为本发明实施例的音频处理方法的流程示意图。该音频处理方法包括如下步骤：

步骤110，获取待播放的目标混音音频，所述目标混音音频由多个待播放的音频段混合形成的，所述每个音频段中的每个音符存有能量值。

需要说明的是，从音频的角度去说，每一个音符都具有它的能量振动波幅，这个能量振动波幅会造成音律振动。这个能量振动波幅的数值就是音符存有能量值。

本发明实施例中的目标混音音频可以是需要减小播放爆音的多个音频段混合形成的音频。通过用户选择可以得到这些目标混音音频。该目标混音音频包括音乐、相声、小品、曲艺中的一种或多种。例如：对于模拟钢琴的游戏，会将每个模拟钢琴键对应的音频段保存为一个音频段的数据。该音频段的数据包含音频段中的每个音符的能量值。音频段的数据也可以包含音频段中的每个音符的幅度值。在此不一一举例。

本步骤110至少可以通过执行如下实现方式的步骤，获取待播放的目标混音音频：

该实现方式的步骤包括：首先，从预设存储的音频数据文件中，获取待播放的音频段；然后，将待播放的音频段混合形成所述目标混音音频。所述音频数据文件包括：待播放的音频段及每个音频段对应的能量值。这样可以从预先存储的音频数据文件中，获取到待播放的目标混音音频。上述获取待播放的音频帧的方式：包括：第一种方式：在用户同时选择的待播放的多个音频段时，电子设备的系统从预设存储的音频数据文件中，获取与用户所选的多个音频段对应的待播放的音频帧；或者第二种方式：电子设备的系统达到预定义条件时，从预设存储的音频数据文件中，获取待播放的音频段。

上述第一种方式，具体举例：对模拟钢琴的游戏而言，在用户同时按下多个模拟钢琴键时，电子设备的系统从预设存储的音频数据文件中，找到与这些模拟钢琴键对应的音频段。上述第二种方式中的预定义条件是用于电子设备的系统自动启动从预设存储的音频数据文件中，获取待播放的音频段的条件。比如，预定义条件为多个音频段的数量达到预设数量。具体的，预设数量为10个。以上两种方式只是举例说明，在此不做限定。

步骤120，获取所述目标混音音频的总能量值。

本步骤120可以通过执行以下两种实现方式的步骤，获取目标混音音频的总能量值：

第一种实现方式的步骤包括：首先，获得所述目标混音音频的多个待播放的每个音频段中的每个音符所存的能量值；然后，将所有音符所存的能量值的和，作为所述目标混音音频的总能量值。由于每个音频段中的每个音符存有能量值，这样可以得到该目标混音音频的总能量值。

第二种实现方式的步骤包括：首先，通过每个音频段中的各自所有音符的能量之和，确定出各个音频段的能量值；然后，将确定出的所有音频段的能量值求和，获得所述目标混音音频的总能量值。上述确定出各个音频段的能量值的方式是通过可以预先对每个音频段中的各自所有音符的能量求和，得出的求和结果；然后，将这个求和结果，保存在预设存储的音频数据文件中。本发明实施例从该预设存储的音频数据文件中，可以直接获取到目标混音音频的多个待播放的每个音频段的能量值。这里在本发明实施例中，通过一次计算，可以得出目标混音音频的总能量值，减小运算量。

步骤130，判断所述目标混音音频的总能量值是否大于预设能量值，所述预设能量值小于爆音对应的能量值；如果大于，则执行步骤131；如果小于或等于，则执行步骤132。

上述预设能量值是针对不同的电子设备进行测量，得到所能够承受的音频能量值。爆音对应的能量值也可以是针对不同的电子设备进行测量，得到爆音对应的最小门限值。

本步骤130中，将目标混音音频的总能量值与预设能量值进行判断处理，由于目标混音音频的总能量值是一个数值，这样对于本次判断来说，就相当于，两个数值的比较，减小判断的复杂度。

步骤131，调整所述目标混音音频的总能量值至小于或等于所述预设能量值。

本步骤131至少可以通过执行以下四种实现方式的步骤，调整所述目标混音音频的总能量值至小于或等于所述预设能量值。

第一种实现方式的步骤包括：首先，获取所述目标混音音频的每个音频段的能量值；然后，确定所述目标混音音频的总能量值与预设能量值的差；再然后，将所述目标混音音频的任一个音频段减小这个差，得到调整后的目标混音音频所有音频段的总能量值，所述调整后的目标混音音频所有音频段的总能量值等于预设能量值。这样调整后的目标混音音频所有音频段的总能量值等于所述预设能量值，避免出现爆音。

第二种实现方式的步骤包括：首先，获取预设待减小的第一能量值；然后，获取所述目标混音音频的每个音频段的能量值；再然后，将所述目标混音音频的每个音频段的能量值，减小所述第一能量值，得到调整后的目标混音音频所有音频段的总能量值，所述调整后的目标混音音频所有音频段的总能量值小于预设能量值。这种将所有的音频段的能量值都减小，也就是说，处理过的音频段的能量值均匀减小，这样不仅避免出现爆音，而且提高用户听这些音频段的舒适度。

上述的预设待减小的第一能量值，均可以根据用户需要及工业需要进行设置。只要能够实现本发明实施例的调整后的目标混音音频所有音频段的总能量值小于预设能量值的任何第一能量值，均属于本发明实施例的保护范围。

第三种实现方式也可以称为差值处理，具体的步骤包括：首先，获取所述目标混音音频的每个音频段的能量值；然后，将所述目标混音音频的总能量值与预设能量值之差，除以所述总数量，得到预设待减小的第二能量值；再然后，将目标混音音频的每个音频段的能量值，减小所述第二能量值，得到调整后的目标混音音频所有音频段的总能量值，所述调整后的目标混音音频所有音频段的总能量值等于所述预设能量值。这种处理过的音频段的能量值均匀减小，这样不仅避免出现爆音，而且提高用户听这些音频段的舒适度。

上述的预设待减小的第二能量值，均可以根据用户需要及工业需要进行设置。只要能够实现本发明实施例的调整后的目标混音音频所有音频段的总能量值等于预设能量值的任何第二能量值，均属于本发明实施例的保护范围。

第四种实现方式的步骤包括：首先，获取所述目标混音音频的每个音频段中各自音频帧的预设能量值；所述每个音频段中各自音频帧的预设能量值包括：每个音频段中各自音频帧存有幅值，所述音频帧由音符组成；然后，通过将每个音频段中各自音频帧的幅值减小预设减小幅值，以使调整所述目标混音音频的总能量值至小于或等于预设能量值。因为音频段的能量与音频段的幅值成正比，因此可以通过减小每个音频段中各自音频帧的幅值，来减小音频段的能量。

上述预设减小幅值可以根据用户需要或者工业需要进行设定。

其他调整所述目标混音音频的总能量值至小于或等于预设能量值的方式，比如，是通过去掉目标混音音频的每个音频段中一些冗余音符的方式。其他能够实现本发明实施例的调整目标混音音频的总能量值至小于或等于预设能量值的方式，均属于本发明实施例的保护范围，在此不一一举例。

为了能够使用播放调整后的目标混音音频，需要对调整后的目标混音音频进行处理，在步骤131步骤之后，所述音频处理方法还包括：

播放调整后的目标混音音频。该调整后的目标混音音频可以按照预设的音频格式生成的，然后保存起来。上述预设的音频格式方式可以包括：MP3格式。这样可以将调整后的目标混音音频进行播放。

步骤132，播放所述目标混音音频。

由于总能量值小于或等于预设能量值对应的目标混音音频，不会出现爆音。因此本步骤132中对于总能量值小于或等于预设能量值对应的目标混音音频不需要做处理，直接播放所述目标混音音频。

本发明实施例中，这样将总能量值减小到小于爆音对应的能量值，这样，这个目标混音音频被同时播放时，能够保证总能量值不超过爆音对应的能量值，避免出现爆音。

需要说明的是，本发明实施例的音频处理方法可以应用在音频播放的应用以及游戏的场景中，该游戏可以包括：模拟钢琴的游戏、模拟吉他的游戏。在此不一一举例。为了方便从整体说明本发明实施例的音频处理方法，以模拟钢琴的游戏的应用场景为例进行说明。参见图2，图2为本发明实施例的音频处理方法的具体实现流程示意图。该音频处理方法步骤包括：

步骤210，在用户同时按下多个模拟钢琴键时，获取这些模拟钢琴键对应控制的待播放的音频段；这样就获取到多个待播放的音频段。

上述的多个待播放的音频段可以通过如下步骤得到：

假设移动终端的帧率为一秒60帧。首先，预先对接收到的音频信号对应的模拟信号对应声波幅度，通过采样频率进行采样，得到音频信号对应的采样点。该采样频率是将模拟信号进行数字化，每秒钟抽取模拟信号对应声波幅度样本的次数。为了保证声音不失真，比如，采样频率应该在40kHz左右。这里每秒可以抽取2万个采样点。然后，将音频信号对应的采样点作为该音频信号对应的数字信号。最后，将音频信号对应的多个采样点的数据作为多个待播放的音频段的数据。

步骤220，混音处理。该混音处理具体步骤包括：将所有待播放的音频段混合形成待播放的目标混音音频。

步骤230，获得目标混音音频的多个待播放的每个音频段的能量值，其中，每个音频段的能量值为每个音频段各自的所有音符的能量总和；

步骤240，将所有音频段的能量值求和，获得目标混音音频的总能量值。

步骤250，判断目标混音音频的总能量值是否大于预设能量值，该预设能量值小于爆音对应的能量值；如果大于，则执行步骤251；如果小于或等于，则执行步骤252；

步骤251，将目标混音音频的总能量值与预设能量值作差，将目标混音音频的总能量值减去该差，得到调整后的目标混音音频，该调整后的目标混音音频等于预设能量值，然后执行步骤260。

步骤252，利用移动终端的外放设备播放目标混音音频。

步骤260，利用移动终端的外放设备播放所调整后的目标混音音频。

这里的外放设备是指功放或音响。

本发明实施例中，上述只是以模拟钢琴的游戏为例进行说明，可以解决多个模拟钢琴键同时按下时，这些模拟钢琴键对应所控制的音频段不产生爆音的问题，提升了用户体验，使得用户在使用模拟钢琴的游戏时，体验较好。

第二方面，下面对本发明实施例所提供的音频处理装置进行介绍。

参见图3，图3为本发明实施例的音频处理装置的结构示意图。该音频处理装置，具体包括：

第一获取模块31，用于获取待播放的目标混音音频，所述目标混音音频由多个待播放的音频段混合形成的，所述每个音频段中的每个音符存有能量值；

第二获取模块32，用于获取所述目标混音音频的总能量值；

判断模块33，用于判断所述目标混音音频的总能量值是否大于预设能量值，所述预设能量值小于爆音对应的能量值；

调整模块34，用于如果所述目标混音音频的总能量值大于所述预设能量值，则调整所述目标混音音频的总能量值至小于或等于所述预设能量值。

可选的，所述调整模块用于：

获取预设待减小的第一能量值；

获取所述目标混音音频的每个音频段的能量值；

可选的，所述调整模块用于：

可选的，所述第一获取模块，用于：

所述第二获取模块，用于：

可选的，所述装置还包括：

参见图4，图4为本发明实施例的电子设备的结构示意图。本发明实施例还提供了一种电子设备，包括处理器41、通信接口42、存储器43和通信总线44，其中，处理器41，通信接口42，存储器43通过总线完成相互间的通信；存储器43，用于存放计算机程序；处理器41，用于执行存储器43上所存放的程序，以实现如下步骤：

获取待播放的目标混音音频，所述目标混音音频由多个待播放的音频段混合形成的，所述每个音频段中的每个音符存有能量值；

获取所述目标混音音频的总能量值；

上述电子设备提到的通信总线44可以是外设部件互连标准(PeripheralComponent Interconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线44可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口42用于上述电子设备与其他设备之间的通信。

存储器43可以包括随机存取存储器43(Random Access Memory，RAM)，也可以包括非易失性存储器43(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器43。可选的，存储器43还可以是至少一个位于远离前述处理器41的存储装置。

上述的处理器41可以是通用处理器41，包括中央处理器41(Central ProcessingUnit，CPU)、网络处理器41(Network Processor，NP)等；还可以是数字信号处理器41(Digital Signal Processing，DSP)、专用集成电路(Application Specific IntegratedCircuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

相应于上述第一方面的实施例所提供的音频处理方法，本发明实施例还提供了一种计算机可读存储介质，用于存储有机器可执行指令，在被处理器调用和执行时，所述机器可执行指令促使所述处理器实现如下步骤：

获取所述目标混音音频的总能量值；

对于装置、电子设备以及计算机可读存储介质实施例而言，由于其所涉及的方法内容基本相似于前述的方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用对应的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、设备及计算机可读存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种音频处理方法，其特征在于，包括：

获取所述目标混音音频的总能量值；

2.如权利要求1所述的方法，其特征在于，所述调整所述目标混音音频的总能量值至小于或等于所述预设能量值，包括：

获取预设待减小的第一能量值；

获取所述目标混音音频的每个音频段的能量值；

3.如权利要求1所述的方法，其特征在于，所述调整所述目标混音音频的总能量值至小于或等于所述预设能量值，包括：

4.如权利要求1所述的方法，其特征在于，所述获取待播放的目标混音音频，包括：

将所述待播放的音频段混合形成所述目标混音音频，所述音频数据文件包括：所述待播放的音频段及每个音频段对应的能量值；

所述获取所述目标混音音频的总能量值，包括：

5.如权利要求1至4任一项所述的方法，其特征在于，所述调整所述目标混音音频的总能量值至小于或等于所述预设能量值之后，所述方法还包括：

播放调整后的目标混音音频。

6.一种音频处理装置，其特征在于，包括：

第二获取模块，用于获取所述目标混音音频的总能量值；

7.如权利要求6所述的装置，其特征在于，所述调整模块用于：

获取预设待减小的第一能量值；

获取所述目标混音音频的每个音频段的能量值；

8.如权利要求6所述的装置，其特征在于，所述调整模块用于：

9.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序，实现权利要求1-5任一所述的方法步骤。

10.一种计算机可读存储介质，其特征在于，所述存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法步骤。