CN115811591A

CN115811591A - 音频处理方法、装置、终端设备及存储介质

Info

Publication number: CN115811591A
Application number: CN202111073008.7A
Authority: CN
Inventors: 王英茂
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2021-09-14
Filing date: 2021-09-14
Publication date: 2023-03-17

Abstract

本申请实施例公开了一种音频处理方法、装置、终端设备及存储介质，属于音频处理技术领域，能够解决嘈杂环境下进行最大增益录音时，噪音被放大过多导致音频质量较差的问题。该方法包括：录制第一视频片段，第一视频片段包括第一初始音频片段；根据第一视频片段的第一变焦范围，以及第一初始音频片段的第一噪音等级，确定第一增益；基于第一增益，调整第一初始音频片段，得到第一音频片段。

Description

音频处理方法、装置、终端设备及存储介质

技术领域

本申请涉及音频处理技术领域，尤其涉及一种音频处理方法、装置、终端设备及存储介质。

背景技术

随着终端技术的迅速发展，音视频录制已成为手机、平板等终端设备中的一项重要应用，用户对视频中的音频效果的要求也越来越高。

目前，有时为了体现声像拉近的效果，在录制视频时，随着变焦倍数的放大，音频的音量也跟着放大。在变焦倍数增大的同时，通过增益放大音频的音量，从而可以实现音频的音量随着变焦倍数的放大而放大。

然而，音频增益与视频变焦范围的对应关系是固定的，变焦越大录音音量越大。为了体现放大效果，音频最高增益可以超过12db。如此，如果在很嘈杂的地方进行最大增益录音时，则录音文件里面的噪音非常有冲击感(噪音也以最大增益被放大)，导致音频效果欠佳。

发明内容

本申请实施例提供了一种音频处理方法、装置、终端设备及存储介质，以解决嘈杂环境下进行最大增益录音时，噪音被放大过多导致音频质量较差的问题。

本申请实施例的第一方面，提供一种音频处理方法，该方法包括：录制第一视频片段，第一视频片段包括第一初始音频片段；根据第一视频片段的第一变焦范围，以及第一初始音频片段的第一噪音等级，确定第一增益；基于第一增益，调整第一初始音频片段，得到第一音频片段。

本申请实施例的第二方面，提供一种音频处理装置，该装置包括：录制模块、确定模块和调整模块；该录制模块，用于录制第一视频片段，第一视频片段包括第一初始音频片段；该确定模块，用于根据该录制模块录制的第一视频片段的第一变焦范围，以及该录制模块录制的第一初始音频片段的第一噪音等级，确定第一增益；该调整模块，用于基于该确定模块确定的第一增益，调整第一初始音频片段，得到第一音频片段。

本申请实施例的第三方面，提供一种终端设备，该终端设备包括处理器、存储器及存储在该存储器上并可在该处理器上运行的程序或指令，该程序或指令被该处理器执行时实现如第一方面所述的音频处理方法的步骤。

本申请实施例的第四方面，提供一种可读存储介质，该可读存储介质上存储程序或指令，该程序或指令被处理器执行时实现如第一方面所述的音频处理方法的步骤。

本申请实施例的第五方面，提供了一种芯片，该芯片包括处理器和通信接口，该通信接口和该处理器耦合，该处理器用于运行程序或指令，实现如第一方面所述的音频处理方法。

本申请实施例中，可以通过录制第一视频片段，第一视频片段包括第一初始音频片段；根据第一视频片段的第一变焦范围，以及第一初始音频片段的第一噪音等级，确定第一增益；基于第一增益，调整第一初始音频片段，得到第一音频片段。本方案中，在录制视频的过程中，根据视频片段的变焦范围和视频片段中初始音频片段的噪音等级，确定音频的增益(以下简称音频增益)，如此，可以根据变焦范围和噪音等级，共同确定音频增益，从而可以得到根据环境噪音等级确定的适度放大音频的增益，在放大音频的同时，适度放大环境噪音，提高音频的听觉效果，提高音频的质量。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，还可以根据这些附图获得其它的附图。

图1为本申请实施例提供的一种可能的安卓操作系统的架构示意图；

图2为本申请实施例提供的音频处理方法的流程示意图之一；

图3为本申请实施例提供的音频处理方法的流程示意图之二；

图4为本申请实施例提供的音频处理方法的流程示意图之三；

图5为本申请实施例提供的音频处理方法的流程示意图之四；

图6为本申请实施例提供的一种音频处理装置的结构框图；

图7为本申请实施例提供的一种终端设备的硬件结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

下面首先对本发明的权利要求书和说明书中涉及的一些名词或者术语进行解释说明。

通常，终端设备视频录制时，随着变焦倍数的放大，录音音量也跟着放大(反则反之)，这目前成为业界一个逐渐流行的做法。目前控制视频录制音频音量的方法是建立音频增益与变焦范围的对应关系，然后随着变焦倍数的变化调用对应音频增益。如表1所示，一般变焦倍数越大增益越大，如此可以体现声像拉近的效果。

表1

从表1可知，音频增益与视频变焦范围的对应关系是固定的，变焦越大音频音量越大，为了体现放大效果，最高音频增益可以超过12db。然而，这样会导致一个问题：如果在很嘈杂的地方进行最大变焦倍数录音时，则录音文件里面的噪音非常有冲击感。

为了解决上述技术问题，本申请实施例中，可以通过录制第一视频片段，第一视频片段包括第一初始音频片段；根据第一视频片段的第一变焦范围，以及第一初始音频片段的第一噪音等级，确定第一增益；基于第一增益，调整第一初始音频片段，得到第一音频片段。本方案中，在录制视频的过程中，根据视频片段的变焦范围和视频片段中初始音频片段的噪音等级，确定音频的增益(以下简称音频增益)，从而可以根据变焦范围和噪音等级，共同确定音频增益，如此，可以得到根据环境噪音等级确定的适度放大音频的增益，在放大音频的同时，适度放大环境噪音，提高音频的听觉效果，提高音频的质量。

本发明实施例中的终端设备可以为具有操作系统的终端设备。该操作系统可以为安卓(Android)操作系统、ios操作系统或者鸿蒙操作系统，还可以为其他可能的操作系统，本发明实施例不作具体限定。

下面以安卓操作系统为例，介绍一下本发明实施例提供的音频处理方法所应用的软件环境。

如图1所示，为本发明实施例提供的一种可能的安卓操作系统的架构示意图。在图1中，安卓操作系统的架构包括4层，分别为：应用程序层、应用程序框架层、系统运行库层和内核层(具体可以为Linux内核层)。

其中，应用程序层包括安卓操作系统中的各个应用程序(包括系统应用程序和第三方应用程序)。

应用程序框架层是应用程序的框架，开发人员可以在遵守应用程序的框架的开发原则的情况下，基于应用程序框架层开发一些应用程序。

系统运行库层包括库(也称为系统库)和安卓操作系统运行环境。库主要为安卓操作系统提供其所需的各类资源。安卓操作系统运行环境用于为安卓操作系统提供软件环境。

内核层是安卓操作系统的操作系统层，属于安卓操作系统软件层次的最底层。内核层基于Linux内核为安卓操作系统提供核心系统服务和与硬件相关的驱动程序。

以安卓操作系统为例，本发明实施例中，开发人员可以基于上述如图1所示的安卓操作系统的系统架构，开发实现本发明实施例提供的音频处理方法的软件程序，从而使得该音频处理方法可以基于如图1所示的安卓操作系统运行。即处理器或者终端设备可以通过在安卓操作系统中运行该软件程序实现本发明实施例提供的音频处理方法。

本申请实施例中的终端设备可以为移动终端设备，也可以为非移动终端设备。移动终端设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载终端设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personal digital assistant，PDA)等；非移动终端设备可以为个人计算机(personalcomputer，PC)、电视机(television，TV)、柜员机或者自助机等；本申请实施例不作具体限定。

本申请实施例提供的音频处理方法的执行主体可以为上述的终端设备(包括移动终端设备和非移动终端设备)，也可以为该终端设备中能够实现该音频处理方法的功能模块和/或功能实体，具体的可以根据实际使用需求确定，本申请实施例不作限定。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的音频处理方法进行详细地说明。

如图2所示，本申请实施例提供一种音频处理方法，下面以执行主体为终端设备为例，对本申请实施例提供的音频处理方法进行示例性的说明。该方法可以包括下述的步骤201至步骤203。

201、终端设备录制第一视频片段。

其中，第一视频片段包括第一初始音频片段。

其中，第一视频片段包括第一初始音频片段和N帧视频画面，终端设备通过摄像头录制该N帧视频画面，通过麦克风录制第一初始音频片段，第一初始音频片段为未经过任意音频处理的音频片段。

可以理解，第一视频片段为视频录制过程中的任意视频片段，终端设备对视频录制过程中的每个视频片段中的初始音频片段的处理，均与对第一初始音频片段的处理相同，具体可以参考下述描述。

202、终端设备根据第一视频片段的第一变焦范围，以及第一初始音频片段的第一噪音等级，确定第一增益。

其中，第一变焦范围为录制第一视频片段时摄像头的变焦倍数所在的变焦范围。

其中，第一噪音等级(NoiseLevel)为第一初始音频片段中的环境噪音的噪音等级，噪音等级为根据噪音响度对噪音进行分类而得到的，即不同的噪音等级对应不同的噪音响度范围。

可选地，终端设备可以根据第一变焦范围、第一噪音等级，以及第一列表，确定第一增益，其中第一列表为变焦范围、噪音等级与增益之间的映射关系表；终端设备也可以根据第一变焦范围、第一噪音等级，以及第一函数，确定第一增益，其中第一函数为变焦范围、噪音等级与增益之间的映射函数；终端设备还可以通过其他可行性方式根据第一变焦范围和第一噪音等级确定第一增益，本申请实施例不做限定。

203、终端设备基于第一增益，调整第一初始音频片段，得到第一音频片段。

可以理解，终端设备可以根据第一增益调整第一初始音频片段，得到第一音频片段；也可以根据第一增益得到其他增益，然后根据其他增益调整第一初始音频片段，得到第一音频片段；还可以通过其他可行性手段基于第一增益调整第一初始音频片段，得到第一音频片段，具体可以根据实际使用需求确定，本申请实施例不做限定。

可以理解，在得到第一音频片段之后，终端设备将第一音频片段和N帧视频画面合称为新的第一视频片段，终端设备还可以播放新的第一视频画面。

本申请实施例中，在录制视频的过程中，根据视频片段的变焦范围和视频片段中初始音频片段的噪音等级，确定音频的增益(以下简称音频增益)，如此，可以根据变焦范围和噪音等级，共同确定音频增益，从而可以得到根据环境噪音等级确定的适度放大音频的增益，在放大音频的同时，适度放大环境噪音，提高音频的听觉效果。

可选地，上述步骤203具体可以通过下述步骤203a实现。

203a、在第一增益与第二增益的差值的绝对值小于或等于增益阈值的情况下，终端设备根据第一增益，调整第一初始音频片段，得到第一音频片段。

其中，第二增益为第二初始音频片段对应的调整增益，第二初始音频片段属于在第一视频片段之前录制的第二视频片段。

其中，增益阈值可以根据实际使用需求确定，本申请实施例不做限定。第二增益可以大于第一增益，也可以小于第一增益，还可以等于第一增益，本申请实施例不做限定。

其中，第二视频片段可以为与第一视频片段相邻的视频片段，也可以为与第一视频片段间隔一定视频片段的视频片段，本申请实施例不做限定。

可选地，调整增益可以是实际用于调整第二初始音频片段的响度的增益，也可以是根据(第二初始音频片段所属的第二视频片段的)第二变焦范围和(第二初始音频片段的)第二噪音等级确定的，具体可以根据实际使用需求确定，本申请实施例不做限定。

可以理解，将第一增益与之前的视频片段的增益(第二增益)进行对比，若二者的差值的绝对值小于或等于增益阈值，则根据第一增益，调整第一初始音频片段，得到第一音频片段。

本申请实施例中，在第一增益与第二增益的差值的绝对值小于或等于增益阈值的情况下，终端设备根据第一增益，调整第一初始音频片段，得到第一音频片段，可以保证音频的增益不会急剧突变，因此可以避免因增益变化过大导致音频片段的响度(较之前的音频片段的响度)变化过大而影响听觉效果。

可选地，上述步骤203具体可以通过下述步骤203b实现。

203b、在第一增益与第二增益的差值的绝对值大于该增益阈值的情况下，终端设备根据第三增益，调整第一初始音频片段，得到第一音频片段。

其中，第三增益大于第一值，且小于第二值；第一值为第一增益和第二增益中的较小值，第二值为第一增益和第二增益中的较大值。

可选地，第三增益与第一增益的差值的绝对值小于或等于该增益阈值。

可以理解，若第一增益小于第二增益，则第三增益大于第一增益，且小于第二增益；若第一增益大于第二增益，则第三增益大于第二增益，且小于第一增益。

可以理解，将第一增益与之前的视频片段的增益(第二增益)进行对比，若二者的差值的绝对值大于增益阈值，则根据第一增益和第二增益确定(位于第一增益和第二增益之间的)第三增益，然后根据第三增益调整第一初始音频片段，得到第一音频片段。

其中，可以在第二增益的基础上增加或减少预设的增益间隔，得到第三增益；也可以在第二增益的基础上增加或减少与第一差值对应的增益间隔(第一差值的一半、三分之一或四分之一等，该增益间隔小于增益阈值)，得到第三增益；具体可以根据实际使用需求确定，本申请实施例不做限定。

本申请实施例中，在第一增益与第二增益的差值的绝对值大于该增益阈值的情况下，终端设备根据位于第一增益和第二增益之间的第三增益，调整第一初始音频片段，得到第一音频片段(即通过平滑处理，延时达到第一增益)，可以保证音频的增益不会急剧突变，因此可以避免因增益变化过大导致音频片段的响度(较之前的音频片段的响度)变化过大而影响听觉效果。

本申请实施例中，在第一增益与第二增益相差过多的情况下，

可选地，本申请实施例中，增益(Gain)的单位为分贝(db)，增益为0db表示不需要调整对应的音频片段，增益不为0db表示需要调整对应的音频片段。

需要说明的是，若第一增益为0db，则可以不调整第一初始音频片段，或者，若第一增益为0db，且在第一初始音频片段之前相邻的初始音频片段的增益也为0db或绝对值小于或等于增益阈值，则可以不调整第一初始音频片段。

可选地，上述步骤202具体可以通过下述步骤202a实现。

202a、在满足目标条件的情况下，终端设备根据第一变焦范围和第一噪音等级，确定第一增益。

其中，该目标条件包括以下至少一项：第一变焦范围与第二变焦范围不同，第一噪音等级与第二噪音等级不同。

其中，第二变焦范围为：在第一视频片段之前录制的第二视频片段对应的变焦范围；第二噪音等级为：第二视频片段包括的第二初始音频片段对应的噪音等级。

其中，对第二变焦范围的描述可以参考上述步骤202中对第一变焦范围的相关描述，本申请实施例不做限定。

其中，对第二噪音等级的描述可以参考上述步骤202中对第一噪音等级的相关描述，本申请实施例不做限定。

可以理解，在第一变焦范围与第二变焦范围不同，与第一噪音等级与第二噪音等级不同中至少一个成立的情况下，终端设备根据第一变焦范围和第一噪音等级，确定第一增益，然后基于第一增益，调整第一初始音频片段，得到第一音频片段。在第一变焦范围与第二变焦范围相同，且第一噪音等级与第二噪音等级相同的情况下，终端设备无需确定第一增益，可以直接基于第二增益，调整第一初始音频片段，得到第一音频片段。

本申请实施例中，可以根据第一变焦范围与第二变焦范围是否相同，以及第一噪音等级与第二噪音等级是否相同，确定是否需要确定第一增益，从而可以提高音频处理效率。

可选地，上述步骤202具体可以通过下述步骤202b至步骤202c实现。

202b、终端设备从多个查找表中，确定与第一变焦范围对应的第一查找表。

其中，第一查找表为噪音等级与增益的映射表。

其中，不同的变焦范围对应不同的查找表，不同的查找表为不同的噪音等级与增益的映射表。

202c、终端设备根据第一查找表，确定与第一噪音等级对应的第一增益。

示例性地，如表2和表3所示，不同的变焦范围对应不同的查找表，不同的查找表为不同的噪音等级与增益的映射表。

表2

表3

可选地，终端设备也可以从多个函数关系中，确定与第一变焦范围对应的第一函数关系。其中，第一函数关系为：以噪音等级为自变量，增益为因变量的函数；不同的变焦范围对应不同的函数关系，不同的函数关系为不同的噪音等级与增益的函数关系。

可选地，上述步骤202具体可以通过下述步骤202d至步骤202e实现。

202d、终端设备从多个映射表中，确定与第一噪音等级对应的第一映射表。

其中，第一映射表为变焦范围与增益的映射表。

其中，不同的映射表对应不同的变焦范围，不同的映射表为不同的噪音等级与增益的映射表。

202e、终端设备根据第一映射表，确定与第一变焦范围对应的第一增益。

其中，多个映射表可以参考表2和表3，此处不予赘述。

可选地，终端设备也可以从多个函数关系中，确定与第一噪音等级对应的第二函数关系。其中，第二函数关系为：以变焦范围为自变量，录音增益为因变量的函数；不同的噪音等级对应不同的函数关系，不同的函数关系为不同的噪音等级与增益的函数关系。

本申请实施例中，提供了多种根据第一变焦范围和第一噪音等级确定第一增益的方案，如此可以根据实际使用需求确定合适的方案，可以提高音频处理效率。

可选地，在噪音等级小于或等于第一等级阈值的情况下，终端设备可以根据变焦范围确定对应的初始音频片段的增益。可选地，在噪音等级小于或等于第二等级阈值的情况下，无论变焦范围为多少，终端设备可以确定对应的初始音频片段无需通过增益调整。如此，可以提高第一增益的确定效率，可以提高音频处理效率。

其中，第一等级阈值和第二等级阈值可以相同，也可以不相同，即第一等级阈值小于或等于第二等级阈值，第一等级阈值和第二等级阈值可以根据实际使用需求确定，本申请实施例不做限定。

可选地，上述步骤203具体可以通过下述步骤203c至步骤203d实现。

203c、终端设备对第一初始音频片段进行预处理，得到处理后的初始音频片段。

203d、终端设备基于第一增益，调整该处理后的初始音频片段，得到第一音频片段。

其中，该预处理包括以下至少一项：均衡(Equaliser，EQ)处理，降噪处理。

其中，EQ处理的基本作用是通过对声音某一个或多个频段进行增益或衰减，从而达到调整音色的目的。EQ处理通常包括以下三个参数：频率(Frequency)用于设定要进行调整的频率点的参数；增益(Gain)用于调整在设定好的F值上进行增益或衰减的参数；量化(Quantize)用于设定要进行增益或衰减的频段“宽度”的参数。在这里，要注意是：当设定的Q值越小的时候，所处理的频段就越宽，而当设定的Q值越大的时候，所处理的频段就越窄。

其中，具体的EQ处理技术、降噪处理技术可以参考现有相关技术，本申请实施例不做限定。

本申请实施例中，对第一初始音频片段进行预处理可以使最终得到的第一音频片段的音频效果更好，提高音频质量。

在上述步骤202之前，本申请实施例提供的音频处理方法还可以包括下述的步骤204。

204、终端设备对第一初始音频片段进行噪音分析处理，得到第一噪音等级。

其中，该噪音分析处理包括以下任一项：基于神经网络的高斯混合模型处理、梅尔倒谱系数处理、基于卷积神经网络的噪音识别处理。

其中，高斯混合模型处理、梅尔倒谱系数处理、基于卷积神经网络的噪音识别处理可以参考现有相关技术，本申请实施例不做限定。

其中，噪音包括稳态噪音和非稳态噪音。稳态噪音指频率成分、幅值基本维持稳定的噪音，比如空调声、白噪音、粉噪、风声等；非稳态噪音指时间延续性较差的噪音，比如汽车过马路的呼啸声。目前的声学分析有了长足的发展，对噪音识别也越来越准确，本申请实施例中，噪音分析处理方法可以参考现有相关技术，本申请实施例不限定使用何种噪音识别方法。

本申请实施例中，提供了多种噪音分析处理方法，具体可以根据实际使用需求确定，从而可以提高音频处理效率，提高音频质量。

本申请实施例中，可以确保视频录制变焦时的音频增益根据环境噪音的噪音等级(噪音响度水平而不是音频片段的整体音频的响度水平)的情况自动调整，使得低噪音环境下录音增益较高，高噪音环境下增益较低，兼顾放大效果和主观听感，如此，不同噪音场景都可以输出合理的音频响度。

如图3所示，本申请实施例提供一种音频处理方法，下面以执行主体为终端设备为例，对本申请实施例提供的音频处理方法进行示例性的说明。该方法可以包括下述的步骤301至步骤306。

301、终端设备录制第一视频片段。

302、终端设备根据第一变焦范围和第一噪音等级，确定第一增益。

其中，对上述步骤301至步骤302的具体描述可以参考上述步骤201至步骤202的相关描述，此处不再赘述。

303、终端设备确定第一增益与第二增益的差值的绝对值是否小于或等于增益阈值。

可以理解，若终端设备确定第一增益与第二增益的差值的绝对值小于或等于增益阈值，则执行下述步骤304；若终端设备确定第一增益与第二增益的差值的绝对值大于增益阈值，则执行下述步骤305至步骤306。

304、终端设备根据第一增益，调整第一初始音频片段，得到第一音频片段。

其中，对上述步骤303至步骤304的具体描述可以参考上述步骤203a的相关描述，此处不再赘述。

305、终端设备根据第一增益和第二增益，确定第三增益。

306、终端设备根据第三增益，调整第一初始音频片段，得到第一音频片段。

其中，对上述步骤303、步骤305至步骤306的具体描述可以参考上述步骤203b的相关描述，此处不再赘述。

如图4所示，本申请实施例提供一种音频处理方法，下面以执行主体为终端设备为例，对本申请实施例提供的音频处理方法进行示例性的说明。该方法可以包括下述的步骤401至步骤407。

401、终端设备录制第一视频片段。

其中，对上述步骤401的具体描述可以参考上述步骤201的相关描述，此处不再赘述。

402、终端设备从多个查找表中，确定与第一变焦范围对应的第一查找表。

403、终端设备根据第一查找表，确定与第一噪音等级对应的第一增益。

其中，对上述步骤402至步骤403的具体描述可以参考上述步骤202b至步骤202c的相关描述，此处不再赘述。

404、终端设备确定第一增益与第二增益的差值的绝对值是否小于或等于增益阈值。

可以理解，若终端设备确定第一增益与第二增益的差值的绝对值小于或等于增益阈值，则执行下述步骤405；若终端设备确定第一增益与第二增益的差值的绝对值大于增益阈值，则执行下述步骤406至步骤407。

405、终端设备根据第一增益，调整第一初始音频片段，得到第一音频片段。

其中，对上述步骤404至步骤405的具体描述可以参考上述步骤203a的相关描述，此处不再赘述。

406、终端设备根据第一增益和第二增益，确定第三增益。

407、终端设备根据第三增益，调整第一初始音频片段，得到第一音频片段。

其中，对上述步骤404、步骤406至步骤407的具体描述可以参考上述步骤203b的相关描述，此处不再赘述。

如图5所示，本申请实施例提供一种音频处理方法，下面以执行主体为终端设备为例，对本申请实施例提供的音频处理方法进行示例性的说明。该方法可以包括下述的步骤501至步骤509。

501、终端设备录制第一视频片段。

其中，对上述步骤501的具体描述可以参考上述步骤201的相关描述，此处不再赘述。

502、终端设备确定是否满足目标条件。

可以理解，若终端设备不满足目标条件(即第一变焦范围与第二变焦范围相同，以及第一噪音等级与第二噪音等级相同)，则执行下述步骤503；若终端设备满足目标条件(即第一变焦范围与第二变焦范围不同，以及第一噪音等级与第二噪音等级不同中的至少一个成立)，则执行下述步骤504至步骤509。

503、终端设备根据第二增益，调整第一初始音频片段，得到第一音频片段。

可以理解，在第一变焦范围与第二变焦范围相同，以及第一噪音等级与第二噪音等级相同的情况下，无需重新确定第一初始音频片段对应的增益，可以根据第二增益，调整第一初始音频片段，得到第一音频片段。

504、终端设备从多个映射表中，确定与第一噪音等级对应的第一映射表。

505、终端设备根据第一映射表，确定与第一变焦范围对应的第一增益。

其中，对上述步骤502至步骤505的具体描述可以参考上述步骤202a和步骤202d至步骤202e的相关描述，此处不再赘述。

506、终端设备确定第一增益与第二增益的差值的绝对值是否小于或等于增益阈值。

可以理解，若终端设备确定第一增益与第二增益的差值的绝对值小于或等于增益阈值，则执行下述步骤507；若终端设备确定第一增益与第二增益的差值的绝对值大于增益阈值，则执行下述步骤508至步骤509。

507、终端设备根据第一增益，调整第一初始音频片段，得到第一音频片段。

508、终端设备根据第一增益和第二增益，确定第三增益。

509、终端设备根据第三增益，调整第一初始音频片段，得到第一音频片段。

其中，对上述步骤506至步骤509的具体描述可以参考上述步骤203a至步骤203b的相关描述，此处不再赘述。

图6为本申请实施例示出的一种音频处理装置的结构框图，如图6所示，包括：录制模块601、确定模块602和调整模块603；该录制模块601，用于录制第一视频片段，第一视频片段包括第一初始音频片段；该确定模块602，用于根据该录制模块601录制的第一视频片段的第一变焦范围，以及该录制模块601录制的第一初始音频片段的第一噪音等级，确定第一增益；该调整模块603，用于基于该确定模块602确定的第一增益，调整第一初始音频片段，得到第一音频片段。

可选地，该调整模块603，具体用于在第一增益与第二增益的差值的绝对值小于或等于增益阈值的情况下，根据第一增益，调整第一初始音频片段，得到第一音频片段；其中，第二增益为第二初始音频片段对应的调整增益，第二初始音频片段属于在第一视频片段之前录制的第二视频片段。

可选地，该调整模块603，具体用于在第一增益与第二增益的差值的绝对值大于该增益阈值的情况下，根据第三增益，调整第一初始音频片段，得到第一音频片段；其中，第三增益大于第一值，且小于第二值；第一值为第一增益和第二增益中的较小值，第二值为第一增益和第二增益中的较大值。

可选地，该确定模块602，具体用于在满足目标条件的情况下，根据第一变焦范围和第一噪音等级，确定第一增益；其中，该目标条件包括以下至少一项：第一变焦范围与第二变焦范围不同，第一噪音等级与第二噪音等级不同；第二变焦范围为：在第一视频片段之前录制的第二视频片段对应的变焦范围；第二噪音等级为：第二视频片段包括的第二初始音频片段对应的噪音等级。

可选地，该确定模块602，具体用于从多个查找表中，确定与第一变焦范围对应的第一查找表，第一查找表为噪音等级与增益的映射表；根据第一查找表，确定与第一噪音等级对应的第一增益。

可选地，该确定模块602，具体用于从多个映射表中，确定与第一噪音等级对应的第一映射表，第一映射表为变焦范围与增益的映射表；根据第一映射表，确定与第一变焦范围对应的第一增益。

可选地，该调整模块603，具体用于对第一初始音频片段进行预处理，得到处理后的初始音频片段；基于第一增益，调整该处理后的初始音频片段，得到第一音频片段；其中，该预处理包括以下至少一项：EQ处理，降噪处理。

需要说明的是，本申请实施例中，该音频处理装置可以为上述方法实施例中的终端设备，也可以为上述方法实施例中的终端设备中能够实现上述装置实施例功能的功能模块和/或功能实体，本申请实施例不做限定。

本申请实施例中，各模块可以实现上述方法实施例提供的音频处理方法，且能达到相同的技术效果，为避免重复，这里不再赘述。

图7为实现本申请各个实施例的一种终端设备的硬件结构示意图，如图7所示，该终端设备包括但不限于：射频(radio frequency，RF)电路701、存储器702、输入单元703、显示单元704、传感器705、音频电路706、无线通信(wireless fidelity，WiFi)模块707、处理器708、电源709、以及摄像头710等部件。其中，射频电路701包括接收器7011和发送器7012。本领域技术人员可以理解，图7中示出的终端设备结构并不构成对终端设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

RF电路701可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器708处理；另外，将设计上行的数据发送给基站。通常，RF电路701包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noiseamplifier，LNA)、双工器等。此外，RF电路701还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(globalsystem of mobile communication，GSM)、通用分组无线服务(general packet radioservice，GPRS)、码分多址(code division multiple access，CDMA)、宽带码分多址(wideband code division multiple access，WCDMA)、长期演进(long term evolution，LTE)、电子邮件、短消息服务(short messaging service，SMS)等。

存储器702可用于存储软件程序以及模块，处理器708通过运行存储在存储器702的软件程序以及模块，从而执行终端设备的各种功能应用以及数据处理。存储器702可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据终端设备的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器702可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元703可用于接收输入的数字或字符信息，以及产生与终端设备的用户设置以及功能控制有关的键信号输入。具体地，输入单元703可包括触控面板7031以及其他输入设备7032。触控面板7031，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板7031上或在触控面板7031附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选地，触控面板7031可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器708，并能接收处理器708发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种实现触控面板7031。除了触控面板7031，输入单元703还可以包括其他输入设备7032。具体地，其他输入设备7032可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元704可用于显示由用户输入的信息或提供给用户的信息以及终端设备的各种菜单。显示单元704可包括显示面板7041，可选地，可以采用液晶显示器(liquidcrystal display，LCD)、有机发光二极管(organic light-Emitting diode，OLED)等形式来配置显示面板7041。进一步的，触控面板7031可覆盖显示面板7041，当触控面板7031检测到在其上或附近的触摸操作后，传送给处理器708以确定触摸事件的，随后处理器708根据触摸事件的在显示面板7041上提供相应的视觉输出。虽然在图7中，触控面板7031与显示面板7041是作为两个独立的部件来实现终端设备的输入和输入功能，但是在某些实施例中，可以将触控面板7031与显示面板7041集成而实现终端设备的输入和输出功能。

终端设备还可包括至少一种传感器705，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板7041的亮度，接近传感器可在终端设备移动到耳边时，退出显示面板7041和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别终端设备姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于终端设备还可配置的陀螺仪、地磁传感器、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。本申请实施例中，该终端设备可以包括加速度传感器、深度传感器或者距离传感器等。

音频电路706、扬声器7061，传声器7062可提供用户与终端设备之间的音频接口。音频电路706可将接收到的音频数据转换后的电信号，传输到扬声器7061，由扬声器7061转换为声音信号输出；另一方面，传声器7062将收集的声音信号转换为电信号，由音频电路706接收后转换为音频数据，再将音频数据输出处理器708处理后，经RF电路701以发送给比如另一终端设备，或者将音频数据输出至存储器702以便进一步处理。

WiFi属于短距离无线传输技术，终端设备通过WiFi模块707可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图7示出了WiFi模块707，但是可以理解的是，其并不属于终端设备的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器708是终端设备的控制中心，利用各种接口和线路连接整个终端设备的各个部分，通过运行或执行存储在存储器702内的软件程序和/或模块，以及调用存储在存储器702内的数据，执行终端设备的各种功能和处理数据，从而对终端设备进行整体监控。可选地，处理器708可包括一个或多个处理单元；优选的，处理器708可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器708中。

终端设备还包括给各个部件供电的电源709(比如电池)，优选的，电源可以通过电源管理系统与处理器708逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。终端设备还包括摄像头710，摄像头710用于录制视频片段中的视频画面。尽管未示出，终端设备还可以包括蓝牙模块等，在此不再赘述。

本申请实施例中，处理器708，用于录制第一视频片段，第一视频片段包括第一初始音频片段；根据第一视频片段的第一变焦范围，以及第一初始音频片段的第一噪音等级，确定第一增益；基于第一增益，调整第一初始音频片段，得到第一音频片段。

可选地，处理器708，具体用于在第一增益与第二增益的差值的绝对值小于或等于增益阈值的情况下，根据第一增益，调整第一初始音频片段，得到第一音频片段；其中，第二增益为第二初始音频片段对应的调整增益，第二初始音频片段属于在第一视频片段之前录制的第二视频片段。

可选地，处理器708，具体用于在第一增益与第二增益的差值的绝对值大于该增益阈值的情况下，根据第三增益，调整第一初始音频片段，得到第一音频片段；其中，第三增益大于第一值，且小于第二值；第一值为第一增益和第二增益中的较小值，第二值为第一增益和第二增益中的较大值。

可选地，处理器708，具体用于在满足目标条件的情况下，根据第一变焦范围和第一噪音等级，确定第一增益；其中，该目标条件包括以下至少一项：第一变焦范围与第二变焦范围不同，第一噪音等级与第二噪音等级不同；第二变焦范围为：在第一视频片段之前录制的第二视频片段对应的变焦范围；第二噪音等级为：第二视频片段包括的第二初始音频片段对应的噪音等级。

可选地，处理器708，具体用于从多个查找表中，确定与第一变焦范围对应的第一查找表，第一查找表为噪音等级与增益的映射表；根据第一查找表，确定与第一噪音等级对应的第一增益。

可选地，处理器708，具体用于从多个映射表中，确定与第一噪音等级对应的第一映射表，第一映射表为变焦范围与增益的映射表；根据第一映射表，确定与第一变焦范围对应的第一增益。

可选地，处理器708，具体用于对第一初始音频片段进行预处理，得到处理后的初始音频片段；基于第一增益，调整该处理后的初始音频片段，得到第一音频片段；其中，该预处理包括以下至少一项：EQ处理，降噪处理。

本实施例中各种实现方式具有的有益效果具体可以参见上述音频处理方法实施例中相应实现方式所具有的有益效果，为避免重复，此处不再赘述。

本申请实施例还提供一种终端设备，该终端设备可以包括：处理器，存储器以及存储在存储器上并可在处理器上运行的程序或指令，该程序或指令被处理器执行时可以实现上述方法实施例提供的音频处理方法的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本申请实施例提供一种可读存储介质，该可读存储介质上存储程序或指令，该程序或指令被处理器执行时实现上述方法实施例提供的音频处理方法的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本申请实施例还提供一种计算机程序产品，其中，该计算机程序产品包括计算机指令，当该计算机程序产品在处理器上运行时，使得处理器执行该计算机指令，实现上述方法实施例提供的音频处理方法的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述音频处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置，服务器和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种音频处理方法，其特征在于，所述方法包括：

录制第一视频片段，所述第一视频片段包括第一初始音频片段；

根据所述第一视频片段的第一变焦范围，以及所述第一初始音频片段的第一噪音等级，确定第一增益；

基于所述第一增益，调整所述第一初始音频片段，得到第一音频片段。

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一增益，调整所述第一初始音频片段，得到第一音频片段，包括：

在所述第一增益与第二增益的差值的绝对值小于或等于增益阈值的情况下，根据所述第一增益，调整所述第一初始音频片段，得到所述第一音频片段；

其中，所述第二增益为第二初始音频片段对应的调整增益，所述第二初始音频片段属于在所述第一视频片段之前录制的第二视频片段。

3.根据权利要求2所述的方法，其特征在于，所述基于所述第一增益，调整所述第一初始录音数据，得到第一录音数据，包括：

在所述第一增益与所述第二增益的差值的绝对值大于所述增益阈值的情况下，根据第三增益，调整所述第一初始音频片段，得到所述第一音频片段；

其中，所述第三增益大于第一值，且小于第二值；所述第一值为所述第一增益和所述第二增益中的较小值，所述第二值为所述第一增益和所述第二增益中的较大值。

4.根据权利要求1所述的方法，其特征在于，所述根据所述第一视频片段的第一变焦范围，以及所述第一初始音频片段的第一噪音等级，确定第一增益，包括：

在满足目标条件的情况下，根据所述第一变焦范围和所述第一噪音等级，确定所述第一增益；

其中，所述目标条件包括以下至少一项：所述第一变焦范围与第二变焦范围不同，所述第一噪音等级与第二噪音等级不同；

所述第二变焦范围为：在所述第一视频片段之前录制的第二视频片段对应的变焦范围；所述第二噪音等级为：所述第二视频片段包括的第二初始音频片段对应的噪音等级。

5.根据权利要求1所述的方法，其特征在于，所述根据所述第一视频片段的第一变焦范围，以及所述第一初始音频片段的第一噪音等级，确定第一增益，包括：

从多个查找表中，确定与所述第一变焦范围对应的第一查找表，所述第一查找表为噪音等级与增益的映射表；

根据所述第一查找表，确定与所述第一噪音等级对应的第一增益。

6.根据权利要求1所述的方法，其特征在于，所述根据所述第一视频片段的第一变焦范围，以及所述第一初始音频片段的第一噪音等级，确定第一增益，包括：

从多个映射表中，确定与所述第一噪音等级对应的第一映射表，所述第一映射表为变焦范围与增益的映射表；

根据所述第一映射表，确定与所述第一变焦范围对应的第一增益。

7.根据权利要求1至6中任一项所述的方法，其特征在于，所述基于所述第一增益，调整所述第一初始音频片段，得到第一音频片段，包括：

对所述第一初始音频片段进行预处理，得到处理后的初始音频片段；

基于所述第一增益，调整所述处理后的初始音频片段，得到所述第一音频片段；

其中，所述预处理包括以下至少一项：均衡EQ处理，降噪处理。

8.一种音频处理装置，其特征在于，所述装置包括：录制模块、确定模块和调整模块；

所述录制模块，用于录制第一视频片段，所述第一视频片段包括第一初始音频片段；

所述确定模块，用于根据所述录制模块录制的所述第一视频片段的第一变焦范围，以及所述录制模块录制的所述第一初始音频片段的第一噪音等级，确定第一增益；

所述调整模块，用于基于所述确定模块确定的所述第一增益，调整所述第一初始音频片段，得到第一音频片段。

9.一种终端设备，其特征在于，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1至7中任一项所述的音频处理方法的步骤。

10.一种可读存储介质，其特征在于，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1至7中任一项所述的音频处理方法的步骤。