CN110870201B

CN110870201B - 音频信号调节方法、装置、存储介质及终端

Info

Publication number: CN110870201B
Application number: CN201780092232.6A
Authority: CN
Inventors: 许钊铵; 严锋贵; 甘高亭; 郑志勇; 杨海
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2017-08-18
Filing date: 2017-08-18
Publication date: 2023-10-24
Anticipated expiration: 2037-08-18
Also published as: US11251763B2; CN110870201A; EP3664291A4; EP3664291A1; WO2019033438A1; US20200186114A1

Abstract

音频信号调节方法、装置、存储介质及终端。该方法包括：检测到预设事件被触发时，控制麦克风采集音频信号(101)，预设事件包括预设通话事件和/或预设录音事件；对音频信号对应的声音响度进行分析(102)；根据分析结果以及预设调节策略对音频信号对应的声音响度进行动态调节(103)；根据预设事件的类型对调节后的音频信号进行相应的输出处理。无需通话对端自行调节音量或者无需在播放录音时由收听者反复调节音量，可保持音频信号以预先设定好的音量变化规律被输出。

Description

音频信号调节方法、装置、存储介质及终端

技术领域

本发明实施例涉及音频处理技术领域，尤其涉及音频信号调节方法、装置、存储介质及终端。

背景技术

为了满足用户在生活以及工作中的语音通话、视频通话以及录音等需求，多数终端都具备通话或录音功能，如手机、平板电脑、音乐播放器以及录音笔等。

一般的，终端通过集成麦克风(简称mic，又称传声器)来实现通话或录音功能。麦克风是一种将声音信号转换为电信号的能量转换器件，当声音的振动传到麦克风的振动膜上后，会导致里面的磁铁形成变化的电流信号，由声音处理电路对电流信号进行处理后传输到通话对端或进行存储，进而实现通话或录音。

发明内容

本发明实施例提供音频信号调节方法、装置、存储介质及终端，可以在通话或录音过程中对录入的音频信号进行自动调节。

第一方面，本发明实施例提供了一种音频信号调节方法，包括：

检测到预设事件被触发时，控制麦克风采集音频信号，所述预设事件包括预设通话事件和/或预设录音事件；

对所述音频信号对应的声音响度进行分析；

根据分析结果以及预设调节策略对所述音频信号对应的声音响度进行动态调节；

根据所述预设事件的类型对调节后的音频信号进行相应的输出处理。

第二方面，本发明实施例提供了一种音频信号调节装置，包括：

音频信号采集模块，用于在检测到预设事件被触发时，控制麦克风采集音频信号，所述预设事件包括预设通话事件和/或预设录音事件；

响度分析模块，用于对所述音频信号对应的声音响度进行分析；

响度调节模块，用于根据分析结果以及预设调节策略对所述音频信号对应的声音响度进行动态调节；

信号输出模块，用于根据所述预设事件的类型对调节后的音频信号进行相应的输出处理。

第三方面，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例所述的音频信号调节。

第四方面，本发明实施例提供了一种移动终端，包括麦克风，存储器，处理器及存储在存储器上并可在处理器运行的计算机程序，所述处理器执行所述计算机程序时实现如本发明实施例所述的音频信号调节方法。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种音频信号调节方法的流程示意图；

图2为本发明实施例提供的一种智能手机的音频处理硬件系统结构示意图；

图3为本发明实施例提供的一种音频系统架构框图；

图4为本发明实施例提供的又一种音频信号调节方法的流程示意图；

图5为本发明实施例提供的又一种音频信号调节方法的流程示意图；

图6为本发明实施例提供的又一种音频信号调节方法的流程示意图；

图7为本发明实施例提供的一种音频信号调节装置的结构框图；

图8为本发明实施例提供的一种终端的结构示意图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

本发明实施例提供音频调节方法，该方法包括：检测到预设事件被触发时，控制麦克风采集音频信号，所述预设事件包括预设通话事件和/或预设录音事件；对所述音频信号对应的声音响度进行分析；根据分析结果以及预设调节策略对所述音频信号对应的声音响度进行动态调节；根据所述预设事件的类型对调节后的音频信号进行相应的输出处理。

可选的，所述根据所述预设事件的类型对调节后的音频信号进行相应的输出处理，包括：当所述预设事件包括预设通话事件时，将调节后的音频信号发送至通话对端；当所述预设事件包括预设录音事件时，将调节后的音频信号作为录音信号进行存储。

可选的，所述对所述音频信号对应的声音响度进行分析，包括：对所述音频信号的振幅信息进行分析，以得到声音响度分析结果。

可选的，对所述音频信号的振幅信息进行分析，以得到声音响度分析结果，包括：提取所述音频信号中对应人声的振幅信息；对所述对应人声的振幅信息进行分析，以得到声音响度分析结果。

可选的，所述根据分析结果以及预设调节策略对所述音频信号对应的声音响度进行动态调节，包括：当所述声音响度分析结果中包括当前声音响度小于第一预设响度阈值时，对所述当前声音响度进行升高调节；和/或，当所述声音响度分析结果中包括当前声音响度大于第二预设响度阈值时，对所述当前声音响度进行降低调节。

可选的，所述当所述声音响度分析结果中包括当前声音响度小于第一预设响度阈值时，对所述当前声音响度进行升高调节，包括：当所述音频信号中的当前振幅值小于第一预设振幅阈值时，将所述当前振幅值调节至对应的第一目标振幅，其中，所述第一目标振幅大于或等于所述第一预设振幅阈值；所述当所述声音响度分析结果中包括当前声音响度大于第二预设响度阈值时，对所述当前声音响度进行降低调节，包括：当所述音频信号中的当前振幅值大于第二预设振幅阈值时，将所述当前振幅值调节至对应的第二目标振幅，其中，所述第二目标振幅小于或等于所述第二预设振幅阈值。

可选的，所述将所述当前振幅值调节至对应的第一目标振幅，包括：根据所述当前振幅值和第一预设对应关系确定相应的第一目标振幅；根据所述第一目标振幅和所述当前振幅值确定对应的第一增益调节参数值；利用所述第一增益调节参数值对所述音频信号中对应所述当前振幅值的位置进行信号增益调节；所述将所述当前声音响度调节至对应的第二目标响度，包括：根据所述当前振幅值和第二预设对应关系确定相应的第二目标振幅；根据所述当前振幅值和所述第二目标振幅确定对应的第二增益调节参数值；利用所述第二增益调节参数值对所述音频信号中对应所述第二振幅值的位置进行信号增益调节。

可选的，在所述根据所述当前振幅值和第一预设对应关系确定相应的第一目标振幅之前，还包括：根据第一预设参考因素从多个候选第一预设对应关系中挑选出第一预设对应关系；在所述根据所述当前振幅值和第二预设对应关系确定相应的第二目标振幅之前，还包括：根据第二预设参考因素从多个候选第二预设对应关系中挑选出第二预设对应关系。

可选的，当所述预设事件为预设通话事件时，所述根据第一预设参考因素从多个候选第一预设对应关系中挑选出第一预设对应关系，包括：获取通话对端联系人的属性信息和/或通话对端的情景模式信息；根据所述属性信息和/或情景模式信息从多个候选第一预设对应关系中挑选出第一预设对应关系；所述根据第二预设参考因素从多个候选第二预设对应关系中挑选出第二预设对应关系，包括：获取通话对端联系人的属性信息和/或通话对端的情景模式信息；根据所述属性信息和/或情景模式信息从多个候选第二预设对应关系中挑选出第二预设对应关系。

可选的，当所述声音响度分析结果中包括当前声音响度小于第一预设响度阈值时，对所述当前声音响度进行升高调节，包括：获取通话对端联系人的属性信息和/或通话对端的情景模式信息；根据所述属性信息和/或情景模式信息确定对应的第一预设响度阈值，当所述声音响度分析结果中包括当前声音响度小于第一预设响度阈值时，对所述当前声音响度进行升高调节。

可选的，当所述音频信号中的当前振幅值小于第一预设振幅阈值时，将所述当前振幅值调节至对应的第一目标振幅，包括：获取通话对端联系人的属性信息和/或通话对端的情景模式信息；根据所述属性信息和/或情景模式信息确定对应的第一预设振幅阈值，当所述音频信号中的当前振幅值小于第一预设振幅阈值时，将所述当前振幅值调节至对应的第一目标振幅。

可选的，获取通话对端的情景模式信息具体可包括：向通话对端发送情景模式信息获取请求，接收通话对端根据所述情景模式信息获取请求反馈的情景模式信息。

图1为本发明实施例提供的一种音频信号调节方法的流程示意图，该方法可以由音频信号调节装置执行，其中该装置可由软件和/或硬件实现，一般可集成在终端中。如图1所示，该方法包括：

步骤101、检测到预设事件被触发时，控制麦克风采集音频信号。

其中，所述预设事件包括预设通话事件和/或预设录音事件。

示例性的，本发明实施例中的终端可包括手机、平板电脑、音乐播放器以及录音笔等配置有麦克风的设备。麦克风可以是内置的，也可以是外置的。麦克风(简称mic，又称传声器或话筒)是一种将声音信号转换为电信号的能量转换器件，当声音的振动传到麦克风的振动膜上后，会导致里面的磁铁形成变化的电流信号，由声音处理电路对电流信号进行处理后传输到通话对端或进行存储，进而实现通话或录音。本发明实施例对麦克风的具体类型、数量及所在位置不做限定，例如，对于手机来说，可以是设置在手机下侧面的一个或多个驻极体式麦克风。

示例性的，预设通话事件可以是具备本发明实施例中的音频信号调节功能的通话事件；预设录音事件可以是具备本发明实施例中的音频信号调节功能的录音事件。可选的，在音频信号调节功能处于开启状态下检测到通话事件或录音事件时，可确定检测到预设通话事件或预设录音事件。通话事件例如是电话接通或是语音聊天接通等；录音事件例如是启动录音。当所述预设事件同时包括预设通话事件和预设录音事件时，可理解为开启了通话录音功能，即在与对端进行通话的过程中对通话内容进行录音。

为了便于理解本发明实施例，下面以智能手机为例对音频处理硬件系统及系统架构进行简单的介绍。

图2为本发明实施例提供的一种智能手机的音频处理硬件系统结构示意图。音频处理电路一般处于主控电路板中，由于不同手机的设计不同，音频处理电路的具体位置也可能不同。智能手机的音频处理电路主要包括音频信号处理电路、基带信号处理电路、音频功率放大器、耳机信号放大器、听筒、扬声器、麦克风及耳机接口等。其中，音频信号处理电路是整个音频处理电路的核心。音频处理电路主要由接收音频电路、送话电路、耳机通话电路等组成，包括模拟音频的模拟/数字(A/D)转换、数字/模拟(A/D)转换、数字语音信号处理及模拟音频放大电路等。

在通话时，首先通话本地端麦克风把声音的机械声波信号转化为模拟音频信号，通过模拟音频放大电路进行放大，经内部的多模转换器进行A/D转换，得到数字音频信号；其次把此数字音频信号送到基带处理器，进行语音编码、信道编码等处理；再次进行加密、交织等一系列处理；最后送到基带处理器中的数字窄带制调模块进行调制，产生发射基带信号送入射频电路调制成发射中频，发送给通话对方。

在录音时，与上述过程类似，首先由麦克风把声音的机械声波信号转化为模拟音频信号，通过模拟音频放大电路进行放大，经过A/D转换后得到数字音频信号，按照预设的音频格式进行编码及存储。

本发明实施例中麦克风采集的音频信号可以是上述的由机械声波信号转换而来的模拟音频信号，也可以是经过放大后的模拟音频信号，还可以是经过A/D转换后的数字音频信号等，本发明实施例不作限定。

如图3所示，本实施例提供的音频系统架构主要包括用户空间、内核空间和硬件系统。用户空间包括应用(Application)层、应用框架(Framework)层和硬件抽象层(HardwareAbstraction Layer，HAL)，内核空间包括驱动(Driver)层，。应用层是音频体系的最上层，可通过编写一个应用程序来执行对应的逻辑操作，例如检测触发录音事件的应用程序，预先设置标准音频条件，下发音频播放指令等。应用框架层包括音频控制接口和标准化插件模块负责提供音频播放形式控制接口，以及扬声器音量大小控制接口等。应用框架层提供了AudioTrack和AudioRecorder两个类，以及AudioManager、AudioService及AudioSystem类。在应用框架层和硬件抽象层之间还包括一个系统运行库(Libraries)层。我们知道，framework层的很多类，实际上只是应用程序使用Android库文件的“中介”而已。因为上层应用一般采用java语言编写，它们需要最直接的java接口的支持，这就是framework层存在的意义之一。而作为“中介”，它们并不会真正去实现具体的功能，或者只实现其中的一部分功能，而把主要重心放在库中来完成。比如上面的AudioTrack、AudioRecorder、MediaPlayer和MediaRecorder等等在库中都能找到相对应的类。这一部分代码集中放置在工程的frameworks/av/media/libmedia中，多数是C++语言编写的。音频方面的硬件抽象层主要分为两部分，即AudioFlinger和AudioPolicyService。实际上后者并不是一个真实的设备，只是采用虚拟设备的方式来让厂商可以方便地定制出自己的策略。根据产品的不同，音频设备存在很大差异，在Android的音频架构中，这些问题都是由HAL层的audio.primary等来解决的，而不需要大规模地修改上层实现。硬件抽象层是应用框架层到驱动层的过渡，以实现底层硬件的兼容。驱动层按照音频编解码器的特性对其进行控制，确保音频编解码器可以正常工作，将音频编解码器获取到的音频数据提供给系统层。本发明实施例中在进行音频信号采集时，主要涉及的类为上述的AudioRecorder类。

步骤102、对所述音频信号对应的声音响度进行分析。

声音的三个主要属性为音量、音调和音色。其中，音量又称响度或音强，是指人耳对所听到的声音大小强弱的主观感受，其客观评价尺度是声音的振幅大小。振幅指物体震动过程中偏离原来位置的最大距离，人耳听到的声音的响度与音源的振幅相关，一般振幅越大响度越强。

示例性的，用户在通话时虽然能够听到自己说话的声音大小，但是无法知道当前说话的音量对于通话对端的人来说声音是大还是小，若声音较小，对方可能听不清，若声音较大，可能让对方感到震耳；用户在录音时也能够听到自己说话的声音大小，但是无法知道终端记录的自己的声音的大小，若声音较小，播放录音时可能听不清，若声音较大，播放录音时可能让收听者感到不适。此外，还有很多原因可能导致麦克风采集的声音受到说话人本身或者通话状态及录音状态的影响。例如不同人说话习惯不同，有人说话声音比较轻柔，而有人说话声音比较洪亮；又如，说话过程中用户难以保持声源(如用户的嘴巴)与麦克风之间的距离不变，如用户处于运动状态或处于颠簸的车辆中等等，都可能导致麦克风采集的声音时大时小。上述这些情况都会对通话对方或者收听录音的人产生不好的影响。本发明实施例中，对音频信号对应的声音响度进行分析，以实时获知终端采集的音频信号对应的声音响度是否合适。

示例性的，可以预设时段为分析单位，分析每个预设时段内的声音响度的大小，可将当前预设时段对应的声音响度记为当前声音响度。预设时段可以是以当前时刻为起点向前计时的预设时间长度。为了保证实时性，可以将预设时段对应的预设时间长度设置的短一些，例如是以当前时刻为起点向前计时的0.5秒内。

步骤103、根据分析结果以及预设调节策略对所述音频信号对应的声音响度进行动态调节。

示例性的预设调节策略可以是根据预先设定好的声音响度变化规律来确定。例如，当预先设定好的声音响度变化规律为声音响度变化均匀，那么当声音响度较大时，可对音频信号对应的声音响度进行降低调节，如可减小对模拟音频信号进行放大的放大倍数，即降低增益值；当声音响度较小时，可对音频信号对应的声音响度进行升高调节，如可增大对模拟音频信号进行放大的放大倍数，即提高增益值。

步骤104、根据所述预设事件的类型对调节后的音频信号进行相应的输出处理。

示例性的，当所述预设事件包括预设通话事件时，将调节后的音频信号发送至通话对端，可选的，在发送之前还可进行如上述的语音编码及信道编码等处理，本发明实施例不做限定。当所述预设事件包括预设录音事件时，将调节后的音频信号作为录音信号进行存储，可选的，在发送之前还可进行如上述的按照预设的音频格式进行编码等处理，本发明实施例不做限定。当所述预设事件同时包括预设通话事件和预设录音事件时，即开启了通话录音功能，则将调节后的音频信号发送至通话对端的同时将调节后的音频信号作为录音信号进行存储。

本发明实施例提供的音频信号调节方法，在通话或录音过程中，可对麦克风采集的音频信号对应的声音响度进行分析，并根据分析结果进行动态调节后再进行相应的输出处理，无需通话对端自行调节音量或者无需在播放录音时由收听者反复调节音量，可保持音频信号以预先设定好的音量变化规律被输出。

在一些实施例中，所述对所述音频信号对应的声音响度进行分析，可包括：对所述音频信号的振幅信息进行分析，以得到声音响度分析结果。如前所述，声音响度的客观评价尺度是声音的振幅大小，而音频信号由声音的机械声波信号转换而来，因此可采用振幅信息对音频信号的声音响度进行分析。振幅越大，声音响度越大，也即声音能量值越高。示例性的，可以预设时段为分析单位，在预设时段内以预设采样频率对音频信号的振幅进行采集，获取多个振幅值(绝对值)，将预设时段内的振幅平均值作为当前声音响度。此处优化将对声音响度的分析转化为对振幅信息的分析，可简化分析过程，提高分析速度。

在一些实施例中，对所述音频信号的振幅信息进行分析，以得到声音响度分析结果，可进一步包括：提取所述音频信号中对应人声的振幅信息；对所述对应人声的振幅信息进行分析，以得到声音响度分析结果。示例性的，在通话过程中，人声是音频信号中的主体，其他环境声音可视为是干扰声音；此外，在录音时，用户可以选择人声录音模式，这时，人声也是音频信号中的主体，其他环境声音可视为是干扰声音。在这些情况下，在提取音频信号中对应人声的振幅信息后，可大幅减少需要分析的数据，进而提高分析速度，也能够更及时地对音频信号进行调节，有助于进一步提高针对通话状态或录音状态的调整时效性。

在一些实施例中，根据分析结果以及预设调节策略对所述音频信号对应的声音响度进行动态调节，可包括：当所述声音响度分析结果中包括当前声音响度小于第一预设响度阈值时，对所述当前声音响度进行升高调节；也可包括：当所述声音响度分析结果中包括当前声音响度大于第二预设响度阈值时，对所述当前声音响度进行降低调节。当然，也可同时包括上述两种方式。第一预设响度阈值和第二预设响度阈值可以相同，也可以不同，具体数值可以是预先设置的固定值，也可以是根据实际情况进行动态调整的变化值。

示例性的，在当前声音响度小于第一预设响度阈值时，可说明音频信号中当前声音响度较小，通话对端可能无法听清本端用户说的话，或者录音文件在后续播放时可能导致他人听不清此时录取的声音，因此，对所述当前声音响度进行升高调节，以使输出的音频信号中的声音响度有所提高。示例性的，在当前声音响度大于或等于第一预设响度阈值时，可不进行调节。这样设置的好处在于，可适用于对声音响度上限没有要求的应用场景，保证调节效率。

示例性的，在当前声音响度大于第二预设响度阈值时，可说明音频信号中当前声音响度较大，传到通话对端可能会使对方感到震耳，或者录音文件在后续播放时可能导致声音过大影响收听，因此，对所述当前声音响度进行降低调节，以使输出的音频信号中的声音响度有所降低。示例性的，在当前声音响度小于或等于第二预设响度阈值时，可不进行调节。这样设置的好处在于，可适用于对声音响度下限没有要求的应用场景，保证调节效率。

示例性的，可将上述两种调节方式进行结合，即当前声音响度较小时和较大时均会进行调节，而当前声音响度大于或等于第一预设响度阈值且小于或等于第二预设响度阈值时，说明此时音频信号中的声音响度比较合适，可不进行调节。这样设置的好处在于，可适用于对声音响度上限和下限均有要求的应用场景，保证调节效果。

在一些实施例中，所述当所述声音响度分析结果中包括当前声音响度小于第一预设响度阈值时，对所述当前声音响度进行升高调节，包括：当所述音频信号中的当前振幅值小于第一预设振幅阈值时，将所述当前振幅值调节至对应的第一目标振幅，其中，所述第一目标振幅大于或等于所述第一预设振幅阈值。第一预设振幅阈值可以是一个固定值，也可以是根据实际情况确定的动态的变化值。这样设置的好处在于，通过调节振幅值即可实现声音响度的调节，调节速度快，效率高，能够进一步保证音频信号输出的实时性。

在一些实施例中，所述当所述声音响度分析结果中包括当前声音响度大于第二预设响度阈值时，对所述当前声音响度进行降低调节，包括：当所述音频信号中的当前振幅值大于第二预设振幅阈值时，将所述当前振幅值调节至对应的第二目标振幅，其中，所述第二目标振幅小于或等于所述第二预设振幅阈值。这样设置的好处在于，通过调节振幅值即可实现声音响度的调节，调节速度快，效率高，能够进一步保证音频信号输出的实时性。

在一些实施例中，将所述当前振幅值调节至对应的第一目标振幅，可包括：根据所述当前振幅值和第一预设对应关系确定相应的第一目标振幅；根据所述第一目标振幅和所述当前振幅值确定对应的第一增益调节参数值；利用所述第一增益调节参数值对所述音频信号中对应所述当前振幅值的位置进行信号增益调节。这样设置的好处在于，可在第一预设对应关系中预先设定好不同的振幅值所对应的第一目标振幅，能够快速确定当前振幅值对应的第一目标振幅，从而提高调节效率。第一预设对应关系例如可以映射表的形式存在，可通过实验或仿真等方式来确定。在确定好当前振幅值对应的第一目标振幅后，可根据第一目标振幅与当前振幅值的商来确定对应的第一增益调节系数，然后再根据第一增益调节系数对当前振幅值的位置进行信号增益调节。例如，假设第一增益调节系数为K1(大于1)，原增益值为G，那么当前增益值可以是K1*G，若其他位置振幅值不需要调整，那么通过模拟音频放大电路对其他位置振幅值进行放大时增益值为G，而对当前振幅值进行放大时增益值调整为K1*G，使得当前振幅值对应位置的声音响度提高。

同理，所述将所述当前声音响度调节至对应的第二目标响度，可包括：根据所述当前振幅值和第二预设对应关系确定相应的第二目标振幅；根据所述当前振幅值和所述第二目标振幅确定对应的第二增益调节参数值；利用所述第二增益调节参数值对所述音频信号中对应所述第二振幅值的位置进行信号增益调节。这样设置的好处在于，可在第二预设对应关系中预先设定好不同的振幅值所对应的第二目标振幅，能够快速确定当前振幅值对应的第二目标振幅，从而提高调节效率。第二预设对应关系例如可以映射表的形式存在，可通过实验或仿真等方式来确定。在确定好当前振幅值对应的第二目标振幅后，可根据第二目标振幅与当前振幅值的商来确定对应的第二增益调节系数，然后再根据第二增益调节系数对当前振幅值的位置进行信号增益调节。例如，假设第二增益调节系数为K2(小于1)，原增益值为G，那么当前增益值可以是K2*G，若其他位置振幅值不需要调整，那么通过模拟音频放大电路对其他位置振幅值进行放大时增益值为G，而对当前振幅值进行放大时增益值调整为K2*G，使得当前振幅值对应位置的声音响度降低。

在一些实施例中，在所述根据所述当前振幅值和第一预设对应关系确定相应的第一目标振幅之前，还包括：根据第一预设参考因素从多个候选第一预设对应关系中挑选出第一预设对应关系。这样设置的好处在于，可预先设置多个第一预设对应关系，根据当前通话或录音的实际情况来动态的选取第一预设对应关系，使对声音响度的调节更具有针对性。示例性的，当预设事件为预设通话事件时，可根据通话对端对声音响度的实际需求来选择所需的第一预设对应关系；当预设事件为预设录音事件时，可根据实际的录音需求或录音环境选择所需的第一预设对应关系，如录音距离、环境噪声的类型或强度以及录音模式等等。同理，在所述根据所述当前振幅值和第二预设对应关系确定相应的第二目标振幅之前，还可包括：根据第二预设参考因素从多个候选第二预设对应关系中挑选出第二预设对应关系。这样设置的好处在于，可预先设置多个第二预设对应关系，根据当前通话或录音的实际情况来动态的选取第二预设对应关系，使对声音响度的调节更具有针对性。

在一些实施例中，当所述预设事件为预设通话事件时，所述根据第一预设参考因素从多个候选第一预设对应关系中挑选出第一预设对应关系，包括：获取通话对端联系人的属性信息和/或通话对端的情景模式信息；根据所述属性信息和/或情景模式信息从多个候选第一预设对应关系中挑选出第一预设对应关系。这样设置的好处在于，能够根据通话对端的实际情况更加准确地确定第一预设对应关系，进一步提升通话效果。

示例性的，属性信息可以包括年龄(或年龄段)，或者包括是否为老人或是否为孩子等。可选的，获取通话对端联系人的属性信息可包括：获取通话对端联系人在通讯录中的备注信息，从所述备注信息中提取属性信息；也可包括对通话对端联系人的声音进行语音识别，根据识别结果确定相应的属性信息。当对方为老人时，可能听力较差，所需的声音响度应大一些，因此可挑选第一目标振幅被设置得较高的第一预设对应关系。

示例性的，通话对端的情景模式信息可包括静音模式、会议模式、正常模式和户外模式等等模式信息。用户通常会根据自己所处环境设置对应的情景模式，例如在上课或者开会等相对比较安静的环境中，可能会选择静音模式或会议模式，在外面比较吵的环境中可能会选择户外模式，在这些环境中接听电话时，可能对声音响度有不同的需求。例如，会议模式时，由于环境比较安静，声音响度不必很大即可听清对方声音；而户外模式时，由于环境比较吵闹，需要比较大的声音响度才能听清对方声音。基于以上原因，可预先设定好不同的情景模式与不同的第一预设对应关系的映射关系，在实际的通话过程中，能够根据获取到的情景模式信息来确定相应的第一预设对应关系。可选的，获取通话对端的情景模式信息具体可包括：向通话对端发送情景模式信息获取请求，接收通话对端根据所述情景模式信息获取请求反馈的情景模式信息。

同理，所述根据第二预设参考因素从多个候选第二预设对应关系中挑选出第二预设对应关系，可包括：获取通话对端联系人的属性信息和/或通话对端的情景模式信息；根据所述属性信息和/或情景模式信息从多个候选第二预设对应关系中挑选出第二预设对应关系。此处优化的有益效果与前述的针对多个第一预设对应关系的优化类似，此处不再赘述。

在一些实施例中，第一预设响度阈值和/或第二预设响度阈值，还有第一预设振幅阈值和/或第二预设振幅阈值，也可以根据所述属性信息和/或情景模式信息来确定。例如，当所述声音响度分析结果中包括当前声音响度小于第一预设响度阈值时，对所述当前声音响度进行升高调节，包括：获取通话对端联系人的属性信息和/或通话对端的情景模式信息；根据所述属性信息和/或情景模式信息确定对应的第一预设响度阈值，当所述声音响度分析结果中包括当前声音响度小于第一预设响度阈值时，对所述当前声音响度进行升高调节。这样设置的好处在于，可根据通话对端的属性信息或情景模式信息来确定是否需要进行音频信号调节的判定条件，使音频信号调节更加准确、有针对性。又如，当所述音频信号中的当前振幅值小于第一预设振幅阈值时，将所述当前振幅值调节至对应的第一目标振幅，包括：获取通话对端联系人的属性信息和/或通话对端的情景模式信息；根据所述属性信息和/或情景模式信息确定对应的第一预设振幅阈值，当所述音频信号中的当前振幅值小于第一预设振幅阈值时，将所述当前振幅值调节至对应的第一目标振幅。

图4为本发明实施例提供的又一种音频信号调节方法的流程示意图，该方法适用于录音场景，具体包括：

步骤401、检测到预设录音事件被触发时，控制麦克风采集音频信号。

步骤402、实时对所采集的音频信号的振幅信息进行分析，以得到声音响度分析结果。

步骤403、判断当前声音响度是否小于预设响度阈值A，若是，则执行步骤404；否则，执行步骤405。

可以理解的是，随着录音的进行，终端会实时地对麦克风采集的音频信号的振幅信息进行分析，而当前声音响度也是随着分析的进行而不断发生变化的。

步骤404、对所述当前声音响度进行升高调节，并将调节后的音频信号作为录音信号进行存储。

步骤405、判断当前声音响度大于预设响度阈值B，若是，则执行步骤406；否则，执行步骤407。

步骤406、对所述当前声音响度进行降低调节，并将调节后的音频信号作为录音信号进行存储。

步骤407、判断是否接收到录音暂停或录音停止指令，若是，则结束流程；否则，返回执行步骤403。

本发明实施例提供的音频信号调节方法，能够在录音过程中动态地调整所采集的音频信号对应的声音响度，当声音响度过小时自动提高声音响度，当声音响度过大时自动降低声音响度，可以自动保持良好的录音效果，在收听录音时无需用户手动调节，对于所录取的声音时大时小的情况本发明实施例的有益效果尤为明显。

图5为本发明实施例提供的又一种音频信号调节方法的流程示意图，该方法适用于通话场景，具体包括：

步骤501、检测到预设通话事件被触发时，控制麦克风采集音频信号。

步骤502、实时对所采集的音频信号的振幅信息进行分析，以得到声音响度分析结果。

步骤503、判断当前声音响度是否小于预设响度阈值C，若是，则执行步骤504；否则，执行步骤505。

可以理解的是，随着通话的进行，终端会实时地对麦克风采集的音频信号的振幅信息进行分析，而当前声音响度也是随着分析的进行而不断发生变化的。

步骤504、对所述当前声音响度进行升高调节，并将调节后的音频信号发送至通话对端。

步骤505、判断当前声音响度大于预设响度阈值D，若是，则执行步骤506；否则，执行步骤507。

步骤506、对所述当前声音响度进行降低调节，并将调节后的音频信号发送至通话对端。

步骤507、判断是否接收到通话结束指令，若是，则结束流程；否则，返回执行步骤503。

本发明实施例提供的音频信号调节方法，能够在通话过程中动态地调整所采集的音频信号对应的声音响度，当声音响度过小时自动提高声音响度，当声音响度过大时自动降低声音响度，可以自动保持良好的通话效果，无需通话对端的用户手动调节，对于本端用户说话声音时大时小的情况本发明实施例的有益效果尤为明显。

图6为本发明实施例提供的又一种音频信号调节方法的流程示意图，该方法适用于通话场景，具体包括：

步骤601、检测到预设通话事件被触发时，控制麦克风采集音频信号。

步骤602、实时提取所述音频信号中对应人声的振幅信息，对所述对应人声的振幅信息进行分析，以得到声音响度分析结果。

步骤603、获取通话对端的情景模式信息，并根据情景模式信息确定相应的预设振幅阈值E、预设振幅阈值F、第一预设对应关系以及第二预设对应关系。

步骤604、判断当前振幅值是否小于预设振幅阈值E，若是，则执行步骤604；否则，执行步骤607。

步骤605、根据当前振幅值和第一预设对应关系确定相应的第一目标振幅，根据第一目标振幅和当前振幅值确定对应的第一增益调节参数值。

步骤606、利用第一增益调节参数值对音频信号中对应当前振幅值的位置进行信号增益调节，并将调节后的音频信号发送至通话对端，执行步骤610。

步骤607、判断当前振幅值是否大于预设振幅阈值F，若是，则执行步骤608；否则，执行步骤610。

步骤608、根据当前振幅值和第二预设对应关系确定相应的第二目标振幅，根据第二目标振幅和当前振幅值确定对应的第二增益调节参数值。

步骤609、利用第二增益调节参数值对音频信号中对应当前振幅值的位置进行信号增益调节，并将调节后的音频信号发送至通话对端。

步骤610、判断是否接收到通话结束指令，若是，则结束流程；否则，返回执行步骤604。

本发明实施例提供的音频信号调节方法，能够在通话过程中根据通话对方的情景模式信息更加准确地调节音频信号对应的声音响度，可以更有针对性的提升通话效果。

图7为本发明实施例提供的一种音频信号调节装置的结构框图，该装置可由软件和/或硬件实现，一般集成在终端中，可通过执行音频信号调节方法来对音频信号进行调节。如图7所示，该装置包括：

音频信号采集模块701，用于在检测到预设事件被触发时，控制麦克风采集音频信号，所述预设事件包括预设通话事件和/或预设录音事件；

响度分析模块702，用于对所述音频信号对应的声音响度进行分析；

响度调节模块703，用于根据分析结果以及预设调节策略对所述音频信号对应的声音响度进行动态调节；

信号输出模块704，用于根据所述预设事件的类型对调节后的音频信号进行相应的输出处理。

本发明实施例提供的音频信号调节装置，在通话或录音过程中，可对麦克风采集的音频信号对应的声音响度进行分析，并根据分析结果进行动态调节后再进行相应的输出处理，无需通话对端自行调节音量或者无需在播放录音时由收听者反复调节音量，可保持音频信号以预先设定好的音量变化规律被输出。

可选的，所述信号输出模块用于：

当所述预设事件包括预设通话事件时，将调节后的音频信号发送至通话对端；

当所述预设事件包括预设录音事件时，将调节后的音频信号作为录音信号进行存储。

可选的，所述对响度分析模块用于：

对所述音频信号的振幅信息进行分析，以得到声音响度分析结果。

可选的，所述对响度分析模块用于：

提取所述音频信号中对应人声的振幅信息；

对所述对应人声的振幅信息进行分析，以得到声音响度分析结果。

可选的，所述响度调节模块用于：

当所述声音响度分析结果中包括当前声音响度小于第一预设响度阈值时，对所述当前声音响度进行升高调节；和/或，

当所述声音响度分析结果中包括当前声音响度大于第二预设响度阈值时，对所述当前声音响度进行降低调节。

可选的，所述当所述声音响度分析结果中包括当前声音响度小于第一预设响度阈值时，对所述当前声音响度进行升高调节，包括：

当所述音频信号中的当前振幅值小于第一预设振幅阈值时，将所述当前振幅值调节至对应的第一目标振幅，其中，所述第一目标振幅大于或等于所述第一预设振幅阈值；

所述当所述声音响度分析结果中包括当前声音响度大于第二预设响度阈值时，对所述当前声音响度进行降低调节，包括：

当所述音频信号中的当前振幅值大于第二预设振幅阈值时，将所述当前振幅值调节至对应的第二目标振幅，其中，所述第二目标振幅小于或等于所述第二预设振幅阈值。

可选的，所述将所述当前振幅值调节至对应的第一目标振幅，包括：

根据所述当前振幅值和第一预设对应关系确定相应的第一目标振幅；

根据所述第一目标振幅和所述当前振幅值确定对应的第一增益调节参数值；

利用所述第一增益调节参数值对所述音频信号中对应所述当前振幅值的位置进行信号增益调节；

所述将所述当前声音响度调节至对应的第二目标响度，包括：

根据所述当前振幅值和第二预设对应关系确定相应的第二目标振幅；

根据所述当前振幅值和所述第二目标振幅确定对应的第二增益调节参数值；

利用所述第二增益调节参数值对所述音频信号中对应所述第二振幅值的位置进行信号增益调节。

可选的，所述响度调节模块还用于：

在所述根据所述当前振幅值和第一预设对应关系确定相应的第一目标振幅之前，根据第一预设参考因素从多个候选第一预设对应关系中挑选出第一预设对应关系；和/或，

在所述根据所述当前振幅值和第二预设对应关系确定相应的第二目标振幅之前，根据第二预设参考因素从多个候选第二预设对应关系中挑选出第二预设对应关系。

可选的，当所述预设事件为预设通话事件时，

所述根据第一预设参考因素从多个候选第一预设对应关系中挑选出第一预设对应关系，包括：

获取通话对端联系人的属性信息和/或通话对端的情景模式信息；

根据所述属性信息和/或情景模式信息从多个候选第一预设对应关系中挑选出第一预设对应关系；

所述根据第二预设参考因素从多个候选第二预设对应关系中挑选出第二预设对应关系，包括：

根据所述属性信息和/或情景模式信息从多个候选第二预设对应关系中挑选出第二预设对应关系。

本发明实施例还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种音频信号调节方法，该方法包括：

对所述音频信号对应的声音响度进行分析；

存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括：安装介质，例如CD-ROM、软盘或磁带装置；计算机系统存储器或随机存取存储器，诸如DRAM、DDR RAM、SRAM、EDO RAM，兰巴斯(Rambus)RAM等；非易失性存储器，诸如闪存、磁介质(例如硬盘或光存储)；寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外，存储介质可以位于程序在其中被执行的第一计算机系统中，或者可以位于不同的第二计算机系统中，第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。

当然，本发明实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的音频信号调节操作，还可以执行本发明任意实施例所提供的音频信号调节方法中的相关操作。

本发明实施例提供了一种终端，该终端中可集成本发明实施例提供的音频信号调节装置。图8为本发明实施例提供的一种终端的结构示意图。该终端例如可以是移动终端，如图8所示，该终端可以包括：壳体(图中未示出)、存储器801、中央处理器(CentralProcessing Unit，CPU)802(又称处理器，以下简称CPU)、电路板(图中未示出)、电源电路(图中未示出)和麦克风813。所述电路板安置在所述壳体围成的空间内部；所述CPU802和所述存储器801设置在所述电路板上；所述电源电路，用于为所述终端的各个电路或器件供电；所述存储器801，用于存储可执行程序代码；所述CPU802通过读取所述存储器801中存储的可执行程序代码来运行与所述可执行程序代码对应的计算机程序，以实现以下步骤：

对所述音频信号对应的声音响度进行分析；

所述终端还包括：外设接口803、RF(Radio Frequency，射频)电路805、音频电路806、扬声器811、电源管理芯片808、输入/输出(I/O)子系统其他输入/控制设备、触摸屏812、其他输入/控制设备810以及外部端口804，这些部件通过一个或多个通信总线或信号线807来通信。

应该理解的是，图示终端800仅仅是终端的一个范例，并且终端800可以具有比图中所示出的更多的或者更少的部件，可以组合两个或更多的部件，或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。

下面就本实施例提供的用于调节音频信号的终端进行详细的描述，该终端以手机为例。

存储器801，所述存储器801可以被CPU802、外设接口803等访问，所述存储器801可以包括高速随机存取存储器，还可以包括非易失性存储器，例如一个或多个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

外设接口803，所述外设接口803可以将设备的输入和输出外设连接到CPU802和存储器801。

I/O子系统809，所述I/O子系统809可以将设备上的输入输出外设，例如触摸屏812和其他输入/控制设备810，连接到外设接口803。I/O子系统809可以包括显示控制器8091和用于控制其他输入/控制设备810的一个或多个输入控制器8092。其中，一个或多个输入控制器8092从其他输入/控制设备810接收电信号或者向其他输入/控制设备810发送电信号，其他输入/控制设备810可以包括物理按钮(按压按钮、摇臂按钮等)、拨号盘、滑动开关、操纵杆、点击滚轮。值得说明的是，输入控制器8092可以与以下任一个连接：键盘、红外端口、USB接口以及诸如鼠标的指示设备。

触摸屏812，所述触摸屏812是用户终端与用户之间的输入接口和输出接口，将可视输出显示给用户，可视输出可以包括图形、文本、图标、视频等。

I/O子系统809中的显示控制器8091从触摸屏812接收电信号或者向触摸屏812发送电信号。触摸屏812检测触摸屏上的接触，显示控制器8091将检测到的接触转换为与显示在触摸屏812上的用户界面对象的交互，即实现人机交互，显示在触摸屏812上的用户界面对象可以是运行游戏的图标、联网到相应网络的图标等。值得说明的是，设备还可以包括光鼠，光鼠是不显示可视输出的触摸敏感表面，或者是由触摸屏形成的触摸敏感表面的延伸。

RF电路805，主要用于建立手机与无线网络(即网络侧)的通信，实现手机与无线网络的数据接收和发送。例如收发短信息、电子邮件等。具体地，RF电路805接收并发送RF信号，RF信号也称为电磁信号，RF电路805将电信号转换为电磁信号或将电磁信号转换为电信号，并且通过该电磁信号与通信网络以及其他设备进行通信。RF电路805可以包括用于执行这些功能的已知电路，其包括但不限于天线系统、RF收发机、一个或多个放大器、调谐器、一个或多个振荡器、数字信号处理器、CODEC(COder-DECoder，编译码器)芯片组、用户标识模块(Subscriber Identity Module，SIM)等等。

音频电路806，主要用于从外设接口803接收音频数据，将该音频数据转换为电信号，并且将该电信号发送给扬声器811。

扬声器811，用于将手机通过RF电路805从无线网络接收的语音信号，还原为声音并向用户播放该声音。

电源管理芯片808，用于为CPU802、I/O子系统及外设接口所连接的硬件进行供电及电源管理。

本发明实施例提供的终端，在通话或录音过程中，可对麦克风采集的音频信号对应的声音响度进行分析，并根据分析结果进行动态调节后再进行相应的输出处理，无需通话对端自行调节音量或者无需在播放录音时由收听者反复调节音量，可保持音频信号以预先设定好的音量变化规律被输出。

上述实施例中提供的音频信号调节装置、存储介质及终端可执行本发明任意实施例所提供的音频信号调节方法，具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本发明任意实施例所提供的音频信号调节方法。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种音频信号调节方法，其特征在于，包括：

对所述音频信号的振幅信息进行分析；

当所述音频信号中的当前振幅值小于第一预设振幅阈值时，根据所述当前振幅值和第一预设对应关系确定相应的第一目标振幅，根据所述第一目标振幅和所述当前振幅值确定对应的第一增益调节参数值，利用所述第一增益调节参数值对所述音频信号中对应所述当前振幅值的位置进行信号增益调节，其中，所述第一目标振幅大于或等于所述第一预设振幅阈值；

当所述音频信号中的当前振幅值大于第二预设振幅阈值时，根据所述当前振幅值和第二预设对应关系确定相应的第二目标振幅，根据所述当前振幅值和所述第二目标振幅确定对应的第二增益调节参数值，利用所述第二增益调节参数值对所述音频信号中对应所述当前振幅值的位置进行信号增益调节，其中，所述第二目标振幅小于或等于所述第二预设振幅阈值；

当所述预设事件包括预设通话事件时，将调节后的音频信号发送至通话对端；当所述预设事件包括预设录音事件时，将调节后的音频信号作为录音信号进行存储。

2.根据权利要求1所述的方法，其特征在于，对所述音频信号的振幅信息进行分析，以得到声音响度分析结果，包括：

提取所述音频信号中对应人声的振幅信息；

3.根据权利要求1所述的方法，其特征在于，

在所述根据所述当前振幅值和第一预设对应关系确定相应的第一目标振幅之前，还包括：

根据第一预设参考因素从多个候选第一预设对应关系中挑选出第一预设对应关系；

在所述根据所述当前振幅值和第二预设对应关系确定相应的第二目标振幅之前，还包括：

根据第二预设参考因素从多个候选第二预设对应关系中挑选出第二预设对应关系。

4.根据权利要求3所述的方法，其特征在于，当所述预设事件为预设通话事件时，

5.一种音频信号调节装置，其特征在于，包括：

响度分析模块，用于对所述音频信号的振幅信息进行分析；

响度调节模块，用于当所述音频信号中的当前振幅值小于第一预设振幅阈值时，根据所述当前振幅值和第一预设对应关系确定相应的第一目标振幅，根据所述第一目标振幅和所述当前振幅值确定对应的第一增益调节参数值，利用所述第一增益调节参数值对所述音频信号中对应所述当前振幅值的位置进行信号增益调节，其中，所述第一目标振幅大于或等于所述第一预设振幅阈值；当所述音频信号中的当前振幅值大于第二预设振幅阈值时，根据所述当前振幅值和第二预设对应关系确定相应的第二目标振幅，根据所述当前振幅值和所述第二目标振幅确定对应的第二增益调节参数值，利用所述第二增益调节参数值对所述音频信号中对应所述当前振幅值的位置进行信号增益调节，其中，所述第二目标振幅小于或等于所述第二预设振幅阈值；

信号输出模块，用于当所述预设事件包括预设通话事件时，将调节后的音频信号发送至通话对端；当所述预设事件包括预设录音事件时，将调节后的音频信号作为录音信号进行存储。

6.根据权利要求5所述的装置，其特征在于，所述响度分析模块用于：

提取所述音频信号中对应人声的振幅信息；

7.根据权利要求5所述的装置，其特征在于，所述响度调节模块还用于：

8.根据权利要求7所述的装置，其特征在于，当所述预设事件为预设通话事件时，

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-4中任一所述的音频信号调节方法。

10.一种终端，其特征在于，包括麦克风，存储器，处理器及存储在存储器上并可在处理器运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-4任一所述的音频信号调节方法。