WO2022111381A1

WO2022111381A1 - 音频处理方法、电子设备和可读存储介质

Info

Publication number: WO2022111381A1
Application number: PCT/CN2021/131621
Authority: WO
Inventors: 苏霞; 林宇轩; 陈翼翼; 张晓玲
Original assignee: 华为技术有限公司
Priority date: 2020-11-24
Filing date: 2021-11-19
Publication date: 2022-06-02
Also published as: CN114546325A; CN114546325B

Abstract

本申请实施例提供一种音频处理方法、电子设备和可读存储介质，该方法包括：接收用户输入的音频播放请求，根据音效的设置信息或用户历史播放音频的信息，获取音效参数，音频播放请求用于请求播放音频；采用音效参数，播放音频。本申请实施例中，终端设备可以以不同的音效播放音频，进而满足用户对音频的音效多样化的需求，提高用户体验。

Description

音频处理方法、电子设备和可读存储介质

本申请要求于2020年11月24日提交中国专利局、申请号为202011331956.1、申请名称为“音频处理方法、电子设备和可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及音频处理技术，尤其涉及一种音频处理方法、电子设备和可读存储介质。

背景技术

随着终端设备的智能化发展，用户可以将终端设备作为学习机、游戏机、音视频播放器等。当终端设备播放音频时，音频的音效为用户感受到的音频的风格。

目前终端设备可以以固定的一种音效播放音频，用户感受到的音频的音效只有该固定音效。目前这种方式不能满足用户对音频的音效多样化的需求。

发明内容

本申请实施例提供一种音频处理方法、电子设备和可读存储介质，可以采用不同的音效播放音频，提高用户体验。

第一方面，本申请实施例提供一种音频处理方法，执行该音频处理方法的执行主体可以为终端设备或终端设备中的芯片，下述以执行主体为终端设备为例进行说明。该音频处理方法中，终端设备在接收到用户输入的音频播放请求时，根据音效的设置信息或用户历史播放音频的信息，获取音效参数，所述音频播放请求用于请求播放音频。其中，一方面，用户可以在终端设备上设置音效，终端设备可以存储音效的设置信息。应理解，该音效的设置信息可以包括用户设置的音效，以及设置时刻等信息。另一方面，用户历史播放音频的信息可以包括用户历史播放的音频，或者用户历史播放音频对应的音效标签。其中，音效标签用于表征音效。

本申请实施例中，终端设备可以根据音效的设置信息或用户历史播放音频的信息，获取播放音频的音效参数，进而采用该音效参数，播放所述音频。其中，音效参数可以包括如下至少一种：动态范围控制DRC参数、均衡器EQ参数、主动降噪ANC参数。

本申请实施例中，一方面，用户可以设置不同的音效，进而终端设备可以获取不同的音效对应的音效参数。另一方面，用户历史播放音频可以对应不同的音效，那么终端设备根据该用户历史播放音频的信息，可以得到不同的音效对应的音效参数。结合上述两方面，终端设备可以采用不同的音效对应的音效参数播放音频，进而实现以不同的音效播放音频，以满足用户对音频的音效多样化的需求，提高用户体验。另外，本申请实施例中，终端设备结合用户对音效的设置，或者用户历史播放音频的信息，可以以用户偏好的音效播放音频，进一步提高用户体验。

在一种可能的实现方式中，终端设备在根据音效的设置信息或用户历史播放音频的信息，获取音效参数之前，还可以根据所述音效的设置信息，确定所述用户是否已设置音效。

在一种实现方式中，因为音效的设置信息中可以包括用户设置的音效，以及设置时刻，因此终端设备可以根据当前时刻，以及音效的设置时刻，确定用户是否已设置音效。其中，若距离当前时刻最近的设置时刻对应有音效，则确定用户已设置音效，若距离当前时刻最近的设置时刻未对应用户设置的音效，则确定用户未设置音效。

在另一种实现方式中，音效的设置信息中包括最近一次用户设置的音效，若最近一次用户设置的音效为无，则确定用户未设置音效，若最近一次用户设置的音效为任意一种预设的音效，则确定用户已设置音效。应理解，该种实现方式中，预设的音效可以为音效超重低音、清澈人声、温暖轻柔、清澈旋律。用户设置的音效可以为预设的音效中的任意一种，也可以为用户设置的音效“无”。

在另一种实现方式中，用户在设置音效时，可以对应设置音效应用的至少一个应用程序，该至少一个应用程序为与音效关联的应用程序。终端设备可以确定用户请求播放音频的应用程序，进而若至少一个第一应用程序包括所述用户请求播放音频的应用程序，则终端设备确定用户已设置音效，若至少一个第一应用程序不包括所述用户请求播放音频的应用程序，则终端设备确定用户未设置音效。

其中，若确定所述用户已设置音效，则终端设备根据所述音效的设置信息，获取所述已设置音效对应的音效参数；若确定所述用户未设置音效，则根据预设时间段内的所述用户历史播放音频的信息，获取所述用户的偏好音效对应的音效参数。在一种可能的实现方式中，可以将所述已设置音效作为所述用户的偏好音效。下述为了区分终端设备采用音效的设置信息或采用预设时间段内的所述用户历史播放音频的信息获取的用户的偏好音效，将采用音效的设置信息获取的用户的偏好音效为已设置音效进行说明。

本申请实施例中，终端设备可以根据所述音效的设置信息，确定所述用户是否已设置音效，进而采用不同的方式获取音效对应的音效参数，能够更为贴合用户的需求，提高用户体验。示例性的，若用户已设置音效，则说明用户设置的音效为用户需求的音效，进而根据音效的设置信息，获取已设置音效对应的音效参数。若用户未设置音效，则说明对音效没有特别的需求，本申请实施例中，终端设备可以根据预设时间段内的所述用户历史播放音频的信息，预测用户的偏好音效对应的音效参数，也能够提高用户体验。

应注意，本申请实施例中可以采用预设时间段内的用户历史播放音频的信息获取用户的偏好音效，能够跟随用户的偏好随时调整音效，更加智能化。

在一种可能的实现方式中，终端设备可以为音效的设置信息设置保存时长，保存时长为从用户设置音效的时刻起的一段时间。当音效的设置信息在该保存时长内，终端设备可以根据所述音效的设置信息，获取所述已设置音效对应的音效参数。但音效的设置信息超出该保存时长，终端设备可以根据预设时间段内的用户历史播放音频的信息，获取用户的偏好音效或偏好音效对应的音效参数。应理解，该保存时长可以为预定义的或者用户在设置音效时设置的。

本申请实施例中，终端设备采用为用户设置的音效设置保存时长的方法，在用户的偏好音效发生变化时，终端设备可以采用及时调整音效参数，进而采用偏好音效对应的音效参数播放音频。该种方式更加智能，更为贴合用户需求，能够提高用户体验。

下面从如下可能的实现方式说明终端设备获取音效参数的过程：

第一种方式：终端设备根据音效的设置信息，获取音效参数。音效的设置信息包括所述已设置音效，终端设备可以根据音效参数集合和所述已设置音效，获取所述已设置音效对应的音效参数。其中，所述音效参数集合中包括各音效对应的音效参数，本申请实施例中，终端设备可以将音效参数集合中与已设置音效相同的音效对应的音效参数，作为已设置音效对应的音效参数。

第二种方式：终端设备根据用户历史播放音频的信息，获取音效参数。其中，用户历史播放音频的信息为预设时间段内的历史播放音频。本申请实施例中，终端设备可以将所述用户历史播放音频输入至音效预测模型，获取所述用户的偏好音效，进而根据音效参数集合和所述用户的偏好音效，获取所述偏好音效对应的音效参数。本申请实施例中，终端设备可以将音效参数集合中与所述偏好音效相同的音效对应的音效参数，作为所述偏好音效对应的音效参数。

第三种方式：终端设备根据用户历史播放音频的信息，获取音效参数。其中，用户历史播放音频的信息为预设时间段内的用户历史播放音频的音效标签，所述音效标签用于表征音效。应理解，终端设备可以采集用户历史播放音频，且将所述用户历史播放音频输入至音效识别模型，获取所述用户历史播放音频的音效标签。本申请实施例中，终端设备可以将数量最多的音效标签对应的音效作为所述用户的偏好音效，进而根据音效参数集合和所述用户的偏好音效，获取所述偏好音效对应的音效参数。终端设备依据音效参数集合和所述用户的偏好音效获取音效参数的方式可以参照第二种方式中的相关描述。

第四种方式：终端设备根据用户历史播放音频的信息，获取音效参数。其中，用户历史播放音频的信息为预设时间段内的用户历史播放音频。本申请实施例中，终端设备可以将所述用户历史播放音频输入至音效参数预测模型，获取所述用户的偏好音效对应的音效参数。该种方式相较于上述三种方式，终端设备可以直接获取音效参数，而无需获取用户的偏好音效，进而可以提高音频的处理速率。

终端设备在依据上述任一种方式获取音效参数后，可以将当前音效参数修改为所述音效参数；或者，在预设的多组音效参数中选择所述音效参数。终端设备可以音效参数播放音频。其中，预设的多组音效参数中的每组音效参数对应一个音效。

上述第一种方式至第三种方式中，终端设备采用的音效参数集合为预先设置在终端设备中的，下述以服务器为获取音效参数集合的执行主体为例，对服务器获取音效参数集合的过程进行说明：

第一种方式：服务器获取第一音效的标准音频，以及第一音效的标准音频的第一频响。其中，第一音效为各音效。第一音效的标准音频可以作为识别其他音频是否为该第一音效的依据。服务器可以采用仿真工具中的傅里叶变换，将第一音效的标准音频的wav文件转换为频响曲线，得到第一音效的标准音频第一频响。服务器可以采用仿真工具模拟终端设备中的DRC模块、EQ模块和ANC模块，以生成音效参数不同的DRC参数、EQ参数和ANC参数。服务器可以不断调整仿真工具中的音效参数，进而对不断以调整后的音效参数处理第一音效的标准音频，得到第一音效的标准音频的第二频响。服务器获取第一音效的标准音频的第一频响和第二频响之间的差值，进而将与第一频响的差值小于预设差值的第二频响对应的音效参数，作为第一音效的音效参数，以得到音效参数集合。

第二种方式：服务器可以随机生成多组音效参数，且将多组音效参数输入至音效分类打分模型中，得到每组音效参数属于第一音效的得分。服务器将第一音效的得分最高的音效参数，作为第一音效的音效参数，以得到音效参数集合。

以上两种方式均可以得到音效参数集合，第二种方式相较于第一种方式，服务器可以不用预先获取第一音效对应的标准音频。应理解，在服务器不能获取第一音效对应的标准音频的情况下，服务器可以依据随机生成的音效参数，得到该音效对应的音效参数，第二种方式相的适用性更广。

第二方面，本申请实施例提供一种播放音频的电子设备，该电子设备包括音效组件。其中，所述电子设备用于接收用户输入的音频播放请求，根据音效的设置信息或用户历史播放音频的信息，获取音效参数，所述音频播放请求用于请求播放音频；所述音效组件，用于采用所述音效参数，播放所述音频。

在一种可能的实现方式中，所述电子设备还用于根据所述音效的设置信息，确定所述用户是否已设置音效；具体用于若确定所述用户已设置音效，则根据所述音效的设置信息，获取所述已设置音效对应的音效参数；若确定所述用户未设置音效，则根据预设时间段内的所述用户历史播放音频的信息，获取所述用户的偏好音效对应的音效参数。

在一种可能的实现方式中，所述音效的设置信息包括所述已设置音效，以及与所述已设置音效关联的至少一个第一应用程序；所述电子设备具体用于确定所述至少一个第一应用程序是否包括所述用户请求播放音频的应用程序；若所述至少一个第一应用程序包括所述用户请求播放音频的应用程序，则确定所述用户已设置音效。

在一种可能的实现方式中，所述电子设备还用于若确定所述音效的设置信息超出保存时长，则根据预设时间段内的所述用户历史播放音频的信息，获取所述用户的偏好音效对应的音效参数。

在一种可能的实现方式中，所述电子设备具体用于根据音效参数集合和所述已设置音效，获取所述已设置音效对应的音效参数，所述音效参数集合中包括各音效对应的音效参数。

在一种可能的实现方式中，所述电子设备具体用于根据所述用户历史播放音频的信息，获取所述用户的偏好音效；根据音效参数集合和所述用户的偏好音效，获取所述偏好音效对应的音效参数，所述音效参数集合中包括各音效对应的音效参数。

在一种可能的实现方式中，所述用户历史播放音频的信息为用户历史播放音频；所述电子设备具体用于将所述用户历史播放音频输入至音效预测模型，获取所述用户的偏好音效。

在一种可能的实现方式中，所述用户历史播放音频的信息为所述用户历史播放音频的音效标签，所述音效标签用于表征音效；所述电子设备具体用于将数量最多的音效标签对应的音效作为所述用户的偏好音效。

在一种可能的实现方式中，所述电子设备还用于采集所述用户历史播放音频，且将所述用户历史播放音频输入至音效识别模型，获取所述用户历史播放音频的音效标签。

在一种可能的实现方式中，所述用户历史播放音频的信息为用户历史播放音频；所述电子设备还用于将所述用户历史播放音频输入至音效参数预测模型，获取所述用户的偏好音效对应的音效参数。

在一种可能的实现方式中，所述电子设备还用于将当前音效参数修改为所述音效参数；或者，在预设的多组音效参数中选择所述音效参数，每组音效参数对应一个音效。

在一种可能的实现方式中，所述音效组件包括如下至少一项：动态范围控制DRC模块、均衡器EQ模块、主动降噪ANC模块，所述DRC模块的音效参数为DRC参数、所述EQ模块的音效参数为EQ参数、所述ANC模块的音效参数为ANC参数。

在一种可能的实现方式中，本申请实施例中的电子设备还可以包括处理器、存储器，其中，存储器用于存储计算机可执行程序代码，程序代码包括指令；当处理器执行指令时，指令使所述电子设备执行如第一方面或第一方面的各可能的实现方式所提供的方法。

第三方面，本申请实施例提供一种播放音频的电子设备，包括用于执行以上第一方面或第一方面各可能的实现方式所提供的方法的单元、模块或电路。该播放音频的电子设备可以为终端设备，也可以为应用于终端设备的一个模块，例如，可以为应用于终端设备的芯片。

第四方面，本申请实施例提供一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面或第一方面的各种可能的实现方式中的方法。

第五方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面或第一方面的各种可能的实现方式中的方法。

本申请实施例提供一种音频处理方法、电子设备和可读存储介质，该方法包括：接收用户输入的音频播放请求，根据音效的设置信息或用户历史播放音频的信息，获取音效参数，音频播放请求用于请求播放音频；采用音效参数，播放音频。本申请实施例中可以采用不同的音效参数播放音频，进而使得用户感受到以不同的音效播放的音频，进而满足用户对音频的音效多样化的需求，提高用户体验。

附图说明

图1为训练音效识别模型的流程简图；

图2为本申请实施例提供的终端设备的一种界面变化示意图；

图3为本申请实施例提供的设置页面的示意图；

图4为本申请实施例提供的音频处理方法的一实施例的流程示意图；

图5为本申请实施例提供的终端设备的一种结构示意图；

图6为本申请实施例提供的终端设备的另一种界面变化示意图；

图7为本申请实施例提供的音频处理方法的另一实施例的流程示意图；

图8为本申请实施例提供的获取音效参数集合的一种流程示意图；

图9为本申请实施例提供的仿真工具处理音频的一种流程示意图；

图10为本申请实施例提供的仿真工具处理音频的另一种流程示意图；

图11为本申请实施例提供的获取音效参数集合的另一种流程示意图；

图12为本申请实施例提供的终端设备的另一种结构示意图。

具体实施方式

目前，终端设备可以采用固定的音效播放音频，但随着用户对音频的音效的多样化的需求，固定的音效已经不能满足用户的需求。本申请实施例中，音频的音效可以包括但不限于为：超重低音、清澈人声、温暖轻柔、清澈旋律。其中，音效“超重低音”的特点可以为音频中低频占比大，给用户带来震撼感。音效“清澈人声”的特点可以为突出音频中的人声音频，弱化背景音频。音效“温暖轻柔”的特点可以为音频整体高低音均衡、听感舒适。音效“清澈旋律”的特点可以为突出音频中的背景音频，弱化人声音频。音频的音效与终端设备中的音效参数相关，因为目前的终端设备中的音效参数是预先设置的，因此终端设备采用该预先设置的音效参数播放音频只能实现一种音效。本申请实施例提供一种音频处理方法，通过改变终端设备中的音效参数来改变音频的音效，进而可以为用户提供不同音效的音频，以满足用户对音效多样化的需求，提高用户体验。

应理解，本申请实施例中的音效参数可以包括但不限于为：动态范围控制(dynamic range control，DRC)参数、均衡器(equalizer，EQ)参数、主动降噪(active noise cancellation，ANC)参数、消除异常噪声参数、噪声门限的低频增益、重低音强度、重低音中心频率、3D强度、3D效果中心频率。其中，DRC参数可以包括：音频信号的频段数量、频段的截止频率、音频信号的增益、压缩率、幅度阈值、压缩速度、增益时长、底噪阈值。均衡器可以由多个滤波器组成，均衡器参数可以包括滤波器的参数，滤波器的参数可以包括滤波器的类型、中心频率、增益以及Q值，Q值与音频信号的频率相关。ANC参数可以包括：滤波器的类型、中心频率、全频段增益、Q值以及单频段增益。

此处对本申请实施例中的术语进行解释：

音效识别模型：用于识别音频的音效。终端设备可以将音频输入至音效识别模型中，该音效识别模型可以输出音频的音效。示例性的，如将音频A输入至该音效识别模型中，该音效识别模型可以输出音效“超重低音”，则终端设备可以确定音频A的音效为“超重低音”。在一种实施例中，音效识别模型可以依据长短期记忆人工神经网络(long-short term memory，LSTM)结构、或者卷积神经网络(convolutional neural networks，CNN)结构、或者循环神经网络(recurrent neural networks，RNN)结构等神经网络结构，经深度学习(deep learning，DL)的方法训练数据集得到。其中，训练音效识别模型的数据集可以为大量的音频，以及每个音频的音效标签。音效标签用于表征音频的音效，音效标签如可以为“超重低音”、“清澈人声”等。或者，音效标签也可以由数字表示，如“0”、“1”。其中，“0”表示“超重低音”，“1”表示“清澈人声”。

下面以终端设备依据LSTM网络结构训练得到音效识别模型为例进行简要说明，LSTM网络结构包括输入层、至少一个隐含层和输出层。输入层用于接收数据集，且将数据集中的数据分发至隐含层的神经元。隐含层的神经元用于根据数据进行计算，且将计算结果输出至输出层。输出层用于输出运算结果。图1为训练音效识别模型的流程简图。如图1所示，本申请实施例中训练音效识别模型的方法可以包括：

S101，初始化LSTM网络结构中各隐含层的神经元的权重值。

示例性的，终端设备可以将各隐含层的神经元的权重值初始化成服从高斯分布的随机权重值。

S102，将预处理后的数据集分成N个批次。

本申请实施例中，终端设备使用的数据集为经过预处理的数据集，数据集中的数据的均值为0，方差为1。示例性的，数据集中可以包括多个音频以及每个音频的音效标签，数据集中的音频可以为波形声音(wav)文件。以终端设备对数据集进行预处理为例，终端设备可以将wav文件转换成频谱图，如梅尔频谱图，得到音频的频谱值(如梅尔特征，mel特征)，进而将音频的频谱值进行归一化处理，以得到均值为0且方差为1的数据。

终端设备可以将预处理后的数据集分成N个批次，以采用该N个批次的数据对LSTM网络结构进行迭代训练。如终端设备可以按照数据量将数据集平均分成N个批次。其中，N为大于1的整数。

S103，将第i个批次的数据输入LSTM网络结构，得到第i个批次的数据的交叉熵损失。

示例性的，训练开始时，即当i为1时，终端设备将第1个批次的数据输入至LSTM网络结构中，LSTM网络结构可以输出第1个批次的数据的交叉熵损失(cross entropy loss)。应理解，交叉熵损失用于表征终端设备采用LSTM网络结构预测的音频的音效标签与音频的真实音效标签的相似度。该交叉熵损失越小，表征LSTM网络结构中各隐含层的神经元的权重值越准确。其中，i为大于或等于1且小于或等于N的整数。

S104，根据第i个批次的数据的交叉熵损失，更新LSTM网络结构中各隐含层的神经元的权重值。

示例性的，终端设备可以根据第1个批次的数据的交叉熵损失，更新各隐含层的神经元的初始权重值。终端设备可以根据第1个批次的数据的交叉熵损失，确定采用LSTM网络结构预测的音频的音效标签与音频的真实音效标签的相似度与100％之间的误差，进而根据该误差更新各隐含层的神经元的权重值。示例性的，终端设备可以采用梯度下降法(gradient decent)或随机梯度下降法(stochastic gradient decent)更新各隐含层的神经元的权重值。

S105，判断i是否小于N。若是，则将i加1，执行S103。若否，执行S106。

终端设备可以判断i是否小于N，以确定数据集的N个批次的数据是否训练完成。其中，若i小于N，终端设备可以将i加1，继续执行S103。如，当i为1，N为10时，终端设备确定i小于N，进而将第2个批次的数据输入至更新权重值的LSTM网络结构中，得到第2个批次的数据的交叉熵损失。同理的，终端设备可以根据该第2个批次的数据的交叉熵损失，采用梯度下降法或随机梯度下降法更新各隐含层的神经元的权重值。如此不断迭代，直至i等于N时，终端设备将第N个批次的数据输入至LSTM网络结构中，且终端设备根据该第N个批次的数据的交叉熵损失更新各隐含层的神经元的权重值。其中，当i等于N时，终端设备可以执行下述S106。

S106，根据目标交叉熵损失和第N个批次的数据的交叉熵损失，确定训练是否收敛。若训练收敛，则执行S107，若训练未收敛，则返回执行S102。

用户可以预先设置目标交叉熵损失作为训练的收敛依据。终端设备在得到第N个批次的数据的交叉熵损失时，可以根据第N个批次的数据的交叉熵损失和目标交叉熵损失，确定训练是否收敛。其中，若第N个批次的数据的交叉熵损失小于或等于目标交叉熵损失，则表征依据采用LSTM网络结构预测的音频的音效标签接近音频的真实音效标签，则终端设备可以确定训练收敛。若LSTM网络结构输出的第N个批次的数据的交叉熵损失大于目标交叉熵损失，则确定训练未收敛。当训练未收敛时，终端设备返回执行S102，即继续将预处理后的数据集分成N个批次，采用N个批次的数据对LSTM网络结构继续训练，直至训练收敛。

S107，结束。

若终端设备确定训练收敛，则结束训练，即可得到音效识别模型。该音效识别模型可以为：终端设备根据第N个批次的数据的交叉熵损失，更新各隐含层的神经元的权重值后的LSTM网络结构。

音效预测模型：用于根据用户历史播放的音频，预测用户的偏好音效。终端设备可以将用户历史播放的音频输入至音效预测模型中，该音效预测模型可以输出用户的偏好音效。音效预测模型的训练方式可以与上述音效识别模型的训练方式相同，训练音效预测模型的数据集为大量的音频、以及每个音频的音效标签。其中，用户历史播放的音频可以为歌曲、视频文件中的音频、广播音频、录音等。

音效参数预测模型：用于根据用户历史播放的音频，预测用户的偏好音效对应的音效参数。终端设备可以将用户历史播放的音频输入至音效参数预测模型中，该音效参数预测模型可以输出用户的偏好音效对应的音效参数。音效参数预测模型的训练方式可以与上述音效识别模型的训练方式相同，不同的是训练音效参数预测模型的数据集为大量的音频、以及每个音频的音效标签、以及每个音效标签对应的音效参数(或者说每个音频对应的音效标签)。

与上述音效预测模型的结构不同的是，本申请实施例中可以在LSTM网络结构的最后一个隐含层之后加入映射层，该映射层用于将音效和音效参数进行映射，进而使得该音效参数预测模型可以预测用户的偏好音效对应的音效参数。

频响：也称频响曲线，是指增益随频率的变化曲线。

音效分类打分模型：用于根据随机生成的音效参数，得到音效参数属于各音效的得分。终端设备可以将随机生成的音效参数输入至音效分类打分模型中，该音效分类打分模型可以输出音效参数为各音效的得分。得分越高，表征终端设备采用该音效参数播放音频时的音效越接近对应的音效。同理的，终端设备可以将待确定音效的音频输入至音效分类打分模型中，该音效分类打分模型可以输出待确定音效的音频属于各音效的得分。音效分类打分模型的训练方式可以与上述音效识别模型的训练方式相同，不同的是训练音效分类打分模型的数据集为大量的音频、以及每个音频的音效标签、以及每个音效标签对应的音效参数(或者说每个音频对应的音效标签)。

在一种实施例中还可以训练每个音效对应的音效分类打分模型，进而得到各音效对应的音效分类打分模型。本申请实施例中可以将随机生成的音效参数输入至各音效分类打分模型中，同样也可以得到音效参数属于各音效的得分。示例性的，如本申请实施例中包括“超重低音”的音效分类打分模型，以及“清澈人声”的音效分类打分模型，可以将随机生成的音效参数分别输入至“超重低音”的音效分类打分模型以及“清澈人声”的音效分类打分模型，进而可以得到随机生成的音效参数属于“超重低音”的得分，以及属于“清澈人声”的得分。与上述音效分类打分模型不同的是，该实施例中每个音效对应的音效分类打分模型的数据集可以为该音效的音频，以及该音效对应的音效参数。

标签数据库：用于存储音频的音效标签，如神经合成器数据库(neural synthesizer dataset，NSynth Dataset)。示例性的，如标签数据库中可以存储有音频A的音效标签“超重低音”，标签数据库中可以存储音频A或者音频A的标识，音频A或者音频A的标识与音频A的音效标签“超重低音”对应。其中，音频A的标识可以为音频A的名称、音频A的音频特征等，用于唯一指示音频A。

在一种实施例中，终端设备的设置页面上可以显示有“音效设置”控件，或者设置页面中的设置选项的界面上显示有“音效设置”控件。或者，应用程序的设置页面上可以显示有“音效设置”控件。用户需求设置音效时，可以在终端设备的设置界面或应用程序的设置界面上通过“音效设置”控件选择音效，进而使得终端设备在播放音频时以该音效播放音频。图2为本申请实施例提供的终端设备的一种界面变化示意图。图2中以在设置页面中的设置选项4，如“声音和震动”选项中包含“音效设置”控件为例进行说明。界面201为终端设备的设置页面，该设置页面上可以包括多个设置选择，如设置选项1-设置选项7。用户在需求设置音频的音效时，可以点击该设置选项4(声音和震动)选项，界面201跳转至界面202。界面202为“声音和震动”的设置页面，该界面202上显示有“音效设置”控件，用户点击该“音效设置”控件，界面202跳转至界面203。界面203为音效设置的页面，该界面203上显示有多种可选择的音效，如超重低音、清澈人声、温暖轻柔、清澈旋律、声乐古风。用户可以点击对应的音效的控件选择音效。示例性的，用户可以点击“清澈人声”的控件，选择音效“清澈人声”。可选的，该界面203上还可以显示有每个音效的特点。

应理解，用户选择音效后，终端设备可以记录用户选择的音效。可选的，界面203上还可以显示有“无”控件，若用户点击“无”控件，则终端设备可以取消已经选择的音效。对应的，终端设备可以记录用户当前没有选择音效。其中，终端设备可以存储音效的设置信息，如音效的设置信息可以存储在用户的操作日志中，该操作日志可以存储在终端设备的内存中。用户的操作日志中。音效的设置信息可以包括音效标签和音效的设置时刻。示例性的，终端设备中存储的音效的设置信息可以如下表一所示。应注意，表一为终端设备存储音效的设置信息的一种格式，终端设备还可以采用可扩展标记语言(extensible markup language，XML)格式、数据库格式存储音效的设置信息。

表一

音效标签	设置时刻
清澈人声	2020年1月30日，8:00
无	2020年3月2日，10:00
超重低音	2020年5月1日，21:00

如表一所示，用户在2020年1月30日的8:00将音效设置为“清澈人声”，在2020年3月2日的10:00取消了设置的音效，然后又在2020年5月1日的21:00将音效设置为“超重低音”。在一种可能的实现方式中，终端设备也可以存储用户最近一次设置的音效的设置信息，如终端设备中存储的音效的设置信息为如上表一中的“超重低音”，以及“超重低音”的设置时刻“2020年5月1日，21:00”。

在一种实施例中，用户在音效设置的页面上选择音效时，还可以选择音效应用的应用程序，下述以用户选择音效应用的应用程序为第一应用程序进行说明，应理解，第一应用程序可以理解为与用户选择的音效关联的应用程序。应理解，第一应用程序可以为终端设备中可以播放音频的应用程序，可以但不限于为音乐播放类应用程序、视频类应用程序、社交类应用程序。图3为本申请实施例提供的设置页面的示意图。与上述界面203不同的是，图3所示的音效设置页面上还可以显示有应用程序的标识。应用程序的标识可以为应用程序的图标或名称。如图3所示，用户选择在“应用程序1”和“应用程序2”中应用音效“超重低音”，“应用程序1”和“应用程序2”可以称为第一应用程序。在该种实施例中，终端设备存储的音效的设置信息中还可以包括音效关联的第一应用程序，如下表二所示。应理解，表二为终端设备存储音效的设置信息的一种格式的示例。

表二

音效标签	设置时刻	音效关联的第一应用程序
清澈人声	2020年1月30日，8:00	应用程序1
无	2020年3月2日，10:00	无
超重低音	2020年5月1日，21:00	应用程序1和应用程序2

下述实施例可以相互结合，对于相同或相似的概念或过程不再赘述。图4为本申请实施例提供的音频处理方法的一实施例的流程示意图。如图4所示，本申请实施例提供的音频处理方法可以包括：

S401，接收到用户输入的音频播放请求，确定用户是否已设置音效，音频播放请求用于请求播放音频。

用户可以在终端设备的界面上执行点击或其他操作，与终端设备交互以输入音频播放请求。或者，用户可以与终端设备进行语音交互，以向终端设备输入音频播放请求。本申请实施例中对用户请求终端设备播放音频的方式不做限制。其中，音频播放请求用于请求播放音频。

当终端设备接收到用户输入的音频播放请求时，可以确定用户是否已设置音效。在一种可能的实现方式中，用户可以在如上述图2所示的设置页面上设置音效。本申请实施例中，可选的，终端设备可以根据音效的设置信息，如表一，确定用户是否已设置音效。示例性的，终端设备可以确定用户已设置音效“超重低音”。

在一种可能的实现方式中，用户可以在上述如图3所示的设置页面上设置音效。音效的设置信息中可以包括用户已设置的音效，以及与用户设置的音效关联的至少一个第一应用程序，用户已设置的音效可以称为已设置音效。终端设备确定用户请求播放音频的应用程序，且根据存储的音效的设置信息，如表二，确定用户是否已为该应用程序设置音效。其中，终端设备可以确定音效的设置信息的至少一个应用程序中是否包括第一应用程序，当至少一个应用程序中包括第一应用程序时，终端设备确定用户已设置音效，即用户已为该应用程序设置音效。当至少一个应用程序中不包括第一应用程序时，终端设备确定用户未设置音效，即用户未为该应用程序设置音效。示例性的，如用户在应用程序1请求播放音频，则终端设备根据表二可以确定用户已为应用程序1设置音效“超重低音”。

S402，若确定用户已设置音效，则将已设置音效作为用户的偏好音效。

若终端设备通过音效的设置信息，确定用户已设置音效，则终端设备可以将用户设置的音效作为用户的偏好音效。其中，用户的偏好音效可以理解为用户喜爱的音效。示例性的，如终端设备可以将“超重低音”作为用户的偏好音效。

在一种实施例中，上述S401-S402可以替换为：当接收到用户输入的音频播放请求时，根据音效的设置信息，将音效的设置信息中用户设置的音效作为用户的偏好音效。该种方式中，终端设备可以在接收到用户输入的音频播放请求时，查询音效的设置信息，将音效的设置信息中用户设置的音效作为用户的偏好音效。

S403，获取偏好音效对应的音效参数，且将当前音效参数调整为偏好音效对应的音效参数。

应理解，终端设备的内存中可以预先存储音效参数集合。音效参数集合包括各种音效对应的音效参数。可选的，音效参数集合中可以包括音效标签，以及音效标签对应的音效参数，音效标签用于指示音效。音效参数的释义可以参照上述的相关描述。下述音效参数包括DRC参数、EQ参数和ANC参数为例进行说明。终端设备中存储的音效参数集合可以如下表三，应理解，表三为音效参数集合存储的一种格式示例。

应理解，本申请实施例中，若不将用户已设置的音效作为用户的偏好音效，则S402和S403可以替换为：若确定用户已设置音效，则获取已设置音效对应的音效参数，且将当前音效参数调整为已设置音效对应的音效参数。

应理解，用户的偏好音效对应的音效参数还可以称为“音效参数”，本申请实施例中以用户的偏好音效对应的音效参数为例说明，以便于与音效参数集合中的音效参数进行区别。

表三

其中，以音效“超重低音”为例，DRC参数中“[2,2000,2.1,0.8,1000,1.1,10,0.1]”，方括号中的数值分别表示音频信号的频段数量、频段的截止频率、音频信号的增益、压缩率、幅度阈值、压缩速度、增益时长、底噪阈值。EQ参数中包括8个滤波器的参数，每个滤波器的参数以括号进行区分，以参数(2,1000,2.1,3.5)为例，括号中的数值分别表示滤波器的类型、中心频率、增益、Q值。ANC参数中包括16个滤波器的参数，每个滤波器的参数以括号进行区分，以参数(4,43.0,7.5,4630,0.0)为例，括号中的数值分别为滤波器的类型、中心频率、全频段增益、Q值以及单频段增益。

如上表三所示，如用户的偏好音效为超重低音，则终端设备根据音效参数集合，可以确定偏好音效“超重低音”对应的音效参数。基于用户的偏好音效，终端设备可以将终端设备的当前音效参数调整为偏好音效对应的音效参数。其中，当前音效参数可以为用户上一次设置的音效对应的音效参数。示例性的，如上表一所示，如当前时刻为2020年3月5日20:00，则终端设备可以确定当前音效参数可以为用户未设置音效时终端设备的音效参数。或者，如当前时刻为2020年5月6日20:00，则终端设备可以确定当前音效参数为“清澈人声”对应的音效参数。

在一种实施例中，图5为本申请实施例提供的终端设备的一种结构示意图。如图5所示，本申请实施例中的终端设备可以包括：数模转换器、模数转换器和音效组件。音效组件可以包括如下至少一个模块：DRC模块、EQ模块、ANC模块。本申请实施例中以音效组件可以包括DRC模块、EQ模块和ANC模块为例进行说明。其中，音效组件可以分别与数模转换器、模数转换器连接，数模转换器可以与终端设备中的喇叭或外接设备(如耳机)连接，模数转换器可以与终端设备中的麦克风连接。

音效组件，用于对音频信号进行调节，以改变音频信号对应的音效。其中，DRC模块，用于压缩或扩张音频信号，使得音频中的声音听起来更柔和或更大声，即用于调节音频信号的幅度。EQ模块，用于校正音频信号的传输信道的幅度频率特性和相位频率特性，以对音频信号进行补偿，减少对音频信号的干扰。ANC模块，用于产生与外界噪音相等的反向声波，将外界噪声中和，从而实现降噪的效果。数模转换器，用于将数字音频信号转换为模拟音频信号，以进行输出。模数转换器，用于将输入的模拟音频信号转换成数字音频信号。在本申请另一些实施例中，终端设备可以包括比图示更多或更少的部件以对音频信号进行处理，图5并不构成对终端设备的结构限定，可以理解的是，图5中以音效组件包括DRC模块、EQ模块、ANC模块为例进行说明，音效组件中还可以包括其他处理音频信号的模块。

DRC模块音效参数为DRC参数、EQ模块音效参数为EQ参数以及ANC模块的音效参数为ANC参数，音效组件中的各模块的参数影响终端设备播放音频的音效。在一种可能的实现方式中，终端设备中存储有预设代码和当前音效参数。预设代码可以为开发人员编写的使能终端设备执行音效参数播放音频的代码，该预设代码可以存储在终端设备中的系统安装包中。终端设备可以将当前音效参数修改为偏好音效对应的音效参数，进而达到将当前音效参数调整至偏好音效对应的音效参数的目的。

或者，在一种可能的实现方式中，终端设备中预先存储有多组音效参数，每组音效参数中包括DRC参数、EQ参数以及ANC参数。每组音效参数中的至少一个参数不同，每组音效参数对应一个音效。终端设备在确定用户的偏好音效后，可以在多组音效参数中选择偏好音效对应的目标音效组，进而得到偏好音效对应的音效参数。与上述可能的实现方式不同的是，终端设备可以不修改音效参数，而是在多组音效参数中选择偏好音效对应的音效参数。可选的，每组音效参数具有对应的标识，以表征对应的音效，如每组音效参数具有对应的标识可以为数字或音效标签。示例性的，当前音效参数的标识为1，表征音效“清澈人声”，偏好音效为“超重低音”，终端设备可以确定表征“超重低音”的音效参数的标识为2。

在一种实施例中，上述S401-S403可以替换为：当接收到用户输入的音频播放请求时，根据音效的设置信息，获取用户的偏好音效对应的音效参数。在一种可能的实现方式中，终端设备在存储如上表一或表二中的音效的设置信息时，终端设备可以根据音效参数集合，将用户设置的音效对应的音效参数添加至上述表一或表二中，如表一可以替换为表四：

表四

该种方式中，终端设备可以接收到用户输入的音频播放请求时，查询音效的设置信息，进而可以将用户设置的音效对应的音效参数作为用户的偏好音效对应的音效参数。

S404，采用偏好音效对应的音效参数，播放音频。

终端设备在调整音效参数后，可以采用偏好音效对应的音效参数播放音频。

当用户设置音效后，该音效关联的应用程序的界面上可以显示用户设置的音效。或者，当用户在终端设备的下拉状态栏里，通过点击触发音效关联的应用程序(如触发播放音乐)时，下拉状态栏中可以显示用户设置的音效。下面以当用户设置音效后，用户首次打开音效关联的应用程序时，应用程序的界面上显示用户设置的音效为例进行说明。图6为本申请实施例提供的终端设备的另一种界面变化示意图。界面601为应用程序1(如音乐播放类应用程序)的音乐播放页面，该页面上显示有音乐列表601a以及音乐播放栏601b。音乐列表601a中可以包括多个歌曲的名称，音乐播放栏601b可以包括歌曲的标识601c和播放控件601d，歌曲的标识为歌曲的名称，如歌曲B。播放控件601d用于触发终端设备播放歌曲B。应理解，歌曲B为用户上一次退出该应用程序时，应用程序播放的歌曲，歌曲B可以位于音乐列表601a的首位。

当用户选择音乐列表601a中的歌曲B，或者用户点击音乐栏601b时，界面601可以跳转至歌曲B的播放页面界面602，或者直接播放歌曲B。界面602上显示有歌曲选项602a、歌曲B的信息602b，用户设置的音效602c(例如，“超重低音”)、播放进度条602d、快退(上一首)控件602e、暂停控件602f以及快进(下一首)控件602g。界面602中的歌曲B的信息602b可以包括歌曲B的名称、歌曲B的演唱者以及歌曲B的歌词，图6中以数字表示歌曲B的歌词。歌曲选项602a关联界面602。歌曲选项602a关联界面602指的是，用户选择菜单栏中的歌曲选项，终端设备跳转显示界面602。用户可以在歌曲B的播放页面上看到音频的音效。

本申请实施例中，终端设备采用偏好音效对应的音效参数播放音频的一种可能的实现方式为：终端设备执行预设代码，使能终端设备采用偏好音效对应的音效参数播放音频。或者，终端设备采用偏好音效对应的音效参数播放音频的另一种可能的实现方式为：终端设备确定偏好音效对应的音效参数的标识后，可以执行预设代码，使能终端设备采用该标识对应的音效参数播放音频。

本申请实施例中，用户可以预先设置音效，用户设置的音效为用户的偏好音效，终端设备可以将音效参数调整为偏好音效对应的音效参数，进而采用偏好音效对应的音效参数播放音频，实现音频的音效多样化，提高用户体验。

上述实施例中，用户需要预先设置音效，使能终端设备以该音效播放音频。在一种实施例中，本申请实施例中终端设备可以在接收到用户输入的音频播放请求时，根据预设时间段内的用户历史播放音频的信息，获取用户的偏好音效，进而采用用户的偏好音效对应的音效参数播放音频，可以避免用户手动设置音效，提高用户体验。其中，该过程可以参照S405中的相关描述。

在一种实施例中，如图4所示，在上述S401之后，本申请实施例提供的音频处理方法还可以包括：

S405，若确定用户未设置音效，则根据预设时间段内的用户历史播放音频的信息，获取用户的偏好音效。

应理解，S402和S405为择一执行的步骤。

预设时间段可以为用户输入音频播放请求的时刻(用户输入音频播放请求的时间)之前的一段时间，预设时间段可以但不限于为一天、一周或一个月。用户历史播放音频可以包括但不限于为：用户在终端设备上播放的音乐、歌曲、广播、视频中的音频。用户历史播放音频的信息可以为：用户历史播放音频，或者用户历史播放音频的音效标签。应理解，在用户历史播放音频时，终端设备可以存储用户历史播放音频。或者，在用户历史播放音频时，终端设备可以采集用户历史播放音频，且将用户历史播放音频输入至音效识别模型中，得到用户历史播放音频的音效，进而存储用户历史播放音频的音效标签。在一种可能的实现方式中，终端设备可以依据当前时刻，删除当前时刻的预设时间段之前的用户历史播放音频的信息，以节省终端设备内存空间。

本申请实施例中，终端设备若根据音效的设置信息，确定用户未设置音效，则终端设备可以根据用户历史播放音频的信息，获取用户的偏好音效。在一种可能的实现方式中，当用户历史播放音频的信息为用户历史播放音频时，终端设备可以将用户历史播放音频输入至音效预测模型，以获取音效预测模型预测的用户的偏好音效。在一种可能的实现方式中，当用户历史播放音频的信息为用户历史播放音频的音效标签时，终端设备可以将数量最多音效标签对应的音效作为用户的偏好音效。

值得注意的是，当用户历史播放音频的信息为用户历史播放音频时，在一种可能的实现中，终端设备可以将用户历史播放音频输入至音效参数预测模型，可以预测用户的偏好音效对应的音效参数。与上述终端设备依据音效预测模型得到用户的偏好音效不同的是，终端设备可以根据音效参数预测模型直接得到用户的偏好音效对应的音效参数。图7为本申请实施例提供的音频处理方法的另一实施例的流程示意图。在该种方式中，如图7所示，本申请实施例提供的音频处理方法还可以包括：

S701，若确定用户未设置音效，则根据用户历史播放音频的信息，获取用户的偏好音效对应的音效参数。

应理解，“S402-S403”和S701为择一执行的步骤，终端设备在执行S401之后可以执行S701，在执行S701之后可以执行S404。

在一种可能的实现方式中，当终端设备在接收到用户输入的音频播放请求时，可以根据预设时间段内的用户历史播放音频的信息，获取用户的偏好音效对应的音效参数。该过程可以参照上述S701的相关描述。

本申请实施例中，终端设备可以根据用户历史播放音频的信息获取用户的偏好音效或者用户的偏好音效对应的音效参数，进而以用户的偏好音效播放音频，能够达到音效多样化的目的，且可以避免用户手动设置音效。另外，本申请实施例中可以采用预设时间段内的用户历史播放音频的信息获取用户的偏好音效，能够跟随用户的偏好随时调整音效，更加智能化。

在一种实施例中，终端设备可以为用户设置的音效设置保存时长，即用户的设置信息对应有保存时长，保存时长为从用户设置音效的时刻起的一段时间。当用户设置的音效在该保存时长内，终端设备可以采用用户设置的音效播放音频，如终端设备可以执行S401、S402、S403和S404。但若用户设置的音效超出该保存时长，终端设备可以根据预设时间段内的用户历史播放音频的信息，获取用户的偏好音效或偏好音效对应的音效参数，进而采用偏好音效对应的音效参数播放音频，如终端设备可以执行S401、S405、S403(或S406)和S404。示例性的，如上表一所示，“超重低音”的设置时刻为2020年5月1日的21:00，保存时长为5天，则在2020年5月1日的21:00至2020年5月6日的21:00，用户设置的音效在保存时长内，则终端设备可以以用户设置的音效“超重低音”播放音频。在2020年5月6日的21:00之后，用户设置的音效不在该保存时长内，则终端设备可以根据2020年5月6日的21:00之前的预设时间段内的用户历史播放音频的信息，获取用户的偏好音效或偏好音效对应的音效参数，进而采用偏好音效对应的音效参数播放音频。

在一种场景中，如用户设置了音效“超重低音”，且用户设置了该音效关联的应用程序为应用程序1。用户在使用其他应用程序时，终端设备可以不以该音效“超重低音”播放音频，用户的偏好音效可能发生变化。但用户忘记关闭设置页面上设置的音效，则用户在使用应用程序1时，终端设备还是采用音效“超重低音”播放音频，给用户造成困扰。而本申请实施例中，终端设备采用为用户设置的音效设置保存时长的方法，在用户的偏好音效发生变化时，终端设备可以采用及时调整音效参数，进而采用偏好音效对应的音效参数播放音频。该种方式更加智能，更为贴合用户需求，能够提高用户体验。

上述实施例中，终端设备中可以预先存储有如上表三所示的音效参数集合，该音效参数集合可以预置在终端设备中。下述对获取音效参数集合的过程进行说明。图8为本申请实施例提供的获取音效参数集合的一种流程示意图。如图8所示，本申请实施例提供的获取音效参数集合的方法可以包括：

S801，获取第一音效的标准音频，以及第一音效的标准音频的第一频响。

应理解，本实施例中以获取音效参数集合的执行主体为服务器为例进行说明，该执行主体也可以为计算机、终端设备等具有计算能力的电子设备。第一音效的标准音频为各种音效的标准音频，各种音效为音效参数集合中包括的音效。第一音效的标准音频可以为预先为第一音效设置的音频，第一音效的标准音频可以作为识别其他音频是否为该第一音效的依据。

在一种可能的实现方式中，服务器可以从标签数据库中获取第一音效对应的标准音频。应理解，标签数据库中可以包括大量的音频，以及每个音频的音效标签。示例性的，服务器可以根据标签数据库中的音效标签，选择第一音效的音效标签的音频作为第一音效的标准音频。

上述方式虽然能够得到第一音效的标准音频，但因为标签数据库中属于相同的音效标签的音频有多个，为了提高第一音效的标准音频的参考准确性，在一种可能的实现方式中，服务器可以将测试音频输入至音效分类打分模型，得到测试音频属于第一音效的得分。测试音频可以为本地存储的音频，或者从网络爬取的音频，或者是开发人员录取的音频。服务器可以将得分最高的测试音频作为第一音效的标准音频。

服务器在得到第一音效的标准音频后，可以向终端设备发送第一音效的标准音频。或者，开发人员可以将第一音效的标准音频导入至终端设备中，终端设备可以播放第一音效的标准音频，以得到第一音效的标准音频的wav文件。服务器可以采用仿真工具，根据该标准音频的wav文件获取第一音效的标准音频的第一频响。其中，仿真工具可以采用傅里叶变换(fourier transform)将标准音频的wav文件转换为频响曲线，即标准音频第一频响，如图9所示。应理解，频响可以为频响曲线，播放标准音频的终端设备可以为处于测试阶段的设备。

S802，调整音效参数，且以调整后的音效参数处理第一音效的标准音频，获取第一音效的标准音频的第二频响。

仿真工具中包括如图5所示的音效组件的仿真模块，仿真模块可以模拟生成音效组件中的DRC模块的DRC参数、EQ模块的EQ参数，以及ANC模块的ANC参数。本申请实施例中，服务器可以不断调整仿真工具中的音效参数，进而对不断以调整后的音效参数处理第一音效的标准音频。其中，服务器具体可以采用调整后的音效参数处理第一频响，进而得到第一音效的标准音频的第二频响，以确定第二频响是否接近第一频响，如图10 所示。

应理解，本申请实施例中，服务器可以修改仿真模块中各模块的音效参数。可选的，服务器可以根据音效参数中的参数的优先级，确定仿真模块中各模块的音效参数中的调整顺序。示例性的，参数的优先级从高到低依次是EQ参数、DRC参数、ANC参数。服务器可以先调整EQ参数，保持DRC参数和ANC参数不变。在EQ参数在预设的调整范围内调整结束后，服务器可以保持EQ参数和ANC参数不变，调整DRC参数。在DRC参数在预设的调整范围内调整结束后，服务器可以保持EQ参数和DRC参数不变，调整ANC参数。其中，服务器每调整一次仿真模块中的音效参数，可以采用仿真模块处理一次第一频响，以得到第一音效的标准音频的第二频响。服务器不断地调整音效参数，进而可以得到多组音效参数对应的第一音效的标准音频的第二频响。

S803，将与第一频响的差值小于预设差值的第二频响对应的音效参数，作为第一音效的音效参数，以得到音效参数集合。

终端设备可以获取采用不同的音效参数处理第一频响的第二频响，进而获取第二频响与第一频响的差值。第二频响与第一频响的差值可以表征以第二频响对应的音效参数播放的标准音频的音效与第一音效的相似度。其中，差值越小，表征以音效参数播放的标准音频的音效越接近第一音效。该差值越大，则表征以音效参数播放的标准音频的音效越远离第一音效。本申请实施例中，服务器可以将与第一频响的差值小于预设差值的第二频响对应的音效参数，作为该第一音效的音效参数。对不同的音效来说，采用该种方法可以得到不同音效对应的音效参数，进而得到音效参数集合。可选的，若与第一频响的差值小于预设差值的第二频响有多个，则可以将第一频响和第二频响的差值最小的音效参数作为该第一音效的音效参数。应注意，预设差值可以为开发人员预定义的。

应理解，第一频响和第二频响均为频响曲线。本申请实施例中，服务器可以获取第一频响和第二频响在相同横坐标时的纵坐标的差值绝对值的均值，进而将该差值绝对值的均值作为第一频响和第二频响的差值。其中，频响曲线的横坐标为频率，纵坐标为增益。示例性的，相同频率时第一频响曲线上的纵坐标的值分别为[1，4，6，7，8]，第二频响曲线上的纵坐标的值分别为[3，2，4，5，6]，则第一频响和第二频响的差值为各增益的差值的绝对值的均值，如2。

应理解的是，服务器在获取音效参数集合后，可以将音效参数集合预置在终端设备中，如可以将上述表三所示音效参数集合存储在终端设备的内存内。

图11为本申请实施例提供的获取音效参数集合的另一种流程示意图。如图11所示，本申请实施例提供的获取音效参数集合的方法可以包括：

S1101，随机生成多组音效参数，且将多组音效参数输入至音效分类打分模型中，得到每组音效参数属于第一音效的得分。

每组音效参数中可以包括DRC参数、EQ参数和ANC参数，不同组音效参数中至少有一个音效参数不同。终端设备可以将多组音效参数输入至音效分类打分模型中，音效分类打分模型可以输出每组音效参数属于第一音效的得分。其中，得分越高，表征以该组音效参数播放的音频的音效越接近第一音效。应理解，第一音效用于表征各种音效。

示例性的，如服务器随机生成的一组音效参数为“DRC参数：[2,2000,2.1,0.8,1000,1.1,10,0.1]；EQ参数：[(2,1000,2.1,3.5),(3,1200,2.4,3.6),(2,1800,2.1,3.5), (1,800,0.1,3.5),(2,500,4.9,1.5,)(0,1788,2.3,3.2),(2,3000,-2.8,3.5),(2,5000,2.9,3.5)]；ANC参数：[(4,43.0,7.5,4630,0.0),(3,0,4,1200,0),(4,22.5,1.5,8540,0.0),(3,0,4,1200,0),(4,-56.0,6.0,8820,0.0,),(3,0,4,1200,0),(4,-23.5,3.5,15030,0.0),(3,0,4,1200,0,)(2,-42.5,7.0,15700,0.0),(3,0,4,1200,0),(4,11.5,8.0,8890,0.0),(3,0,4,1200,0),(4,-1.5,4.0,15210,0.0),(3,0,4,1200,0),(4,-11.0,6.0,2530,0.0),(3,0,4,1200,0)]”，则音效分类打分模型可以输出(0.72，0.05，0.06，0.72，0.02，0.14)的得分，该得分用于表征该组音效参数属于第一音效的得分，如该组音效参数属于音效“超重低音”的得分为0.72，该组音效参数属于音效“清澈人声”的得分为0.05……。示例性的，该组音效参数属于“超重低音”的得分最高，则该组音效参数对应的音效越接近音效“超重低音”。

S1102，将第一音效的得分最高的音效参数，作为第一音效的音效参数，以得到音效参数集合。

本申请实施例中，终端设备可以获取属于第一音效的得分最高的音效参数，且将该得分最高的音效参数作为第一音效的音效参数。如音效“超重低音”对应的各组音效参数中得分最高的为0.98，则将该0.98对应的音效参数作为音效“超重低音”的音效参数，据此，服务器可以得到音效参数集合。

图11所示的获取音效参数集合的方式，相较于图8所示的方式，服务器可以不用预先获取第一音效对应的标准音频。也就是说，在服务器不能获取第一音效对应的标准音频的情况下，服务器可以依据随机生成的音效参数，得到该音效对应的音效参数，图11所示的方法的适用性更广。

本申请实施例中，执行音频处理方法的执行主体可以为终端设备、终端设备中的芯片或处理器等。应理解，本申请实施例中的终端设备可以称为用户设备(user equipment，UE)、移动终端(mobile terminal)、终端(terminal)等。终端设备可以为个人数字处理(personal digital assistant，PDA)、具有无线通信功能的手持设备、计算设备、车载设备或可穿戴设备，虚拟现实(virtual reality，VR)终端设备、增强现实(augmented reality，AR)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等。本申请实施例中对终端设备的形态不做具体限定。

图12为本申请实施例提供的终端设备的另一种结构示意图。如图12所示，终端设备1200可以包括：处理器1210，存储器1220，通信模块1230，显示屏1240、传感器1250，音频模块1260。可以理解的是，图12示意的结构并不构成对终端设备1200的具体限定。在本申请另一些实施例中，终端设备1200可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件，软件，或软件和硬件的组合实现。本申请实施例示意的各模块间的接口连接关系，只是示意性说明，并不构成对终端设备1200的结构限定。在本申请另一些实施例中，终端设备1200也可以采用上述实施例中不同的接口连接方式，或多种接口连接方式的组合。

处理器1210可以包括一个或多个处理单元，例如：处理器1210可以包括应用处理器(application processor，AP)，数字信号处理器(digital signal processor，DSP)，显示处理单元(display process unit，DPU)，和/或神经网络处理器(neural-network processing unit，NPU) 等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。在一些实施例中，终端设备1200也可以包括一个或多个处理器1210。其中，处理器可以是终端设备1200的神经中枢和指挥中心。在一些实施例中，处理器1210可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit，I2C)接口，和/或通用串行总线(universal serial bus，USB)接口等。其中，USB接口是符合USB标准规范的接口，具体可以是Mini USB接口，Micro USB接口，USB Type C接口等。USB接口可以用于连接充电器为终端设备1200充电，也可以用于终端设备1200与外围设备之间传输数据。也可以用于连接耳机，通过耳机播放音频。

存储器1220可以用于存储一个或多个计算机程序，该一个或多个计算机程序包括指令。处理器1210可以通过运行存储在存储器1220的上述指令，从而使得终端设备1200执行各种功能应用以及数据处理等。存储器1220可以包括存储程序区和存储数据区。其中，存储程序区可存储操作系统；该存储程序区还可以存储一个或多个应用程序(比如图库、联系人等)等。在一些实施例中，处理器1210可以通过运行存储在存储器1220的指令，和/或存储在设置于处理器1210中的存储器的指令，来使得终端设备1200执行各种功能应用及数据处理。

通信模块1230可以提供应用在终端设备1200上的包括2G/3G/4G/5G等通信模块，和/或应用在终端设备1200上的包括无线局域网(wireless local area networks，WLAN)，蓝牙，全球导航卫星系统(global navigation satellite system，GNSS)，调频(frequency modulation，FM)，NFC，红外技术(infrared，IR)等通信模块。通信模块1230用于实现终端设备1200与其他设备之间的通信。

终端设备1200通过图形处理器(graphics processing unit，GPU)，显示屏1240，以及应用处理器等可以实现显示功能。GPU可以连接显示屏1240和应用处理器。GPU用于执行数学和几何计算，用于图形渲染。处理器1210可包括一个或多个GPU，其执行指令以生成或改变显示信息。

显示屏1240用于显示图像，视频等。显示屏1240包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display，LCD)，有机发光二极管(organic light-emitting diode，OLED)，有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrix organic light emitting diode的，AMOLED)，柔性发光二极管(flex light-emitting diode，FLED)，Miniled，MicroLed，Micro-oLed，量子点发光二极管(quantum dot light emitting diodes，QLED)等。在一些实施例中，终端设备1200可以包括1个或N个显示屏1240，N为大于1的正整数。

传感器1250可以包括压力传感器1250A，陀螺仪传感器1250B，加速度传感器1250C，距离传感器1250D，指纹传感器1250E，触摸传感器1250F等。

终端设备1200可以通过音频模块1260，扬声器1260A，受话器1260B，麦克风1260C，耳机接口1260D，以及应用处理器等实现音频功能。例如音乐播放，录音等。其中，音频模块1260用于将数字音频信息转换成模拟音频信号输出，也用于将模拟音频输入转换为数字音频信号。音频模块1260还可以用于对音频信号编码和解码。在一些实施例中，音频模块1260可以设置于处理器110中，或将音频模块1260的部分功能模块设置于处理器110中。扬声器1260A，也称“喇叭”，用于将音频电信号转换为声音信号。电子设备100可以通过扬声器1260A收听音乐，或收听免提通话。受话器1260B，也称“听筒”，用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时，可以通过将受话器1260B靠近人耳接听语音。麦克风1260C，也称“话筒”，“传声器”，用于将声音信号转换为电信号。当拨打电话或发送语音信息时，用户可以通过人嘴靠近麦克风1260C发声，将声音信号输入到麦克风1260C。电子设备100可以设置至少一个麦克风1260C。在另一些实施例中，电子设备100可以设置两个麦克风1260C，除了采集声音信号，还可以实现降噪功能。在另一些实施例中，电子设备100还可以设置三个，四个或更多麦克风1260C，实现采集声音信号，降噪，还可以识别声音来源，实现定向录音功能等。耳机接口1260D用于连接有线耳机。耳机接口1260D可以是USB接口130，也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform，OMTP)标准接口，还可以是美国蜂窝电信工业协会(cellular telecommunications industry association of the USA，CTIA)标准接口。

本申请实施例中的术语“多个”是指两个或两个以上。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系；在公式中，字符“/”，表示前后关联对象是一种“相除”的关系。

可以理解的是，本申请实施例中涉及的各种数字编号仅为描述方便进行的区分，并不用来限制本申请的实施例的范围。可以理解的是，在本申请实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请的实施例的实施过程构成任何限定。

Claims

一种音频处理方法，其特征在于，包括：

接收用户输入的音频播放请求，根据音效的设置信息或用户历史播放音频的信息，获取音效参数，所述音频播放请求用于请求播放音频；

采用所述音效参数，播放所述音频。
根据权利要求1所述的方法，其特征在于，所述根据音效的设置信息或用户历史播放音频的信息，获取音效参数之前，还包括：

根据所述音效的设置信息，确定所述用户是否已设置音效；

所述根据音效的设置信息或用户历史播放音频的信息，获取音效参数，包括：

若确定所述用户已设置音效，则根据所述音效的设置信息，获取所述已设置音效对应的音效参数；

若确定所述用户未设置音效，则根据预设时间段内的所述用户历史播放音频的信息，获取所述用户的偏好音效对应的音效参数。
根据权利要求2所述的方法，其特征在于，所述音效的设置信息包括所述已设置音效，以及与所述已设置音效关联的至少一个第一应用程序，所述根据所述音效的设置信息，确定所述用户是否已设置音效，包括：

确定所述至少一个第一应用程序是否包括所述用户请求播放音频的应用程序；

若是，则确定所述用户已设置音效。
根据权利要求2或3所述的方法，其特征在于，所述方法还包括：

若确定所述音效的设置信息超出保存时长，则根据预设时间段内的所述用户历史播放音频的信息，获取所述用户的偏好音效对应的音效参数。
根据权利要求2-4中任一项所述的方法，其特征在于，所述根据所述音效的设置信息，获取所述已设置音效对应的音效参数，包括：

根据音效参数集合和所述已设置音效，获取所述已设置音效对应的音效参数，所述音效参数集合中包括各音效对应的音效参数。
根据权利要求2-4中任一项所述的方法，其特征在于，所述根据预设时间段内的所述用户历史播放音频的信息，获取所述用户的偏好音效对应的音效参数，包括：

根据所述用户历史播放音频的信息，获取所述用户的偏好音效；

根据音效参数集合和所述用户的偏好音效，获取所述偏好音效对应的音效参数，所述音效参数集合中包括各音效对应的音效参数。
根据权利要求6所述的方法，其特征在于，所述用户历史播放音频的信息为用户历史播放音频，所述根据所述用户历史播放音频的信息，获取所述用户的偏好音效，包括：

将所述用户历史播放音频输入至音效预测模型，获取所述用户的偏好音效。
根据权利要求6所述的方法，其特征在于，所述用户历史播放音频的信息为所述用户历史播放音频的音效标签，所述音效标签用于表征音效，所述根据所述用户历史播放音频的信息，获取所述用户的偏好音效，包括：

将数量最多的音效标签对应的音效作为所述用户的偏好音效。
根据权利要求8所述的方法，其特征在于，所述方法还包括：

采集所述用户历史播放音频，且将所述用户历史播放音频输入至音效识别模型，获取所述用户历史播放音频的音效标签。
根据权利要求1-4中任一项所述的方法，其特征在于，所述用户历史播放音频的信息为用户历史播放音频，根据用户历史播放音频的信息，获取所述音效参数，包括：

将所述用户历史播放音频输入至音效参数预测模型，获取所述用户的偏好音效对应的音效参数。
根据权利要求1-10中任一项所述的方法，其特征在于，所述采用所述音效参数，播放所述音频之前，还包括：

将当前音效参数修改为所述音效参数；或者，

在预设的多组音效参数中选择所述音效参数，每组音效参数对应一个音效。
根据权利要求1-11中任一项所述的方法，其特征在于，所述音效参数包括如下至少一项：动态范围控制DRC参数、均衡器EQ参数、主动降噪ANC参数。
一种播放音频的电子设备，其特征在于，所述电子设备包括音效组件：

所述电子设备，用于接收用户输入的音频播放请求，根据音效的设置信息或用户历史播放音频的信息，获取音效参数，所述音频播放请求用于请求播放音频；

所述音效组件，用于采用所述音效参数，播放所述音频。
根据权利要求13所述的电子设备，其特征在于，

还用于根据所述音效的设置信息，确定所述用户是否已设置音效；

具体用于若确定所述用户已设置音效，则根据所述音效的设置信息，获取所述已设置音效对应的音效参数；若确定所述用户未设置音效，则根据预设时间段内的所述用户历史播放音频的信息，获取所述用户的偏好音效对应的音效参数。
根据权利要求14所述的电子设备，其特征在于，所述音效的设置信息包括所述已设置音效，以及与所述已设置音效关联的至少一个第一应用程序；

具体用于确定所述至少一个第一应用程序是否包括所述用户请求播放音频的应用程序；若所述至少一个第一应用程序包括所述用户请求播放音频的应用程序，则确定所述用户已设置音效。
根据权利要求14或15所述的电子设备，其特征在于，

还用于若确定所述音效的设置信息超出保存时长，则根据预设时间段内的所述用户历史播放音频的信息，获取所述用户的偏好音效对应的音效参数。
根据权利要求14-16中任一项所述的电子设备，其特征在于，

具体用于根据音效参数集合和所述已设置音效，获取所述已设置音效对应的音效参数，所述音效参数集合中包括各音效对应的音效参数。
根据权利要求14-16中任一项所述的电子设备，其特征在于，

具体用于根据所述用户历史播放音频的信息，获取所述用户的偏好音效；根据音效参数集合和所述用户的偏好音效，获取所述偏好音效对应的音效参数，所述音效参数集合中包括各音效对应的音效参数。
根据权利要求18所述的电子设备，其特征在于，所述用户历史播放音频的信息为用户历史播放音频；

具体用于将所述用户历史播放音频输入至音效预测模型，获取所述用户的偏好音效。
根据权利要求18所述的电子设备，其特征在于，所述用户历史播放音频的信息为所述用户历史播放音频的音效标签，所述音效标签用于表征音效；

具体用于将数量最多的音效标签对应的音效作为所述用户的偏好音效。
根据权利要求20所述的电子设备，其特征在于，

还用于采集所述用户历史播放音频，且将所述用户历史播放音频输入至音效识别模型，获取所述用户历史播放音频的音效标签。
根据权利要求13-16中任一项所述的电子设备，其特征在于，所述用户历史播放音频的信息为用户历史播放音频；

还用于将所述用户历史播放音频输入至音效参数预测模型，获取所述用户的偏好音效对应的音效参数。
根据权利要求13-22中任一项所述的电子设备，其特征在于，

还用于将当前音效参数修改为所述音效参数；或者，在预设的多组音效参数中选择所述音效参数，每组音效参数对应一个音效。
根据权利要求13-23中任一项所述的电子设备，其特征在于，所述音效组件包括如下至少一项：动态范围控制DRC模块、均衡器EQ模块、主动降噪ANC模块，所述DRC模块的音效参数为DRC参数、所述EQ模块的音效参数为EQ参数、所述ANC模块的音效参数为ANC参数。
一种计算机可读存储介质，其特征在于，所述计算机存储介质存储有计算机指令，当所述计算机指令被计算机执行时，使得所述计算机执行权利要求1-12中任一项所述的方法。
一种程序产品，其特征在于，所述程序产品包括计算机程序，所述计算机程序存储在可读存储介质中，通信装置的至少一个处理器可以从所述可读存储介质读取所述计算机程序，所述至少一个处理器执行所述计算机程序使得通信装置实施如权利要求1-12任意一项所述的方法。