CN115497487A

CN115497487A - 音频信号处理方法、装置、电子设备及可读存储介质

Info

Publication number: CN115497487A
Application number: CN202211104870.4A
Authority: CN
Inventors: 彭江
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Mobile Communication Co Ltd
Priority date: 2022-09-09
Filing date: 2022-09-09
Publication date: 2022-12-20

Abstract

本申请公开了一种音频信号处理方法、装置、电子设备及可读存储介质，属于通信技术领域。该方法包括：获取第一音频信号对应的第一音频信号帧序列，上述第一音频信号帧序列包括n个音频信号帧，n为大于1的整数；基于上述第一音频信号帧序列对应的第一重叠比例，和第一音频信号的播放速率参数，得到第二重叠比例；根据上述第二重叠比例，对第一音频信号帧序列进行合成处理，得到第二音频信号；其中，上述第一重叠比例为：上述n个音频信号帧中相邻两个音频信号帧之间的重叠比例。

Description

音频信号处理方法、装置、电子设备及可读存储介质

技术领域

本申请属于音频处理技术领域，具体涉及一种音频信号处理方法、装置、电子设备及可读存储介质。

背景技术

随着电子设备性能的不断提升，高清电视、耳机、音箱和手机等已经可以支持较高采样率的音频的播放。

在相关技术中，在对音频进行倍速播放处理时，通常是采用波形相似叠加算法WSOLA，WSOLA算法在每次迭代过程中选择与前一帧合成信号最匹配的信号合成下一帧的音频数据。然而，该处理算法对于较高采样率的音频信号进行相似匹配计算时需要庞大的运算量，导致对音频信号的处理效率低。

发明内容

本申请实施例的目的是提供一种音频信号处理方法、装置、电子设备及可读存储介质，能够解决对音频信号的处理效率低的问题。

第一方面，本申请实施例提供了一种音频信号处理方法，该方法包括：获取第一音频信号对应的第一音频信号帧序列，上述第一音频信号帧序列包括n个音频信号帧，n为大于1的整数；基于上述第一音频信号帧序列对应的第一重叠比例，和第一音频信号的播放速率参数，得到第二重叠比例；根据上述第二重叠比例，对第一音频信号帧序列进行合成处理，得到第二音频信号；其中，上述第一重叠比例为：上述n个音频信号帧中相邻两个音频信号帧之间的重叠比例。

第二方面，本申请实施例提供了一种音频信号处理装置，该装置包括：获取模块、确定模块和处理模块，其中：上述获取模块，用于获取第一音频信号对应的第一音频信号帧序列，上述第一音频信号帧序列包括n个音频信号帧，n为大于1的整数；上述确定模块，用于基于上述获取模块获取的第一音频信号帧序列对应的第一重叠比例，和上述第一音频信号的播放速率参数，得到第二重叠比例；上述处理模块，用于根据第二重叠比例，对第一音频信号帧序列进行合成处理，得到第二音频信号；其中，上述第一重叠比例为：上述n个音频信号帧中相邻两个音频信号帧之间的重叠比例。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

第四方面，本申请实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

第五方面，本申请实施例提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法。

第六方面，本申请实施例提供一种计算机程序产品，该程序产品被存储在存储介质中，该程序产品被至少一个处理器执行以实现如第一方面所述的方法。

在本申请实施例中，音频信号处理装置获取第一音频信号对应的第一音频信号帧序列，该第一音频信号帧序列包括n个音频信号帧，n为大于1的整数，并基于上述第一音频信号帧序列对应的第一重叠比例，和上述第一音频信号的播放速率参数，得到第二重叠比例，然后根据上述第二重叠比例，对上述第一音频信号帧序列进行合成处理，得到第二音频信号；其中，上述第一重叠比例为：上述n个音频信号帧中相邻两个音频信号帧之间的重叠比例。通过该方法，音频信号处理装置可以根据n个音频信号帧中相邻两个音频信号帧之间的重叠比例和音频播放倍率参数，确定第二重叠比例，并根据该第二重叠比例对n个音频信号帧进行合成处理，实现音频对音频信号帧序列的压缩或者扩展，从而得到按照音频播放倍率参数播放的音频信号，整个算法过程相对简单且运算量小，极大提高对音频信号的处理效率。

附图说明

图1为本申请实施例提供的音频信号处理方法的流程示意图之一；

图2为本申请实施例提供的音频倍速播放原理的示意图；

图3为本申请实施例提供的音频信号处理方法的流程示意图之二；

图4为本申请实施例提供的音频信号处理装置的结构示意图；

图5为本申请实施例提供的电子设备的结构示意图；

图6为本申请实施例提供的电子设备的硬件结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

在移动互联网时代，随着智能穿戴设备的推广和普及，智能手表逐渐能成为用户生活和工作中高频使用的随身电子设备。随着行业技术的发展，用户在智能手表上体验流畅的音频类应用功能的需求日益增长。目前，市面上的嵌入式智能穿戴设备普遍已带有音频类应用软件，其音频功能支持播控、下载、切歌等基础功能。

在相关技术中，嵌入式穿戴设备由于性能、功耗、体积上具有诸多限制，目前市面上的智能手表音频类应用功能，仅支持播控、下载、切歌等基础功能，而不支持倍速播放等需要较大运算量且占用设备较大运行内存RAM的功能，对于在特殊场景下，用户需要主动加快播放速度或者减慢播放速度，智能手表应用和系统却不支持倍速播放功能，无法给用户带来完整且全面的音频功能使用体验，影响智能手表的用户体验，对产品口碑也会造成一定程度的负面影响。

在本申请实施例提供的音频信号处理方法中，音频信号处理装置可以根据n个音频信号帧中相邻两个音频信号帧之间的重叠比例和音频播放倍率参数，确定第二重叠比例，并根据该第二重叠比例对n个音频信号帧进行合成处理，实现音频对音频信号帧序列的压缩或者扩展，从而得到按照音频播放倍率参数播放的音频信号，整个算法过程相对简单且运算量小，并且占用设备较小的运行内存，能够在嵌入式电子设备中运行，使得嵌入式电子设备能够支持音频倍速播放功能，并且极大提高对音频信号的处理效率。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的音频信号处理方法进行详细地说明。

图1为本申请实施例提供的音频信号处理方法的示意图。如图1所示，本申请实施例提供的音频信号处理方法包括以下步骤201至步骤203：

步骤201：音频信号处理装置获取第一音频信号对应的第一音频信号帧序列。

其中，上述第一音频信号帧序列包括n个音频信号帧，n为大于1的整数。

可选地，在本申请实施例中，上述第一音频信号为流式音频信号。

需要说明的是，由于信号属于数据，因此，上述第一音频信号也可以称为第一音频信号数据。

可选地，在本申请实施例中，上述第一音频信号帧序列为对上述第一音频信号进行分帧处理后得到的音频信号帧序列。

可选地，在本申请实施例中，上述n个音频信号帧中的每个音频信号帧为承载音频信息的音频信号帧。

可选地，在本申请实施例中，音频信号处理装置可以对上述第一音频信号进行分帧处理，得到上述第一音频信号帧序列。

需要说明的是，对于分帧处理的相关描述可以参见相关技术，本申请实施例对此不再赘述。

步骤202：音频信号处理装置基于上述第一音频信号帧序列对应的第一重叠比例，和第一音频信号的播放速率参数，得到第二重叠比例。

其中，上述第一重叠比例为：上述n个音频信号帧中相邻两个音频信号帧之间的重叠比例。

可选地，在本申请实施例中，上述第一重叠比例为对第一音频信号进行分帧处理时，处理后得到的n个音频信号帧中相邻两个音频信号帧之间重叠区域的长度在音频信号帧的长度中的占比。

可选地，在本申请实施例中，上述第一重叠比例为：第一音频信号帧序列中的相邻帧和上一帧的重叠长度在音频信号帧的长度的占比，上述第一重叠比例可以记为S1。

示例性地，第一音频信号帧序列包括n个音频信号帧，第1个音频信号帧对应的时长为0ms-20ms，第2个音频信号帧对应的时长为1ms-21ms，则第1个音频信号帧和第2个音频信号帧的重叠部分的时长为1-20ms，重叠长度为19ms，重叠比例为19/20。

需要说明的是，上述第2个音频信号帧为上述相邻帧，上述第1个音频信号帧为上述上一帧。

可选地，在本申请实施例中，上述第一重叠比例为预定义的，上述第一重叠比例的数值处于第一预设区间。

示例性地，上述第一预设区间可以为60％至85％，或者，上述第一预设区间可以为70％至80％。示例性地，第一重叠比例可以为70％，75％或者80％等。

可选地，在本申请实施例中，上述播放速率参数可以包括：播放倍数比例。

可选地，在本申请实施例中，音频信号处理装置根据用户对播放倍速控件的选择输入，或者根据用户输入的播放倍速信息，确定第一音频信号的播放倍速，第一音频信号的播放倍速可以记为M。

示例性地，上述播放倍数比例可以为x0.5倍、x1.5倍、x2倍以及x3倍等等，本申请实施例对此不做限定。

可选地，在本申请实施例中，上述第一重叠比例为对分帧处理得到的n个音频信号帧进行合帧处理时，相邻两个音频信号帧之间重叠区域的长度在音频信号帧的长度中的占比。

可选地，在本申请实施例中，音频信号处理装置可以通过倍速比例公式，即下文中的公式(8)，基于上述第一音频信号帧序列对应的第一重叠比例，和第一音频信号的播放倍速，计算得出上述第二重叠比例，上述第二重叠比例可以记为S2。

在本申请的一些实施例中，音频信号处理装置可以将上述第一重叠比例和上述播放倍速代入倍速比例公式，计算得出上述第二重叠比例。

需要说明的是，对第二重叠比例的计算过程具体可以参见下文描述，此处不再赘述。

步骤203：音频信号处理装置根据上述第二重叠比例，对第一音频信号帧序列进行合成处理，得到第二音频信号。

可选地，在本申请实施例中，上述合成处理可以为合帧处理。

在本申请的一些实施例中，音频信号处理装置根据上述第二重叠比例，对第一音频信号帧序列中的n个音频信号帧进行合帧处理，即对n个音频信号帧依次进行叠加合成处理，得到上述第二音频信号。

需要说明的是，对第一音频信号帧序列进行合成处理的相关描述具体可以参见相关技术，此处不再赘述。

需要说明的是，根据第二重叠比例对第一音频信号帧序列中的n个音频信号帧依次进行叠加合成处理过程，可以理解为对第一音频信号帧序列进行压缩或者扩展的过程。对第一音频信号帧序列进行的为压缩还是扩展处理，取决于第一重叠比例和第二重叠比例的大小关系，在第一重叠比例大于第二重叠比例的情况下，为对第一音频信号帧序列进行扩展，即最终实现的是音频的慢放，在第一重叠比例小于第二重叠比例的情况下，为对第一音频信号帧序列进行压缩，最终实现的是音频的快放。

以下对本申请实施例提供的倍速比例公式的推导过程进行详细说明：

图2是本申请实施例提供的一种音频倍速播放原理的示意图。

在图2中，T1表示单位时间长度的音频信号数据，即第一音频信号，T2表示经过音频信号帧序列压缩/扩展之后的音频信号数据长度，根据压缩/扩展比例动态计算之后得出。F1表示音频信号数据进行分帧操作之后的某一帧数据，同理，F2、F3为音频信号帧序列中的连续帧数据枚举。Fn表示音频信号数据的n个音频信号帧中的最后一帧。W1表示音频信号数据进行分帧操作之后一个音频信号帧的时长，即，音频信号帧长度，长度区间在20ms-50ms之前动态选取，W2表示音频信号进行分帧操作时相邻帧与上一帧重叠的长度，W3表示音频信号帧序列数据进行合帧操作时候相邻帧与上一帧重叠的长度。

在对第一音频信号进行分帧处理时，相邻帧与上一帧的重叠比例记为S1，根据分帧原理可以得到以下公式(1)：

音频信号帧序列数据进行合帧操作时候相邻帧与上一帧重叠比例记为S2，同理根据合帧原理可以得到公式(2)：

在对第一音频信号数据经过一系列分帧和合帧操作之后，假设其音频时长从合帧前的时长T1变为合帧后的时长T2，其中T2时长相比T1时长较大则表示音频信号经过处理之后音频时长变长，即音频进行减慢倍速播放；T2时长相比T1时长较小则表示音频进行加快倍速播放。根据音频播放倍速比例与合帧前后音频信号的时长之间的关系，可以得到以下公式(3)：

同时根据分帧的原理可知，音频信号总时长为相邻帧与上一帧未重叠部分的时长再加上最后一个完整帧的时长，记为整个音频信号的总时长，第一音频信号的总时长T1可以通过公式(4)计算得到，第二音频信号的总时长T2可以通过公式(5)计算得到：

T1＝W1*(1-S1)*(n-1)+W1 (4)

T2＝W1*(1-S2)*(n-1)+W1 (5)

将公式(4)和公式(5)代入公式(3)，可以得到倍速比例关系公式(6)：

将上述倍速比例关系公式(6)经过化简计算之后得出以下公式(7)：

其中，n代表一段音频信号数据进行分帧之后的总帧数，以播放音乐为例，一般音乐时长在3分钟左右。

假设待处理的音频数据的音频时长为3分钟，则可以得到：

T1＝3*60*1000ms＝180000ms，假设音频信号数据进行分帧时的帧窗口长度定为20ms，即W1＝20ms；分帧时的初始重叠比例S1设定为75％，则根据上述公式(4)可以得到计算总时长为：180000＝20*(1–75％)*(n-1)+20，计算得出此时总帧数n＝35997，将此总帧数带入公式(7)中，由于1/(n-1)部分的数值非常小，对最终重叠比例的计算影响非常有限，因此倍速比例计算公式可忽略1/(n-1)部分的影响，最终可以将公式(7)简化为以下公式(8)：

音频信号数据采用如上重叠比例S1进行分帧操作，再采用如上所述S2重叠比例进行合帧操作，可实现对应M倍速的音频倍速播放功能。

在通过该倍数比例计算公式计算第二重叠比例时，由于未知量仅包括第一重叠比例和播放倍速比例，因此，运算相对简单且运算量小，对电子设备的运行空间占用少且处理效率高。

在本申请实施例提供的音频信号处理方法中，音频信号处理装置获取第一音频信号对应的第一音频信号帧序列，该第一音频信号帧序列包括n个音频信号帧，n为大于1的整数，并基于上述第一音频信号帧序列对应的第一重叠比例，和上述第一音频信号的播放速率参数，得到第二重叠比例，然后根据上述第二重叠比例，对上述第一音频信号帧序列进行合成处理，得到第二音频信号；其中，上述第一重叠比例为：上述n个音频信号帧中相邻两个音频信号帧之间的重叠比例。通过该方法，音频信号处理装置可以根据n个音频信号帧中相邻两个音频信号帧之间的重叠比例和音频播放倍率参数，确定第二重叠比例，并根据该第二重叠比例对n个音频信号帧进行合成处理，实现音频对音频信号帧序列的压缩或者扩展，从而得到按照音频播放倍率参数播放的音频信号，整个算法过程相对简单且运算量小，极大提高对音频信号的处理效率。

可选地，在本申请实施例中，上述步骤201可以包括以下步骤201a和步骤201b：

步骤201a：音频信号处理装置确定目标窗口时长。

步骤201b：音频信号处理装置根据目标窗口时长和上述第一重叠比例对第一音频信号进行分帧处理，得到第一音频信号帧序列。

示例性地，上述目标窗口时长的取值范围可以在20ms-50ms之间。

需要说明的是，目标窗口时长的取值可以包括20ms和50ms。

示例性地，上述第一重叠比例，即初始合帧重叠比例可以设定为默认值75％。

示例性地，音频信号处理装置可以根据上述目标窗口时长以及第一重叠比例，对上述第一音频信号进行分段，得到n个音频信号帧。

需要说明的是，分帧时采用每一帧与上一帧进行一定比例重叠的方式来进行音频信号帧分割，在分帧时，通过设置相邻两帧之间有75％的重叠部分，可以使得相邻帧的音频振幅和相位尽量平滑和稳定，从而使得相邻两帧在播放时可以平滑过渡。

如此，信号处理装置在接收到流式音频信号数据后，每次选取一段时间长度较小的音频信号数据进行分帧处理，从而减小处理过程中的运算复杂度，进而降低对电子设备内存的占用，并且提高处理效率。

可选地，在本申请实施例中，在对第一音频信号进行分帧时采用每一帧与上一帧进行一定比例重叠的方式来进行音频信号帧分割，在分帧完成之后，音频信号处理装置将分帧处理得到的音频信号帧序列进行合帧操作，具体地，将每一帧与上一帧按照一定比例进行重叠，在完成上述分帧与合帧操作之后，即实现了音频信号帧序列压缩和扩展的目的，最后输出一段完整连续的全新的音频信号数据，送入音频流式播放框架中进行播放。

可选地，在本申请实施例中，上述步骤201b之后，本申请实施例提供的音频信号处理方法还包括以下步骤201c1和步骤201c2：

步骤201c1：音频信号处理装置判断上述第一音频信号帧序列中的目标音频信号帧的时长是否等于上述目标窗口时长。

步骤201c2：在上述目标音频信号帧的时长小于目标窗口时长的情况下，音频信号处理装置则对上述目标音频信号帧进行补零处理。

示例性地，上述目标音频信号帧可以为第一音频信号帧序列中的最后一个音频信号帧。

示例性地，在目标音频信号帧的时长小于预设的目标窗口时长的情况下，对该目标音频信号帧进行补零处理，以将该目标音频信号帧组成一个完整有效的音频信号帧，从而保证能够在后续进行有效处理。

需要说明的是，在对音频信号进行分帧处理时，可能存在得到的最后一个音频信号帧的时长不足一帧的情况，从而会对后续对音频信号帧的处理造成影响，导致运算精度较差。例如，对音频信号分帧处理时选取的窗口为20ms，分帧处理后得到的最后一个音频信号帧的时长为19ms。

可选地，在申请实施例中，上述步骤203可以包括以下步骤203a和步骤203b：

步骤203a：音频信号处理装置根据第二重叠比例，对第一音频信号帧序列进行合成处理，得到第三音频信号。

步骤203b：音频信号处理装置在检测到第三音频信号中包括无效数据的情况下，丢弃上述无效数据，以得到所述第二音频信号。

示例性地，上述无效数据可以为补零数据，例如，上述无效数据为在第三音频信号的末尾插入的补零数据。

示例性地，在对第一音频信号帧序列进行合帧处理的情况下，音频信号处理装置对第一音频帧序列中的音频信号帧进行合并，得到第三音频信号，然后对第三音频信号进行非法数据检查，若第三音频信号不存在无效数据，则将第三音频信号作为最终得到的音频信号，即第二音频信号，若第三音频信号中存在无效数据，则对无效数据进行丢弃，以得到不存在无效数据的第二音频信号。

示例性地，音频信号处理装置检查合帧之后音频数据末尾数据是否为补零的无效数据，如检测到末尾有补零数据段，则从尾部反向轮询数据直至所检测数据为有效数据，丢弃轮询过的无效数据段。

举例说明，假设在对第一音频信号进行分帧处理后，得到的最后一个音频信号帧的时长不满足一帧的时长要求，则在该最后一个音频信号帧的末尾进行补零处理，在后续对包括该最后一个音频信号帧的音频信号帧序列进行合帧时，得到的音频信号中会存在进行补零处理后的补零数据，该数据为无效数据，则可以在检测到该补零数据的情况下，将该补零数据丢弃，从而保证音频信号的有效性。

如此，音频信号处理装置可以将音频信号数据中的无效数据丢弃，从而提高音频信号数据的有效性。

可选地，在本申请实施例中，上述播放速率参数包括：播放倍速比例；

可选地，上述步骤202可以包括以下步骤202b1和步骤202b2：

步骤202b1：计算第一差值和上述播放倍速比例之间的比值。

步骤202b2：基于上述比值，得到第二重叠比例。

其中，上述第一差值为1与第一重叠比例的差，上述第二重叠比例为1与上述比值的差。

在本申请的一些实施例中，以第一重叠比例S1为75％为例，在播放倍速比例M取值为0.5时，第一差值等于1减去S1，即1减去75％等于25％，第一差值与播放倍速比例M的比值为25％/0.5，第二重叠比例S2等于1减去25％/0.5，由此计算得出S2为50％，即第二重叠比例S2为50％。

示例性地，音频信号处理装置可以通过倍速比例计算公式(8)计算得出上述第二重叠比例。

在本申请的一些实施例中，以第一重叠比例S1为75％为例，在播放倍速比例M取值为0.5时，音频信号处理装置将第一重叠比例S1和播放倍速比例M代入上述公式(8)可以得到以下关系式：

根据该关系式可以计算得出S2等于50％，即第二重叠比例S2为50％。同理，以第一重叠比例S1为75％为例，在播放倍速比例M取值为1.5时，第二重叠比例S2约等于83.33％；在播放倍速比例M取值为2时，第二重叠比例S2约等于87.5％，在播放倍速比例M取值为3时，第二重叠比例S2约等于91.67％.

需要说明的是，上述播放倍速比例仅为本申请提供的一些示例，播放倍速比例可以根据实际需求选取其他取值，例如，0.75，2.5等，本申请实施例对此不做限定。

示例性地，在得到上述第二重叠比例的情况下，音频信号处理装置对音频信号数据(即第一音频信号)采用如上重叠比例S1进行分帧操作，再采用如上重叠比例S2进行合帧操作，实现对应M倍速的音频倍速播放功能。

如此，音频信号处理装置可以通过如上方式计算得出合帧处理时，相邻帧之间的重叠比例，实现通过对分帧和合帧时的重叠比例的控制，来实现音频的倍速播放功能。

可选地，在本申请实施例中，在上述播放倍速比例小于1的情况下，上述第二音频信号的音频时长大于第一音频信号的音频时长。

在所述播放倍速比例大于1的情况下，所述第二音频信号的音频时长小于所述第一音频信号的音频时长。

需要说明的是，音频信号的播放倍速比例小于1，表征音频信号需要慢放。

示例性地，以第一音频信号的音频时长为T1，第二音频信号的音频时长为T2为例，在对第一音频信号进行分帧处理之后，得到的第二音频信号的时长为T2，若T2大于T1，表示第一音频信号经过合帧处理之后音频时长变长，即音频进行减慢倍速播放，即播放倍速比例小于1。

示例性地，结合上述实施例，若T2小于T1，表示第一音频信号经过合帧处理之后音频时长变短，即音频进行加速倍速播放，即播放倍速比例大于1。

以下通过完整的实施例对本申请实施例提供的音频信号处理方法进行说明，如图3所示，该音频信号处理方法可以包括以下步骤11至步骤19：

步骤11、音频框架收到音频信号数据，开始进行分帧预处理

示例性地，选取分帧时窗口时间长度，取值范围在20ms-50ms之间，将初始合帧重叠比例设定为默认值75％。

步骤12、对音频信号数据进行分帧处理

示例性地，使用步骤11的预设参数，将音频信号数据进行分帧处理，得到处理之后的全部信号帧序列，获取总帧数n。

步骤13、判断最后一帧是否满足窗口时长要求

示例性地，若最后一帧时长如果小于预先设定的窗口时长参数，则对此信号帧数据进行补零处理，以期组成一个完整有效的信号帧序列，供下一步进行数据计算。

步骤14、使用倍速比例公式，计算合帧重叠比例S2

接收用户输入的音频播放速率调节倍数M，利用倍速比例公式(8)，计算得出合帧重叠比例S2。

步骤15、对信号帧序列进行合帧处理

示例性地，按照14步骤计算所得的重叠比例S2，对13步骤所获得的信号帧序列进行合并，最终获得一个完整的音频信号数据段。

步骤16、音频信号数据非法数据检查

示例性地，检查合帧之后音频数据末尾数据是否为补零的无效数据，如检测到末尾有补零数据段，则从尾部反向轮询数据直至所检测数据为有效数据，丢弃轮询过的无效数据段。

步骤17、音频信号数据播放

将经过合法性检查的信号数据送入音频框架流式播放接口进行播放。

步骤18、检测用户是否修改播放速率

步骤19、如有修改重新执行倍速播放流程

示例性地，若用户重新修改播放速率，则获取更新后的倍速M值，返回步骤11重新执行倍速播放流程。

在本申请实施例提供的音频信号处理方法中，音频信号处理装置能够通过较小的运算量实现音频倍速播放，尤其适用于嵌入式穿戴电子设备等运行内存以及性能有限的电子设备，能够丰富嵌入式电子设备上的音频播控功能，满足用户在播放音频时需要加快和减慢音频播放速度的需求，提升了穿戴设备的音视频应用功能的使用体验，对于三方音频音乐开发者来说，也可以实现更加丰富高级的音频功能。

本申请实施例提供的音频信号处理方法，执行主体可以为音频信号处理装置。本申请实施例中以音频信号处理装置执行音频信号处理方法为例，说明本申请实施例提供的音频信号处理装置。

图4为本申请实施例提供的音频信号处理装置的结构示意图，如图4所示，该音频信号处理装置可以包括：获取模块401、确定模块402和处理模块403，其中：

获取模块，用于获取第一音频信号对应的第一音频信号帧序列，第一音频信号帧序列包括n个音频信号帧，n为大于1的整数；

确定模块，用于基于获取模块获取的第一音频信号帧序列对应的第一重叠比例，和第一音频信号的播放速率参数，得到第二重叠比例；

处理模块，用于根据第二重叠比例，对第一音频信号帧序列进行合成处理，得到第二音频信号；

其中，第一重叠比例为：n个音频信号帧中相邻两个音频信号帧之间的重叠比例。

可选地，在本申请实施例中，

确定模块，还用于确定目标窗口时长；

处理模块，还用于根据确定模块确定的目标窗口时长和第一重叠比例系数对第一音频信号进行分帧处理，得到第一音频信号帧序列。

可选地，在本申请实施例中，

处理模块，还用于判断第一音频信号帧序列中的目标音频信号帧的时长是否等于目标窗口时长；

处理模块，还用于在目标音频信号帧的时长小于目标窗口时长的情况下，则对目标音频信号帧进行补零处理。

可选地，在本申请实施例中，

处理模块，具体用于根据所述第二重叠比例，对第一音频信号帧序列进行合成处理，得到第三音频信号；

处理模块，具体用于在检测到第三音频信号中包括无效数据的情况下，丢弃上述无效数据，以得到第二音频信号。

可选地，在本申请实施例中，

确定模块，具体用于计算第一差值和播放倍速比例的比值；

确定模块，具体用于基于比值，得到第二重叠比例；

其中，第一差值为1与第一重叠比例的差，第二重叠比例为1与比值的差。

在本申请实施例提供的音频信号处理装置中，音频信号处理装置获取第一音频信号对应的第一音频信号帧序列，该第一音频信号帧序列包括n个音频信号帧，n为大于1的整数，并基于上述第一音频信号帧序列对应的第一重叠比例，和上述第一音频信号的播放速率参数，得到第二重叠比例，然后根据上述第二重叠比例，对上述第一音频信号帧序列进行合成处理，得到第二音频信号；其中，上述第一重叠比例为：上述n个音频信号帧中相邻两个音频信号帧之间的重叠比例。通过该方法，音频信号处理装置可以根据n个音频信号帧中相邻两个音频信号帧之间的重叠比例和音频播放倍率参数，确定第二重叠比例，并根据该第二重叠比例对n个音频信号帧进行合成处理，实现音频对音频信号帧序列的压缩或者扩展，从而得到按照音频播放倍率参数播放的音频信号，整个算法过程相对简单且运算量小，极大提高对音频信号的处理效率。

本申请实施例中的音频信号处理装置可以是电子设备，也可以是电子设备中的部件，例如集成电路或芯片。该电子设备可以是终端，也可以为除终端之外的其他设备。示例性的，电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(Mobile Internet Device，MID)、增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobilepersonal computer，UMPC)、上网本或者个人数字助理(personal digital assistant，PDA)等，还可以为服务器、网络附属存储器(Network Attached Storage，NAS)、个人计算机(personal computer，PC)、电视机(television，TV)、柜员机或者自助机等，本申请实施例不作具体限定。

本申请实施例中的音频信号处理装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统，可以为ios操作系统，还可以为其他可能的操作系统，本申请实施例不作具体限定。

本申请实施例提供的音频信号处理装置能够实现图1至图3的方法实施例实现的各个过程，为避免重复，这里不再赘述。

可选地，如图5所示，本申请实施例还提供一种电子设备500，包括处理器501和存储器502，存储器502上存储有可在所述处理器501上运行的程序或指令，该程序或指令被处理器501执行时实现上述音频信号处理方法实施例的各个步骤，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要说明的是，本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。

图6为实现本申请实施例的一种电子设备的硬件结构示意图。

该电子设备100包括但不限于：射频单元101、网络模块102、音频输出单元103、输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、以及处理器110等部件。

本领域技术人员可以理解，电子设备100还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器110逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图6中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

其中，处理器110，用于获取第一音频信号对应的第一音频信号帧序列，第一音频信号帧序列包括n个音频信号帧，n为大于1的整数；

处理器110，用于基于处理器110获取的第一音频信号帧序列对应的第一重叠比例，和第一音频信号的播放速率参数，得到第二重叠比例；

处理器110，用于根据第二重叠比例，对第一音频信号帧序列进行合成处理，得到第二音频信号；

可选地，在本申请实施例中，

处理器110，还用于确定目标窗口时长；

处理器110，还用于根据处理器110确定的目标窗口时长和第一重叠比例系数对第一音频信号进行分帧处理，得到第一音频信号帧序列。

可选地，在本申请实施例中，

处理器110，具体用于计算第一差值和播放倍速比例的比值；

处理器110，具体用于基于比值，得到第二重叠比例；

可选地，在本申请实施例中，

在播放倍速比例小于1的情况下，第二音频信号的音频时长大于第一音频信号的音频时长；

在播放倍速比例大于1的情况下，第二音频信号的音频时长小于第一音频信号的音频时长。

可选地，在本申请实施例中，第一重叠比例为预定义的，第一重叠比例的数值处于第一预设区间。

在本申请实施例提供的电子设备中，电子设备获取第一音频信号对应的第一音频信号帧序列，该第一音频信号帧序列包括n个音频信号帧，n为大于1的整数，并基于上述第一音频信号帧序列对应的第一重叠比例，和上述第一音频信号的播放速率参数，得到第二重叠比例，然后根据上述第二重叠比例，对上述第一音频信号帧序列进行合成处理，得到第二音频信号；其中，上述第一重叠比例为：上述n个音频信号帧中相邻两个音频信号帧之间的重叠比例。通过该方法，电子设备可以根据n个音频信号帧中相邻两个音频信号帧之间的重叠比例和音频播放倍率参数，确定第二重叠比例，并根据该第二重叠比例对n个音频信号帧进行合成处理，实现音频对音频信号帧序列的压缩或者扩展，从而得到按照音频播放倍率参数播放的音频信号，整个算法过程相对简单且运算量小，极大提高对音频信号的处理效率。

应理解的是，本申请实施例中，输入单元104可以包括图形处理器(GraphicsProcessing Unit，GPU)1041和麦克风1042，图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元106可包括显示面板1061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板1061。用户输入单元107包括触控面板1071以及其他输入设备1072中的至少一种。触控面板1071，也称为触摸屏。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序或指令的第一存储区和存储数据的第二存储区，其中，第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外，存储器109可以包括易失性存储器或非易失性存储器，或者，存储器109可以包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本申请实施例中的存储器109包括但不限于这些和任意其它适合类型的存储器。

处理器110可包括一个或多个处理单元；可选的，处理器110集成应用处理器和调制解调处理器，其中，应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作，调制解调处理器主要处理无线通信信号，如基带处理器。可以理解的是，上述调制解调处理器也可以不集成到处理器110中。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述音频信号处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述音频信号处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

本申请实施例提供一种计算机程序产品，该程序产品被存储在存储介质中，该程序产品被至少一个处理器执行以实现如上述音频信号处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

1.一种音频信号处理方法，其特征在于，所述方法包括：

获取第一音频信号对应的第一音频信号帧序列，所述第一音频信号帧序列包括n个音频信号帧，n为大于1的整数；

基于所述第一音频信号帧序列对应的第一重叠比例，和所述第一音频信号的播放速率参数，得到第二重叠比例；

根据所述第二重叠比例，对所述第一音频信号帧序列进行合成处理，得到第二音频信号；

其中，所述第一重叠比例为：所述n个音频信号帧中相邻两个音频信号帧之间的重叠比例。

2.根据权利要求1所述的方法，其特征在于，所述获取第一音频信号对应的第一音频信号帧序列，包括：

确定目标窗口时长；

根据所述目标窗口时长和第一重叠比例对所述第一音频信号进行分帧处理，得到所述第一音频信号帧序列。

3.根据权利要求2所述的方法，其特征在于，所述根据所述目标窗口时长和第一重叠比例对所述第一音频信号进行分帧处理，得到所述第一音频信号帧序列之后，所述方法包括：

判断所述第一音频信号帧序列中的目标音频信号帧的时长是否等于所述目标窗口时长；

在所述目标音频信号帧的时长小于所述目标窗口时长的情况下，对所述目标音频信号帧进行补零处理。

4.根据权利要求1所述的方法，其特征在于，所述根据所述第二重叠比例，对所述第一音频信号帧序列进行合成处理，得到第二音频信号，包括：

根据所述第二重叠比例，对所述第一音频信号帧序列进行合成处理，得到第三音频信号；

在检测到所述第三音频信号中包括无效数据的情况下，丢弃所述无效数据，以得到所述第二音频信号。

5.根据权利要求1所述的方法，其特征在于，所述播放速率参数包括：播放倍速比例；

所述基于所述第一音频信号帧序列对应的第一重叠比例，和所述第一音频信号的播放速率参数，得到第二重叠比例，包括：

计算第一差值和所述播放倍速比例的比值；

基于所述比值，得到第二重叠比例；

其中，所述第一差值为1与所述第一重叠比例的差，所述第二重叠比例为1与所述比值的差。

6.一种音频信号处理装置，其特征在于，所述装置包括：获取模块、确定模块和处理模块，其中：

所述获取模块，用于获取第一音频信号对应的第一音频信号帧序列，所述第一音频信号帧序列包括n个音频信号帧，n为大于1的整数；

所述确定模块，用于基于所述获取模块获取的所述第一音频信号帧序列对应的第一重叠比例，和所述第一音频信号的播放速率参数，得到第二重叠比例；

所述处理模块，用于根据所述第二重叠比例，对所述第一音频信号帧序列进行合成处理，得到第二音频信号；

7.根据权利要求6所述的装置，其特征在于，

所述确定模块，还用于确定目标窗口时长；

所述处理模块，还用于根据所述确定模块确定的所述目标窗口时长和所述第一重叠比例系数对所述第一音频信号进行分帧处理，得到所述第一音频信号帧序列。

8.根据权利要求7所述的装置，其特征在于，

所述处理模块，还用于判断所述第一音频信号帧序列中的目标音频信号帧的时长是否等于所述目标窗口时长；

所述处理模块，还用于在所述目标音频信号帧的时长小于所述目标窗口时长的情况下，对所述目标音频信号帧进行补零处理。

9.根据权利要求6所述的装置，其特征在于，

所述处理模块，具体用于根据所述第二重叠比例，对所述第一音频信号帧序列进行合成处理，得到第三音频信号；

所述处理模块，具体用于在检测到所述第三音频信号中包括无效数据的情况下，丢弃所述无效数据，以得到所述第二音频信号。

10.根据权利要求6所述的装置，其特征在于，

所述确定模块，具体用于计算第一差值和所述播放倍速比例的比值；

所述确定模块，具体用于基于所述比值，得到第二重叠比例；

11.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1-5任一项所述的音频信号处理方法的步骤。

12.一种可读存储介质，其特征在于，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1-5任一项所述的音频信号处理方法的步骤。