CN106887244B

CN106887244B - 音频切换方法及装置

Info

Publication number: CN106887244B
Application number: CN201510934171.6A
Authority: CN
Inventors: 冯穗豫
Original assignee: Guangzhou Kugou Computer Technology Co Ltd
Current assignee: Guangzhou Kugou Computer Technology Co Ltd
Priority date: 2015-12-15
Filing date: 2015-12-15
Publication date: 2019-08-30
Anticipated expiration: 2035-12-15
Also published as: WO2017101260A1; CN106887244A

Abstract

本发明公开了一种音频切换方法及装置，属于互联网技术领域。该方法包括：获取待播放的音频文件，该音频文件由伴奏音频片段和原唱音频片段拼接组成，该伴奏音频片段位于该原唱音频片段之前；根据用户的播放选择操作，播放该伴奏音频片段和原唱音频片段中任一片段；如果在播放过程中检测到音频切换操作，获取当前所播放的音频片段的播放长度；从该音频文件的目标位置继续进行播放，该目标位置为与该当前所播放的音频片段的播放长度所对应的另一音频片段上的播放位置。本发明的技术方案使得终端仅使用一个音频文件就可以实现伴奏与原唱之间的切换，从而不需要同时解码两个音频文件，也不需要解码器支持多声道和多音频流的解码能力，因此对所有的应用均具有适配性。

Description

音频切换方法及装置

技术领域

本发明涉及互联网技术领域，特别涉及一种音频切换方法及装置。

背景技术

随着生活水平的提高，K歌在人们的生活中已经越来越普遍，而且越来越多的用户选择通过终端应用进行K歌，从而足不出户就能享受K歌的乐趣，在K歌演唱过程中，用户一般选择播放歌曲伴奏，然而，当出现用户不会演唱的歌曲段落时，用户则需要将歌曲伴奏切换至歌曲原唱。

为了实现歌曲伴奏与歌曲原唱之间的切换，需要使用两个独立的音频文件，即伴奏文件和原唱文件，该原唱文件包括歌曲伴奏及歌曲人声演唱，并同时对这两个音频文件进行解码，当检测到用户的切换操作时，即从伴奏文件的当前播放位置跳转至原唱文件相同的播放位置，以保证播放的连续性。

在实现本发明的过程中，发明人发现现有技术至少存在以下问题：

对于一些应用来说，并不支持同时对两个音频文件进行解码，对于这些应用而言，上述相关技术无法实现歌曲伴奏与歌曲原唱的切换，因此，相关技术的适配性较差。

发明内容

为了解决现有技术的问题，本发明实施例提供了一种音频切换方法及装置。所述技术方案如下：

一方面，提供了一种音频切换方法，所述方法包括：

获取待播放的音频文件，所述音频文件由伴奏音频片段和原唱音频片段拼接组成，所述伴奏音频片段位于所述原唱音频片段之前；

根据用户的播放选择操作，播放所述伴奏音频片段和原唱音频片段中任一片段；

如果在播放过程中检测到音频切换操作，获取当前所播放的音频片段的播放长度，所述播放长度为当前播放位置距所述音频文件起始位置的距离；

从所述音频文件的目标位置继续进行播放，所述目标位置为与所述当前所播放的音频片段的播放长度所对应的另一音频片段上的播放位置。

另一方面，提供了一种音频切换装置，所述装置包括：

音频文件获取模块，用于获取待播放的音频文件，所述音频文件由伴奏音频片段和原唱音频片段拼接组成，所述伴奏音频片段位于所述原唱音频片段之前；

播放模块，用于根据用户的播放选择操作，播放所述伴奏音频片段和原唱音频片段中任一片段；

播放长度获取模块，用于如果在所述播放模块播放过程中检测到音频切换操作，获取当前所播放的音频片段的播放长度，所述播放长度为当前播放位置距所述音频文件起始位置的距离；

所述播放模块，还用于从所述音频文件获取模块获取的所述音频文件的目标位置继续进行播放，所述目标位置为与所述当前所播放的音频片段的播放长度所对应的另一音频片段上的播放位置。

本发明实施例提供的技术方案带来的有益效果是：

通过提供由伴奏音频片段和原唱音频片段拼接而成的音频文件，且当检测到音频切换操作时，在同一个音频文件内部进行播放进度的跳转，使得终端仅使用一个音频文件就可以实现伴奏与原唱之间的切换，从而不需要同时解码两个音频文件，也不需要解码器支持多声道和多音频流的解码能力，因此对所有的应用均具有适配性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据一示例性实施例示出的一种音频切换方法的流程图。

图2是根据一示例性实施例示出的一种音频切换方法的流程图。

图3是根据一示例性实施例示出的音频文件的示意图。

图4是根据一示例性实施例示出的音频播放界面的示意图。

图5是根据一示例性实施例示出的一种音频切换装置500框图。

图6是根据一示例性实施例示出的一种音频切换装置600框图。

图7是根据一示例性实施例示出的一种终端700的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

图1是根据一示例性实施例示出的一种音频切换方法的流程图，如图1所示，该音频切换方法包括以下步骤。

101、终端获取待播放的音频文件，该音频文件由伴奏音频片段和原唱音频片段拼接组成，该伴奏音频片段位于该原唱音频片段之前。

102、终端根据用户的播放选择操作，播放该伴奏音频片段和原唱音频片段中任一片段。

103、如果在播放过程中检测到音频切换操作，终端获取当前所播放的音频片段的播放长度，该播放长度为当前播放位置距该音频文件起始位置的距离。

104、终端从该音频文件的目标位置继续进行播放，该目标位置为与该当前所播放的音频片段的播放长度所对应的另一音频片段上的播放位置。

综上所述，本实施例提供的音频切换方法，通过提供由伴奏音频片段和原唱音频片段拼接而成的音频文件，且当检测到音频切换操作时，在同一个音频文件内部进行播放进度的跳转，使得终端仅使用一个音频文件就可以实现伴奏与原唱之间的切换，从而不需要同时解码两个音频文件，也不需要解码器支持多声道和多音频流的解码能力，因此对所有的应用均具有适配性。

在第一种可能的实施方式中，该从该音频文件的目标位置继续进行播放包括：

当该音频切换操作为第一音频切换操作时，从该音频文件的第一目标位置继续进行播放，该第一音频切换操作为从伴奏切换至原唱的操作，该第一目标位置距该音频文件起始位置的距离为该伴奏音频片段的长度与该播放长度之和；

或者，

当该音频切换操作为第二音频切换操作时，从该音频文件的第二目标位置继续进行播放，该第二音频切换操作为从原唱切换至伴奏的操作，该第二目标位置距该音频文件起始位置的距离为该播放长度与该伴奏音频片段的长度之差。

在第二种可能的实施方式中，该获取音频文件之前，上述音频切换方法还包括：

获取伴奏音频文件和原唱音频文件；

对齐该伴奏音频文件和该原唱音频文件，以使该伴奏音频文件和该原唱音频文件同步；

将该伴奏音频文件和该原唱音频文件的长度修整至预设长度的倍数，得到修整伴奏音频文件和修整原唱音频文件；

拼接该修整伴奏音频文件和该修整原唱音频文件，得到该音频文件。

在第三种可能的实施方式中，将该伴奏音频文件和该原唱音频文件的长度修整至预设长度的倍数包括：

分别获取经过对齐操作后，该伴奏音频文件和该原唱音频文件的采样点数目；

根据扩充公式分别计算该伴奏音频文件和该原唱音频文件的扩充采样点数目，该扩充公式为：

L_f＝N×Int((L_o+N-1)/N)

其中，L_f为该扩充采样点数目，L_o为该采样点数目，N为该预设长度，Int为取整运算；

在该伴奏音频文件和该原唱音频文件的尾部拼接第一静音片段，以将该伴奏音频文件和该原唱音频文件的采样点数目扩充至该扩充采样点数目。

在第四种可能的实施方式中，将该伴奏音频文件和该原唱音频文件的长度修整至预设长度的倍数之前，上述音频切换方法还包括：

检测该伴奏音频文件和该原唱音频文件的长度是否相等；

若该伴奏音频文件和该原唱音频文件的长度不相等，则获取长度差值，该长度差值为该伴奏音频文件和该原唱音频文件的长度差；

将第二静音片段拼接至该伴奏音频文件和该原唱音频文件中长度较短的音频文件尾部，该第二静音片段的长度为该长度差值。

在第五种可能的实施方式中，获取伴奏音频文件和原唱音频文件之后，上述音频切换方法还包括：

分别检测该伴奏音频文件和该原唱音频文件的尾部静音片段是否超过预设阈值；

若超过该预设阈值，则剪切该伴奏音频文件和该原唱音频文件的尾部静音片段。

在第六种可能的实施方式中，拼接该修整伴奏音频文件和该修整原唱音频文件，得到该音频文件之后，上述音频切换方法还包括：

将该修整伴奏音频文件的长度添加至该音频文件的标签中。

在第七种可能的实施方式中，该根据用户的播放选择操作，播放该伴奏音频片段和原唱音频片段中任一片段之前，上述音频切换方法还包括：

从该音频文件的标签中获取该伴奏音频片段的长度；

或者，

在获取该音频文件时，从音频数据库中，获取该伴奏音频片段的长度，该音频数据库用于存储音频文件和对应的伴奏音频片段长度；

或者，

获取该音频文件总长度；

获取该伴奏音频片段的长度，该伴奏音频片段的长度为该音频文件总长度的二分之一。

在第八种可能的实施方式中，该播放该音频文件之后，上述音频切换方法还包括：

在播放该音频文件时，检测该播放长度与该伴奏音频片段的长度是否相等；

若该播放长度与该伴奏音频片段的长度相等，则停止播放该音频文件。

上述所有可选技术方案，可以采用任意结合形成本发明的可选实施例，在此不再一一赘述。

图2是根据一示例性实施例示出的一种音频切换方法的流程图，如图2所示，该音频切换方法包括以下步骤。

201、获取伴奏音频文件和原唱音频文件。

本发明为了解决现有技术伴奏与原唱切换方式适配性较差的问题，提供了一种对于一首歌曲仅使用一个音频文件就能实现伴奏与原唱切换的技术方案，该音频文件由伴奏音频片段和原唱音频片段拼接组成，其中伴奏音频片段位于原唱音频片段之前，为了得到该音频文件，在该音频文件制作过程中，需要首先执行步骤201，即获取伴奏音频文件和原唱音频文件，从而利用该伴奏音频文件和原唱音频文件，通过后续拼接等步骤最终得到上述音频文件。

需要说明的是，上述伴奏音频文件和原唱音频文件可以为立体声音频文件，上述伴奏音频文件指的是仅包括歌曲伴奏的音频文件，而上述原唱音频文件指的是包括歌曲伴奏和歌曲人声演唱的音频文件，且，上述伴奏音频文件与上述原唱音频文件具有对应关系，例如，若上述伴奏音频文件为“同桌的你”伴奏音频，则上述原唱音频文件应该是“同桌的你”原唱音频。

另外，由于PCM(Pulse Code Modulation，脉冲编码调制)格式的音频文件便于后续补齐、剪切、拼接等操作，因此上述伴奏音频文件和原唱音频文件的格式可以为PCM格式，若上述伴奏音频文件和原唱音频文件的格式为WMA(Windows Media Audio，微软多媒体音频)格式、AAC(Advanced Audio Coding，高级音频编码)格式等其他音频格式时，可以将其转化为PCM格式，以方便进行后续的操作,当然上述伴奏音频文件和原唱音频文件的格式还可以为其他便于补齐、剪切、拼接等操作的格式，对此本发明不做具体限定。

步骤201中获取的伴奏音频文件和原唱音频文件可能会在文件尾部存在静音片段，这些尾部静音片段对后续伴奏音频文件和原唱音频文件的拼接等操作没有贡献，而且过长的尾部静音片段会增加伴奏音频文件和原唱音频文件的大小，从而造成存储空间的浪费，因此，在本发明的一个实施例中，步骤201之后，上述音频切换方法还可以包括如下步骤：分别检测该伴奏音频文件和该原唱音频文件的尾部静音片段是否超过预设阈值；若超过该预设阈值，则剪切该伴奏音频文件和该原唱音频文件的尾部静音片段。

需要注意的是，上述预设阈值可以由技术人员进行设定，对预设阈值的具体内容本发明不做限定。

202、对齐该伴奏音频文件和该原唱音频文件，以使该伴奏音频文件和该原唱音频文件同步。

步骤201中获取的伴奏音频文件和原唱音频文件虽然具有对应关系，但该伴奏音频文件和原唱音频文件却不一定同步，也即是伴奏音频文件可能较原唱音频文件提前或落后，例如，在距文件起始位置同样距离的播放位置上，伴奏音频文件可能播放到“谁娶了多愁善感的你”对应的伴奏，而原唱音频文件却播放到“谁看了你的日记”，伴奏音频文件和原唱音频文件不同步会导致后续伴奏与原唱切换时，切换位置错误，从而无法保证播放的连续性。

为了解决这一问题，需要执行步骤202，即对齐伴奏音频文件和原唱音频文件，具体实施时，可以采用PCM的互相关性等方式判断该伴奏音频文件和该原唱音频文件是否同步，若伴奏音频文件和原唱音频文件不同步，则可通过在文件开头添加静音片段的方式对齐伴奏音频文件和原唱音频文件，例如若伴奏音频文件较原唱音频文件提前30ms，则可以添加长度为30ms的静音片段至伴奏文件开头，从而对齐伴奏音频文件和原唱音频文件。

需要说明的是，步骤201中获取的伴奏音频文件和原唱音频文件可能是互相同步的音频文件，则在这种情况下，不需要再执行步骤202。

203、分别获取经过对齐操作后，该伴奏音频文件和该原唱音频文件的采样点数目。

上述伴奏音频文件和原唱音频文件的格式均为PCM格式，PCM格式下虽然方便对音频进行剪切、补齐、拼接等操作，然而这种格式的音频大小往往较大，因此，在网络传输时，需要较大的带宽，且需要较大的存储空间，因此，在通过后续拼接过程得到音频文件后，需要采用某种编码方式对该音频文件进行编码，以减小音频文件大小。

在编码过程中，不同的编码方式下一帧数据中包含的采样点的数目是不同的，例如，AAC编码格式中，一帧数据包括1024个采样点，这种情况下，若伴奏音频文件的采样点数目不为1024的倍数，则其最后一帧数据需要使用原唱音频文件的前部采样点来填充，这会导致后续伴奏与原唱切换过程中给应用程序带来复杂的计算逻辑。

因此，为了避免这种情况，需要将上述伴奏音频文件和原唱音频文件的长度修整至预设长度的倍数，该预设长度由编码方式决定，对于AAC编码方式而言，该预设长度即为1024，在对长度进行修整之前，首先需要获取伴奏音频文件和原唱音频文件经过对齐操作后的采样点数目，也即是，执行步骤203，需要说明的是，这里和本发明下文所指的长度均为音频文件的采样点数目，在后面的叙述中本发明对此将不再赘述。

204、根据扩充公式分别计算该伴奏音频文件和该原唱音频文件的扩充采样点数目。

该扩充公式为：

L_f＝N×Int((L_o+N-1)/N)

其中，L_f为该扩充采样点数目，L_o为该采样点数目，N为该预设长度，Int为取整运算。

上述扩充采样点数目即为上述预设长度的倍数，例如，在编码方式为AAC时，伴奏音频文件的长度为15013213个采样点，其不为1024的倍数，则可以通过上述扩充公式计算其需要扩充到多少个采样点数目才为1024的倍数，经过计算得出该伴奏音频文件的扩充采样点数目为15013888。

205、在该伴奏音频文件和该原唱音频文件的尾部拼接第一静音片段，以将该伴奏音频文件和该原唱音频文件的采样点数目扩充至该扩充采样点数目，从而得到修整伴奏音频文件和修整原唱音频文件。

如上述举例，伴奏音频文件原来的长度为15013213个采样点，其需要扩充至15013888个采样点，因此，需要在该伴奏音频文件的尾部拼接第一静音片段，该第一静音片段的长度即为15013888与15013213之差，也即是675个采样点。

当然，步骤201中获取的伴奏音频文件和原唱音频文件的长度可能已经为上述预设长度的倍数，则在这种情况下，也可以不执行步骤203至205。

为了简化后续伴奏与原唱切换过程中应用程序的计算逻辑，可以使伴奏音频文件和该原唱音频文件的长度相同，因此在本发明的一个实施例中，在步骤203之前，上述音频切换方法还可以包括如下步骤：检测该伴奏音频文件和该原唱音频文件的长度是否相等；若该伴奏音频文件和该原唱音频文件的长度不相等，则获取长度差值，该长度差值为该伴奏音频文件和该原唱音频文件的长度差；将第二静音片段拼接至该伴奏音频文件和该原唱音频文件中长度较短的音频文件尾部，该第二静音片段的长度为该长度差值。

例如，伴奏音频文件的长度为1899456个采样点，而原唱音频文件的长度为1899654个采样点，则伴奏音频文件和原唱音频文件的长度不一致，通过计算得出原唱音频文件的长度与伴奏音频文件的长度差值为198个采样点，因此，将第二静音片段拼接至长度较短的伴奏音频文件尾部，该第二静音片段的长度为198个采样点。

206、拼接该修整伴奏音频文件和该修整原唱音频文件，得到音频文件。

拼接步骤205中得到的修整伴奏音频文件和修整原唱音频文件，其中修整伴奏音频文件位于修整原唱音频文件之前，如图3所示，图中上半部分的音频信号为左声道音频信号，下半部分的音频信号为右声道音频信号，左半部分的音频信号为伴奏音频信号，右半部分的音频信号为原唱音频信号，图中横轴为采样点数目，单位为“个”，纵轴为信号幅值，单位为“db”。

为了使终端在利用该音频文件进行伴奏与原唱切换时对切换位置的计算准确，终端需要获知该音频文件中伴奏音频片段的长度，因此，在本发明的一个实施例中，在步骤206之后，上述音频切换方法还可以包括：将该修整伴奏音频文件的长度添加至该音频文件的标签中，该标签可以为ID3v2、APE TAG、CueSheet、MP4Chapters等，对上述标签的具体形式本发明不做限定，具体地，该标签的内容可以为<ACCOMPANY-DURATION>＝<15013888>，同样地，对上述标签的内容本发明也不做具体限定。

此外，在本发明的另一个实施例中，在步骤206之后，还可以将该修整伴奏音频文件的长度添加至音频数据库中，该音频数据库用于存储音频文件和对应的伴奏音频片段长度，当终端从该音频数据库中获取音频文件时，同时即可获取该修整伴奏音频文件的长度。

需要说明的是，上述步骤201至206可以由服务器执行，终端可以通过向服务器发送音频获取请求的方式获取该音频文件，在一些情况中，上述步骤201至206也可以由终端执行，即终端在播放该音频文件前，首先制作该音频文件，对此本发明不做具体限定。

需要说明的是，在具体的音频切换过程中，服务器或终端可能已经制作出了该音频文件，因此，在具体的音频切换过程中，可以不执行步骤201至206的内容。

207、终端获取待播放的音频文件，该音频文件由伴奏音频片段和原唱音频片段拼接组成，该伴奏音频片段位于该原唱音频片段之前。

具体地，终端可以提供K歌界面，该K歌界面可以提供多个音频，该多个音频可以包括待播放的音频，当检测到对该待播放的音频的播放选项的触发操作时，向服务器发送音频文件获取请求，该音频文件获取请求携带该待播放的音频标识，服务器根据该待播放的音频标识返回上述待播放的音频文件。

当然，该待播放的音频文件可以存储于终端中，则当终端检测到对该待播放的音频的播放选项的触发操作时，获取该待播放的音频标识对应的存储地址，则终端可以根据该存储地址从本地获取该待播放的音频文件，本发明对音频文件的获取方式不做具体限定。

终端在获取待播放的音频文件时，也需要获取该音频文件中伴奏音频片段的长度，以方便进行伴奏与原唱之间的切换，具体实施时，可以有以下三种获取伴奏音频片段长度的方法。

第一种方法、从该音频文件的标签中获取该伴奏音频片段的长度。

如上所述的，通过拼接得到该音频文件后，可以将伴奏音频片段的长度添加至该音频文件的标签中，对应地，终端可以通过读取该音频文件的标签以获取该伴奏音频片段的长度。

第二种方法、在获取该音频文件时，从音频数据库中，获取该伴奏音频片段的长度，该音频数据库用于存储音频文件和对应的伴奏音频片段长度。

同样如上所述的，通过拼接得到该音频文件后，可以将该伴奏音频片段的长度添加至音频数据库中，终端在从该音频数据库中获取音频文件时，即可同时获取该伴奏音频片段的长度。

第三种方法、获取该音频文件总长度，获取该伴奏音频片段的长度，该伴奏音频片段的长度为该音频文件总长度的二分之一。

如上所述的，在拼接伴奏音频文件和原唱音频文件之前，可以通过拼接第二静音片段的方式令伴奏音频文件和原唱音频文件的长度一致，因此，在拼接得到的音频文件中，伴奏音频片段的长度与原唱音频片段的长度一致，也即是整个音频文件总长度的二分之一，即，可以通过获取该音频文件总长度从而获取该伴奏音频片段的长度，然而，需要说明的是，该音频文件经过终端的某些解码器进行解码后，其总长度可能会发生变化，在这种情况下，不能采用上述方法3来获取伴奏音频片段的长度。

208、终端根据用户的播放选择操作，播放该伴奏音频片段和原唱音频片段中任一片段。

如上所述的，当终端检测到对该待播放的音频的播放选项的触发操作后，可以提供音频播放界面，如图4所示，该音频播放界面中可以提供播放原唱选项及播放伴奏选项，当检测到对该播放原唱选项的触发操作后，播放原唱音频片段，当检测到对该播放伴奏选项的触发操作后，播放伴奏音频片段。

需要说明的是，当用户开始即选择播放伴奏音频片段时，此时，终端不确定用户是否需要播放原唱音频片段，因此，为了节约终端资源，可以仅对伴奏音频片段进行解码操作。

209、如果在播放过程中检测到音频切换操作，终端获取当前所播放的音频片段的播放长度，该播放长度为当前播放位置距该音频文件起始位置的距离。

上述音频切换操作可以分为第一音频切换操作和第二音频切换操作，该第一音频切换操作为从伴奏切换至原唱的操作，该第二音频切换操作为从原唱切换至伴奏的操作。具体地，当终端当前播放歌曲伴奏时，如图4所示的音频播放界面可以提供切换原唱选项，当检测到对该切换原唱选项的触发操作后，也即是终端检测到第一音频切换操作，当终端当前播放歌曲原唱时，该音频播放界面可以提供切换伴奏选项，当检测到对该切换伴奏选项的触发操作后，也即是终端检测到第二音频切换操作。

210、终端从该音频文件的目标位置继续进行播放，该目标位置为与该当前所播放的音频片段的播放长度所对应的另一音频片段上的播放位置。

当上述音频切换操作为第一音频切换操作时，终端从该音频文件的第一目标位置继续进行播放，该第一目标位置距该音频文件起始位置的距离为该伴奏音频片段的长度与该播放长度之和。

例如，该伴奏音频片段的长度为15132个采样点，播放长度为151个采样点，则第一目标位置距该音频文件起始位置的距离为15132+151＝15283个采样点。显而易见地，当上述音频切换操作为第一音频切换操作时，播放长度一定不大于该伴奏音频片段的长度。

当该音频切换操作为第二音频切换操作时，从该音频文件的第二目标位置继续进行播放，该第二目标位置距该音频文件起始位置的距离为该播放长度与该伴奏音频片段的长度之差。

例如，该伴奏音频片段的长度为15132个采样点，播放长度为15283个采样点，则第二目标位置距该音频文件起始位置的距离为15283-15132＝151个采样点。显而易见地，当上述音频切换操作为第二音频切换操作时，播放长度一定大于该伴奏音频片段的长度，且播放长度一定小于该音频文件的总长度。

终端播放该伴奏音频片段时，当该伴奏音频片段播放完毕后，不允许继续播放该伴奏音频片段之后的原唱音频片段，也即是，此时终端需要停止对该音频文件的播放，因此，在本发明的一个实施例中，上述音频切换方法还包括：终端在播放该音频文件时，检测该播放长度与该伴奏音频片段的长度是否相等，若该播放长度与该伴奏音频片段的长度相等，则停止播放该音频文件。

综上所述，本实施例提供的音频切换方法，通过提供由伴奏音频片段和原唱音频片段拼接而成的音频文件，且当检测到音频切换操作时，在同一个音频文件内部进行播放进度的跳转，使得终端仅使用一个音频文件就可以实现伴奏与原唱之间的切换，从而不需要同时解码两个音频文件，也不需要解码器支持多声道和多音频流的解码能力，因此对所有的应用均具有适配性，进一步地，本实施通过对齐伴奏音频文件和原唱音频文件，使得当检测到音频切换操作时音频文件跳转的目标位置计算更为精确，通过使伴奏音频文件和原唱音频文件长度一致，简化了应用程序在音频切换过程中的计算逻辑，通过剪切伴奏音频文件和原唱音频文件的尾部静音片段，减小了音频文件大小，节省了网络资源和存储空间。

图5是根据一示例性实施例示出的一种音频切换装置500框图。参照图5，该装置包括音频文件获取模块501、播放模块502和播放长度获取模块503。

该音频文件获取模块501，用于获取待播放的音频文件，该音频文件由伴奏音频片段和原唱音频片段拼接组成，该伴奏音频片段位于该原唱音频片段之前。

在本公开的一个实施例中，该音频文件获取模块501还用于：

从该音频文件的标签中获取该伴奏音频片段的长度；

或者，

在该音频文件获取模块501获取该音频文件时，从音频数据库中，获取该伴奏音频片段的长度，该音频数据库用于存储音频文件和对应的伴奏音频片段长度；

或者，

获取该音频文件总长度；

该播放模块502，用于根据用户的播放选择操作，播放该伴奏音频片段和原唱音频片段中任一片段。

该播放长度获取模块503，用于如果在该播放模块502播放过程中检测到音频切换操作，获取当前所播放的音频片段的播放长度，该播放长度为当前播放位置距该音频文件起始位置的距离。

该播放模块502，还用于从该音频文件获取模块501获取的该音频文件的目标位置继续进行播放，该目标位置为与该当前所播放的音频片段的播放长度所对应的另一音频片段上的播放位置。

在本发明的一个实施例中，播放模块502用于：

或者，

参见图6，在本发明的另一个实施例中，还提供了另一种音频切换装置600，该装置基于上述图5的实施例结构，还包括文件获取模块504、对齐模块505、修整模块506、拼接模块507、第一检测模块508、剪切模块509、添加模块510、第二检测模块511和停止模块512。

该文件获取模块504，用于获取伴奏音频文件和原唱音频文件。

该对齐模块505，用于对齐该文件获取模块504获取的该伴奏音频文件和该原唱音频文件，以使该伴奏音频文件和该原唱音频文件同步。

该修整模块506，用于将该文件获取模块504获取的该伴奏音频文件和该原唱音频文件的长度修整至预设长度的倍数，得到修整伴奏音频文件和修整原唱音频文件。

在本发明的一个实施例中，该修整模块506用于：

L_f＝N×Int((L_o+N-1)/N)

该拼接模块507，用于拼接该修整模块得到的该修整伴奏音频文件和该修整原唱音频文件，得到该音频文件。

该第一检测模块508，用于检测该文件获取模块504获取的该伴奏音频文件和该原唱音频文件的长度是否相等。

该文件获取模块504，还用于若该伴奏音频文件和该原唱音频文件的长度不相等，则获取长度差值，该长度差值为该伴奏音频文件和该原唱音频文件的长度差。

该拼接模块507，还用于将第二静音片段拼接至该伴奏音频文件和该原唱音频文件中长度较短的音频文件尾部，该第二静音片段的长度为该长度差值。

该第一检测模块508，还用于分别检测该伴奏音频文件和该原唱音频文件的尾部静音片段是否超过预设阈值。

该剪切模块509，用于若超过该预设阈值，则剪切该伴奏音频文件和该原唱音频文件的尾部静音片段。

该添加模块510，用于将该修整伴奏音频文件的长度添加至该音频文件的标签中。

该第二检测模块511，用于在该播放模块播放该音频文件时，检测该播放长度与该伴奏音频片段的长度是否相等。

该停止模块512，用于若该播放长度与该伴奏音频片段的长度相等，则停止播放该音频文件。

综上所述，本实施例提供的音频切换装置，通过提供由伴奏音频片段和原唱音频片段拼接而成的音频文件，且当检测到音频切换操作时，在同一个音频文件内部进行播放进度的跳转，使得终端仅使用一个音频文件就可以实现伴奏与原唱之间的切换，从而不需要同时解码两个音频文件，也不需要解码器支持多声道和多音频流的解码能力，因此对所有的应用均具有适配性，进一步地，本实施通过对齐伴奏音频文件和原唱音频文件，使得当检测到音频切换操作时音频文件跳转的目标位置计算更为精确，通过使伴奏音频文件和原唱音频文件长度一致，简化了应用程序在音频切换过程中的计算逻辑，通过剪切伴奏音频文件和原唱音频文件的尾部静音片段，减小了音频文件大小，节省了网络资源和存储空间。

需要说明的是：上述实施例提供的音频切换装置在进行音频切换业务时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的音频切换装置与音频切换方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本实施例提供了一种终端，该终端可以用于执行上述各个实施例中提供的音频切换方法。参见图7，该终端700包括：

终端700可以包括RF(Radio Frequency，射频)电路710、包括有一个或一个以上计算机可读存储介质的存储器720、输入单元730、显示单元740、传感器750、音频电路760、WiFi(Wireless Fidelity，无线保真)模块770、包括有一个或者一个以上处理核心的处理器780、以及电源790等部件。本领域技术人员可以理解，图7中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

RF电路710可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，交由一个或者一个以上处理器780处理；另外，将涉及上行的数据发送给基站。通常，RF电路710包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier，低噪声放大器)、双工器等。此外，RF电路710还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议，包括但不限于GSM(Global System of Mobile communication，全球移动通讯系统)、GPRS(General Packet Radio Service，通用分组无线服务)、CDMA(CodeDivision Multiple Access，码分多址)、WCDMA(Wideband Code Division MultipleAccess,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(ShortMessaging Service，短消息服务)等。

存储器720可用于存储软件程序以及模块，处理器780通过运行存储在存储器720的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器720可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据终端700的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器720可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器720还可以包括存储器控制器，以提供处理器780和输入单元730对存储器720的访问。

输入单元730可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地，输入单元730可包括触敏表面731以及其他输入设备732。触敏表面731，也称为触摸显示屏或者触控板，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面731上或在触敏表面731附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触敏表面731可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器780，并能接收处理器780发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面731。除了触敏表面731，输入单元730还可以包括其他输入设备732。具体地，其他输入设备732可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元740可用于显示由用户输入的信息或提供给用户的信息以及终端700的各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元740可包括显示面板741，可选的，可以采用LCD(Liquid Crystal Display，液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板741。进一步的，触敏表面731可覆盖显示面板741，当触敏表面731检测到在其上或附近的触摸操作后，传送给处理器780以确定触摸事件的类型，随后处理器780根据触摸事件的类型在显示面板741上提供相应的视觉输出。虽然在图7中，触敏表面731与显示面板741是作为两个独立的部件来实现输入和输入功能，但是在某些实施例中，可以将触敏表面731与显示面板741集成而实现输入和输出功能。

终端700还可包括至少一种传感器750，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板741的亮度，接近传感器可在终端700移动到耳边时，关闭显示面板741和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于终端700还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路760、扬声器761，传声器762可提供用户与终端700之间的音频接口。音频电路760可将接收到的音频数据转换后的电信号，传输到扬声器761，由扬声器761转换为声音信号输出；另一方面，传声器762将收集的声音信号转换为电信号，由音频电路760接收后转换为音频数据，再将音频数据输出处理器780处理后，经RF电路710以发送给比如另一终端，或者将音频数据输出至存储器720以便进一步处理。音频电路760还可能包括耳塞插孔，以提供外设耳机与终端700的通信。

WiFi属于短距离无线传输技术，终端700通过WiFi模块770可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图7示出了WiFi模块770，但是可以理解的是，其并不属于终端700的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器780是终端700的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器720内的软件程序和/或模块，以及调用存储在存储器720内的数据，执行终端700的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器780可包括一个或多个处理核心；优选的，处理器780可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器780中。

终端700还包括给各个部件供电的电源790(比如电池)，优选的，电源可以通过电源管理系统与处理器780逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源790还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

尽管未示出，终端700还可以包括摄像头、蓝牙模块等，在此不再赘述。具体在本实施例中，终端的显示单元是触摸屏显示器，终端还包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行。所述一个或者一个以上程序包含用于执行以下操作的指令：获取待播放的音频文件，该音频文件由伴奏音频片段和原唱音频片段拼接组成，该伴奏音频片段位于该原唱音频片段之前，根据用户的播放选择操作，播放该伴奏音频片段和原唱音频片段中任一片段，如果在播放过程中检测到音频切换操作，获取当前所播放的音频片段的播放长度，该播放长度为当前播放位置距该音频文件起始位置的距离，从该音频文件的目标位置继续进行播放，该目标位置为与该当前所播放的音频片段的播放长度所对应的另一音频片段上的播放位置。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种音频切换方法，其特征在于，所述方法包括：

将获取的伴奏音频文件和原唱音频文件的长度修整至预设长度的倍数，得到伴奏音频片段和原唱音频片段；

拼接所述伴奏音频片段和所述原唱音频片段，得到音频文件，对所述音频文件进行编码，得到待播放的音频文件，其中，所述预设长度为所述音频文件的编码方式下一帧数据中包含的采样点的数目；

获取待播放的所述音频文件，所述音频文件中，所述伴奏音频片段位于所述原唱音频片段之前；

2.根据权利要求1所述的方法，其特征在于，所述从所述音频文件的目标位置继续进行播放包括：

当所述音频切换操作为第一音频切换操作时，从所述音频文件的第一目标位置继续进行播放，所述第一音频切换操作为从伴奏切换至原唱的操作，所述第一目标位置距所述音频文件起始位置的距离为所述伴奏音频片段的长度与所述播放长度之和；

或者，

当所述音频切换操作为第二音频切换操作时，从所述音频文件的第二目标位置继续进行播放，所述第二音频切换操作为从原唱切换至伴奏的操作，所述第二目标位置距所述音频文件起始位置的距离为所述播放长度与所述伴奏音频片段的长度之差。

3.根据权利要求1所述的方法，其特征在于，在所述将获取的伴奏音频文件和原唱音频文件的长度修整至预设长度的倍数，得到伴奏音频片段和原唱音频片段之前，所述方法还包括：

获取所述伴奏音频文件和所述原唱音频文件；

对齐所述伴奏音频文件和所述原唱音频文件，以使所述伴奏音频文件和所述原唱音频文件同步。

4.根据权利要求1所述的方法，其特征在于，所述将获取的伴奏音频文件和原唱音频文件的长度修整至预设长度的倍数包括：

分别获取经过对齐操作后，所述伴奏音频文件和所述原唱音频文件的采样点数目；

根据扩充公式分别计算所述伴奏音频文件和所述原唱音频文件的扩充采样点数目，所述扩充公式为：

L_f＝N×Int((L_o+N-1)/N)

其中，L_f为所述扩充采样点数目，L_o为所述采样点数目，N为所述预设长度，Int为取整运算；

在所述伴奏音频文件和所述原唱音频文件的尾部拼接第一静音片段，以将所述伴奏音频文件和所述原唱音频文件的采样点数目扩充至所述扩充采样点数目。

5.根据权利要求1所述的方法，其特征在于，在所述将获取的伴奏音频文件和原唱音频文件的长度修整至预设长度的倍数之前，所述方法还包括：

检测所述伴奏音频文件和所述原唱音频文件的长度是否相等；

若所述伴奏音频文件和所述原唱音频文件的长度不相等，则获取长度差值，所述长度差值为所述伴奏音频文件和所述原唱音频文件的长度差；

将第二静音片段拼接至所述伴奏音频文件和所述原唱音频文件中长度较短的音频文件尾部，所述第二静音片段的长度为所述长度差值。

6.根据权利要求3所述的方法，其特征在于，在所述获取所述伴奏音频文件和所述原唱音频文件之后，所述方法还包括：

分别检测所述伴奏音频文件和所述原唱音频文件的尾部静音片段是否超过预设阈值；

若超过所述预设阈值，则剪切所述伴奏音频文件和所述原唱音频文件的尾部静音片段。

7.根据权利要求1所述的方法，其特征在于，在所述拼接所述伴奏音频片段和所述原唱音频片段，得到音频文件之后，所述方法还包括：

将所述伴奏音频片段的长度添加至所述音频文件的标签中。

8.根据权利要求1所述的方法，其特征在于，所述根据用户的播放选择操作，播放所述伴奏音频片段和原唱音频片段中任一片段之前，所述方法还包括：

从所述音频文件的标签中获取所述伴奏音频片段的长度；

或者，

在获取所述音频文件时，从音频数据库中，获取所述伴奏音频片段的长度，所述音频数据库用于存储音频文件和对应的伴奏音频片段长度；

或者，

获取所述音频文件总长度；

获取所述伴奏音频片段的长度，所述伴奏音频片段的长度为所述音频文件总长度的二分之一。

9.根据权利要求1所述的方法，其特征在于，所述方法还包括：

在播放所述音频文件时，检测所述播放长度与所述伴奏音频片段的长度是否相等；

若所述播放长度与所述伴奏音频片段的长度相等，则停止播放所述音频文件。

10.一种音频切换装置，其特征在于，所述装置包括：

修整模块，用于将获取的伴奏音频文件和原唱音频文件的长度修整至预设长度的倍数，得到伴奏音频片段和原唱音频片段；

拼接模块，用于拼接所述修整模块得到的所述伴奏音频片段和所述原唱音频片段，得到音频文件，对所述音频文件进行编码，得到待播放的音频文件，其中，所述预设长度为所述音频文件的编码方式下一帧数据中包含的采样点的数目；

音频文件获取模块，用于获取待播放的所述音频文件，所述音频文件中，所述伴奏音频片段位于所述原唱音频片段之前；

11.根据权利要求10所述的装置，其特征在于，所述播放模块用于：

或者，

12.根据权利要求10所述的装置，其特征在于，所述装置还包括：

文件获取模块，用于获取伴奏音频文件和原唱音频文件；

对齐模块，用于对齐所述文件获取模块获取的所述伴奏音频文件和所述原唱音频文件，以使所述伴奏音频文件和所述原唱音频文件同步。

13.根据权利要求10所述的装置，其特征在于，所述修整模块用于：

L_f＝N×Int((L_o+N-1)/N)

14.根据权利要求10所述的装置，其特征在于，所述装置还包括：

第一检测模块，用于检测所述伴奏音频文件和所述原唱音频文件的长度是否相等；

所述文件获取模块，还用于若所述伴奏音频文件和所述原唱音频文件的长度不相等，则获取长度差值，所述长度差值为所述伴奏音频文件和所述原唱音频文件的长度差；

所述拼接模块，还用于将第二静音片段拼接至所述伴奏音频文件和所述原唱音频文件中长度较短的音频文件尾部，所述第二静音片段的长度为所述长度差值。

15.根据权利要求14所述的装置，其特征在于，所述第一检测模块，还用于分别检测所述伴奏音频文件和所述原唱音频文件的尾部静音片段是否超过预设阈值；

所述装置还包括剪切模块，用于若超过所述预设阈值，则剪切所述伴奏音频文件和所述原唱音频文件的尾部静音片段。

16.根据权利要求10所述的装置，其特征在于，所述装置还包括：

添加模块，用于将所述伴奏音频片段的长度添加至所述音频文件的标签中。

17.根据权利要求10所述的装置，其特征在于，所述音频文件获取模块还用于：

从所述音频文件的标签中获取所述伴奏音频片段的长度；

或者，

在所述音频文件获取模块获取所述音频文件时，从音频数据库中，获取所述伴奏音频片段的长度，所述音频数据库用于存储音频文件和对应的伴奏音频片段长度；

或者，

获取所述音频文件总长度；

18.根据权利要求10所述的装置，其特征在于，所述装置还包括：

第二检测模块，用于在所述播放模块播放所述音频文件时，检测所述播放长度与所述伴奏音频片段的长度是否相等；

停止模块，用于若所述播放长度与所述伴奏音频片段的长度相等，则停止播放所述音频文件。