WO2018059342A1

WO2018059342A1 - 一种双音源音频数据的处理方法及装置

Info

Publication number: WO2018059342A1
Application number: PCT/CN2017/103106
Authority: WO
Inventors: 赵伟锋
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2016-09-27
Filing date: 2017-09-25
Publication date: 2018-04-05
Also published as: EP3522151B1; CN106486128A; US20180349493A1; EP3522151A4; CN106486128B; EP3522151A1; US10776422B2

Abstract

一种双音源音频数据的处理方法及装置。该方法包括：获取一同源歌曲对的音频数据，同源歌曲对为伴奏相同但演唱不同的两首歌曲（S201）；对同源歌曲对的音频数据进行解码处理，得到两个单声道音频数据（S202）；将两个单声道音频数据合并为一个双声道音频数据（S203）；将双声道音频对应的播放时间划分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制（S204）。

Description

一种双音源音频数据的处理方法及装置

本申请要求于2016年9月27日提交中国专利局、申请号为201610852918.8、发明名称为“一种双音源音频数据的处理方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及计算机信息处理技术领域，具体是一种双音源音频数据的处理方法及装置。

发明背景

随着多媒体设备的普及，人们希望从音乐中获取更多乐趣，除了聆听单一音乐外，混音音乐、串烧歌曲也得到大家的追捧。

发明内容

本发明实施例提供一种双音源音频数据处理方法、装置及非易失性计算机可读存储介质，可以将伴奏相同但演唱不同的两首歌曲进行自动合成。

本发明实施例采用如下的技术方案：

本发明实施例提供一种双音源音频数据的处理方法，所述方法包括：

获取一同源歌曲对的音频数据，所述同源歌曲对为伴奏相同但演唱不同的两首歌曲；

分别对所述同源歌曲对的音频数据进行解码处理，得到两个单声道音频数据；

将两个单声道音频数据合并为一个双声道音频数据；

将双声道音频对应的播放时间划分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制。

本发明实施例提供一种双音源音频数据的处理装置，所述装置包括处理器和非易失性存储介质，所述非易失性存储介质存储一个或多个计算机可读指令，所述处理器执行所述计算机可读指令以实现步骤：

将两个单声道音频数据合并为一个双声道音频数据；

将双声道音频对应的播放时间切分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制。

本发明实施例提供一种非易失性计算机可读存储介质，存储有计算机程序，所述计算机程序能够使计算机执行如下步骤：

对所述同源歌曲对的音频数据进行解码处理，得到两个单声道音频数据；

将两个单声道音频数据合并为一个双声道音频数据；

本发明实施例将伴奏相同但演唱不同的两首歌曲作为同源歌曲对，通过对同源歌曲对的音频数据解码得到两个单声道音频数据，将两个单声道音频数据合并成双声道音频数据，并将双声道音频对应的播放时间划分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制，实现了伴奏相同但演唱不同的两首歌曲交替演唱的效果。本发明实施例提供了一种新颖的音乐自动合成方案，为计算机设备提供了一种新的功能。由于用于合成处理的两首歌曲歌词信息和伴奏信息均相同，因而处理得到的音频非常柔和，不会产生突兀感，具有舒适的聆听效果。而且，无论是获取同源歌曲对还是对音频数据进行处理，均在后台进行，在用户终端侧，用户只需在用户终端上选择合成后的音频进行播放即可，无需手动选择同源歌曲对以及处理音频数据，因此简化了用户终端上的操作，节省了用户终端的处理资源。此外，与采用歌手现场演唱来录制音乐作品的方式相比，本发明实施例具有投入成本低且合成效率高的优点。

附图简要说明

为了更清楚地说明本发明的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1是本发明实施例提供的双音源音频数据的处理方法的场景示意图；

图2是本发明实施例提供的一种双音源音频数据的处理方法的流程示意图；

图3是本发明实施例提供的获取同源歌曲对的方法的流程示意图；

图4是本发明实施例提供的对初选歌曲对的伴奏进行筛选的方法的流程示意图；

图5是本发明实施例提供的一同源歌曲对的歌词文件的示意图；

图6是本发明实施例提供的一同源歌曲对的伴奏文件的示意图；

图7是本发明实施例提供的一种双音源音频数据的处理装置的结构示意图；

图8是本发明实施例提供的一种双音源音频数据的处理装置的结构示意图；

图9是本发明实施例提供的音频数据处理装置的获取模块的结构示意图；

图10是本发明实施例提供的双音源音频数据的处理装置的硬件结构示意图。

实施本发明的方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

在以下的说明中，本发明的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明，除非另有述明。因此，这些步骤及操作将有数次提到由计算机执行，本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处，其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置，其具有由该数据格式所定义的特定特性。但是，本发明原理以上述文字来说明，其并不代表为一种限制，本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。

本文所使用的术语“模块”可看做为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文所述的装置及方法优选的以软件的方式进行实施，当然也可在硬件上进行实施，均在本发明保护范围之内。

本发明实施例提供一种双音源音频数据处理方法及装置。

参见附图1，该图为本发明实施例所提供的双音源音频数据处理方法的场景示意图。该场景可以包括音频数据的处理装置，其运行于服务器200中，简称音频处理装置300，主要用于获取同源歌曲对的音频数据，所述同源歌曲对为伴奏相同但演唱不同的两首歌曲；然后，分别对所述同源歌曲对的音频数据进行解码处理，得到两个单声道音频数据；随后，将两个单声道音频数据合并为一个双声道音频数据；最后，将双声道音频对应的播放时间划分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制，得到处理后的音频数据。

此外，该场景还可以包括歌曲数据库100，该歌曲数据库中存储有大量的歌曲信息，其中包含歌曲相应的伴奏文件、歌词文件以及音频数据。音频处理装置300根据歌曲数据库100中歌曲的歌词文件和伴奏文件，筛选出伴奏相同但演唱不同的两首歌曲组成同源歌曲对。当然，该场景中还可以包括用户终端400，如手机、平板电脑等，该用户终端包括输入装置(如键盘、鼠标等)以及输出装置(如屏幕、功放等)。用户通过输入装置触发选择音频处理装置300处理后的音频数据，通过输出装置播放处理后的音频数据。

以下将分别进行详细说明。

在本发明实施例中，从音频处理装置的角度进行描述，该音频处理装置具体可以集成在服务器或网关等网络设备中，用以实现双音源音频数据处理方法。所述服务器或网关等网络设备可以为一种计算机设备。

本发明实施例提供了一种双音源音频数据处理方法，包括：获取一同源歌曲对的音频数据，所述同源歌曲对为伴奏相同但演唱不同的两首歌曲；分别对所述同源歌曲对的音频数据进行解码处理，得到两个单声道音频数据；将两个单声道音频数据合并为一个双声道音频数据；将双声道音频对应的播放时间划分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制。

参见图2，图2是本发明实施例提供的一种双音源音频数据的处理方法的流程示意图。所述方法包括：

S201、获取一同源歌曲对的音频数据。

其中，所述同源歌曲对为伴奏相同但演唱不同的两首歌曲，所述演唱不同是指演唱者不同或者演唱语言不同。在本发明实施例中，同源歌曲对可以是同一首歌曲被同一个演唱者用两种不同的语言演唱而得到的两首歌曲，如：陈奕迅用国语演唱的《红玫瑰》和用粤语演唱的《白玫瑰》，《红玫瑰》和《白玫瑰》的演唱语言不同但伴奏相同，可作为一同源歌曲对。在本发明另一实施例中，同源歌曲对也可以是不同的演唱者演唱同一首歌曲而得到的两首歌曲，如Megan Nicole与Alex均演唱了歌曲《Maps》，Megan Nicole演唱的《Maps》和Alex演唱的《Maps》可作为一同源歌曲对。总而言之，需要从歌曲数据库中找到采用了相同伴奏但演唱不同的两首歌曲组成歌曲对。

S202、分别对所述同源歌曲对的音频数据进行解码处理，得到两个单声道音频数据。

S203、将两个单声道音频数据合并为一个双声道音频数据。

S204、将双声道音频对应的播放时间划分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制。

具体地，所述双声道音频对应的播放时间包括每句歌词的时间信息。在本发明实施例中，该时间信息可以是每句歌词的起始时间和结束时间，可替代地，该时间信息也可以是每一句歌词的起始时间和持续时长。具体地，可以根据每句歌词的时间信息将所述播放时间切分为多个播放时段，所述播放时段的数量与歌词中包含的句子数目一致，达到两种声音各唱一句的效果；也可以将歌词划分为多个段落，按照歌词段落来划分播放时段，即：将一句或多句歌词作为一段，以段落中第一句歌词的起使时间作为该播放时段的起始时间，以段落中最后一句歌词对应的结束时间作为该播放时段的结束时间，来实现两种声音各唱一段的效果。

在不同的播放时段对双声道音频的左声道或右声道进行能量抑制。在本发明实施例中，可以在不同的播放时段对左声道和右声道交替抑制；也可以按照预设规则分别对左声道或右声道进行能量抑制。例如：在连续的多个播放时段内抑制同一声道，或者在某些播放时段内对左声道和右声道都不抑制，或者仅在播放时段的部分时间内对左声道或右声道进行能量抑制。其中，仅在播放时段的部分时间内对左声道或右声道进行能量抑制，可以实现同一播放时段对应的歌曲部分由两种声音交替完成，如声音A唱歌词句子的上半句，声音B唱歌词句子的下半句。

在任意一个播放时段对音频进行能量抑制的具体方法为：

在进入播放时段前的预设时间内，对需要进行能量抑制的声道施加淡出效果；在播放时段内，将需进行能量抑制的声道的音频采样点全部置0；在退出播放时段后的预设时间内，对所述声道施加淡入效果。

进一步地，在执行完步骤S204之后，还可以将处理后的音频数据展示给用户，以供用户聆听。

参见图3，图3是本发明实施例提供的获取同源歌曲对的方法的流程示意图。所述方法包括：

S301、获取候选歌曲对的歌曲信息，所述歌曲信息包括两首歌曲对应的歌词文件和伴奏文件。

在获取候选歌曲对的歌曲信息后，可以根据候选歌曲对的歌曲信息建立歌曲对列表。具体地，可以通过以下实施例所述的方法获取候选歌曲对的歌曲信息。

在一实施例中，在歌曲数据库中搜索所有歌曲名相同但歌手名不同的歌曲，将搜索得到的所有歌曲进行两两组合，得到候选歌曲对，进而从歌曲数据库中提取该候选歌曲对的歌曲信息。

例如：在QQ音乐曲库中搜索歌曲名为“爱”的所有歌曲，搜索结果包括小虎队演唱的《爱》、莫文蔚演唱的《爱》及TFBOYS演唱的《爱》，根据两两组合原则，可以将小虎队演唱的《爱》和莫文蔚演唱的《爱》作为一个候选歌曲对，将小虎队演唱的《爱》与TFBOYS演唱的《爱》作为一个候选歌曲对，将莫文蔚演唱的《爱》与TFBOYS演唱的《爱》作为一个候选歌曲对。

在另一实施例中，在同一位歌手的所有歌曲中搜索标注有语言标签的歌曲，语言标签是用于标识歌曲的，一般包括歌曲名和语言版本，将标注有语言标签的一首歌曲和与语言标签中的歌曲名对应的另一首歌曲作为一个候选歌曲对，获取该候选歌曲对的歌曲信息。

例如：在歌手陈奕迅的歌曲列表中，搜索到歌曲《白玫瑰》的语言标签为红玫瑰粤语版，则可以将《白玫瑰》和语言标签对应的《红玫瑰》作为候选歌曲对。

S302、根据候选歌曲对中两首歌曲的歌词文件，对候选歌曲对进行歌词筛选，若候选歌曲对中两首歌曲的歌词文件相同，则确定该候选歌曲对为初选歌曲对。

具体地，可通过以下方法对候选歌曲对的歌词进行筛选。

首先，分别解析候选歌曲对中两首歌曲的歌词文件，得到每一首歌曲的歌词句子数目及与每一句歌词对应的时间信息，时间信息可以包括每一句歌词的起始时间和结束时间，可替代地，时间信息也可以包括每句歌词的起始时间和歌词演唱的持续时长；然后判断两首歌曲的歌词句子数目是否相同，若否，则舍弃对应的候选歌曲对，若是，则将两首歌曲的歌词句子一一对应，判断两首歌曲中相对应的歌词的时间信息是否相同，若不同，则舍弃对应的候选歌曲对，若相同，则将所述候选歌曲对作为初选歌曲对。

S303、根据初选歌曲对中两首歌曲的伴奏文件，对初选歌曲对进行伴奏筛选，若初选歌曲对中两首歌曲的伴奏文件相同，则确定该初选歌曲对为所述同源歌曲对。

参见图4，可通过以下方法对初选歌曲对的伴奏进行筛选。

S401、分别提取初选歌曲对中两首歌曲的伴奏文件，伴奏文件包括至少一段伴奏音频及与该伴奏音频对应的伴奏时间。

S402、将两首歌曲中伴奏时间相同的伴奏音频一一对应，组成至少一个伴奏对。

S403、分别对每一个伴奏对的两段伴奏音频进行处理，得到与所述伴奏对对应的两个长度相同的二进制序列，并计算两个二进制序列的匹配概率，判断匹配概率是否大于预设值，若是，则确定所述伴奏对的两段伴奏音频相同。

判断伴奏对的两段伴奏音频是否相同的具体方法包括：分别对两个伴奏音频数据进行傅里叶变换，生成两个频谱；将两个频谱等分为相同数量的频段，分别计算每个频谱中每个频段的平均能量值，比较每个频段与前一频段的大小，将比较结果用二进制表示，得到与所述频谱对应的二进制序列；计算两个二进制序列的匹配概率，所述匹配概率为

其中，n表示二进制序列中数码的总个数，m表示两个二进制序列对应数码位的数码相同的个数，判断匹配概率是否大于预设值，若是，则确定所述伴奏对的两段伴奏音频相同。

S404、判断是否每一个伴奏对的两段伴奏音频都相同，若是，则确定所述初选歌曲对为同源歌曲对。

S304、获取所述同源歌曲对对应的两首歌曲的音频数据。

从歌曲数据库中获取组成同源歌曲对的两首歌曲的音频数据。

上述图3所示的方式仅仅是获取同源歌曲对的诸多方法中的其中一种，不应理解为对本发明的限制。

根据第一实施例所描述的方法，以下将举例作进一步详细说明。

本实施例将双音源音频数据处理方法分为两个主要方面，一方面是筛选同源歌曲对，另一方面是对同源歌曲对的音频数据进行合成处理。下面将分别就上述两方面结合实例进行说明。

同源歌曲对由伴奏相同但演唱不同的两首歌曲组成，筛选同源歌曲对即是需要找到采用了相同伴奏但演唱不同的两首歌曲进行组合。

在本发明实施例中，筛选同源歌曲对可以先从歌曲数据库中查找到候选歌曲对，建立歌曲对列表。其中，从歌曲数据库中查找候选歌曲可以按如下方法进行。

第一种方法，在同一个歌手的歌曲列表中，查看是否有歌曲具有语言标签，如歌曲《白玫瑰》的语言标签为红玫瑰粤语版，则可以将《白玫瑰》和《红玫瑰》作为候选歌曲对，分别记为歌曲x、歌曲y；

第二种方法，在歌曲数据库中搜索所有歌曲名相同但歌手名不同的歌曲，将搜索得到的所有歌曲进行两两组合，例如，将小虎队演唱的《爱》、莫文蔚演唱的《爱》及TFBOYS演唱的《爱》进行两两组合，得到三个候选歌曲对，每个候选歌曲对的两首歌曲分别记为歌曲x、歌曲y。

对于上述实施例中找到的所有候选歌曲对，因为不一定是采用了相同的伴奏，如小虎队的《爱》与莫文蔚的《爱》，虽然同名，但并不是同一首歌曲，所以不一定满足伴奏相同的条件，需要对候选歌曲对的伴奏进行筛选。下面将以陈奕迅演唱的《白玫瑰》与《红玫瑰》为例，来对伴奏筛选的具体步骤进行说明。

对于歌曲x、y，分别在歌曲数据库中找到其对应的歌词文件x^l、y^l，其中歌词文件格式可具体含该歌曲对应的歌词，以及每句歌词对应的时间信息，该时间信息可以是每句歌词的起始时间和结束时间，也可以是每一句歌词的起始时间和持续时长。如图5(a)、(b)分别示出了《红玫瑰》和《白玫瑰》的歌词文件，歌词文件格式为每行前面是起始时间，后面是对应的歌词，可以通过解析歌词文件得到每一句歌词对应的时间信息，如图5所示，除去歌曲名和词曲作者信息之外，《红玫瑰》的第一句歌词与《白玫瑰》的第一句歌词的起始时间均为[00:16.28]，结束时间均为[00:18.65]，《红玫瑰》的第一句歌词用“aaaaaaaaa”表示，《白玫瑰》的第一句歌词用“bbbbbbbbb”表示，其它歌词用“xx……”表示。通过类似比对，如果两首歌曲对应的歌词句子数相同且每一句歌词的起始时间与结束时间均相同，则判断歌曲x、y符合歌词筛选条件，可以将歌曲x、y组成的候选歌曲对作为初选歌曲对，进入下一轮伴奏筛选，反之则将此候选歌曲对从歌曲对列表中删除。

对初选歌曲对的伴奏进行筛选。一般的歌曲中会有几段时间较长的没有歌词只演奏伴奏的部分，如前奏、两段的间隔与结尾部分，伴奏部分的歌词文件的显示则是只有时间信息没有歌词，如图6中的线框内的内容；《红玫瑰》歌曲中有4段只显示时间而没有歌词的部分，根据这一特点，可直接解析出歌曲在[00:08.61]～[00:16.28]的部分只有伴奏。假设歌曲x、y采用的是同一个伴奏，那么两首歌在没有歌词的部分应是趋于相同的(由于能量大小、编解码都会对伴奏部分造成影响，完全相同的可能性很低)，基于这样的理论可以对歌曲x、y进行音频的对比。在本发明实施例中，对歌曲x、y进行音频的对比的具体步骤如下：

将歌曲x、y对应的歌词文件中的仅有时间信息而无歌词的音频切割出来，如《红玫瑰》则可切割出4个伴奏部分，分别为x_ii∈(1，4)与y_ii∈(1，4)，由于经过了歌词筛选，所以可以确定，当i确定时，x_i与y_i的时间相同，由于每一对x_i与y_i的处理方式相同,后续只以x₁与y₁作为例子进行说明；

将x₁和y₁分别解码为8k16bit音频；

以1024个采样点为帧长，以32个采样点为帧移进行傅立叶变换，得到频谱；

将4k的频谱平均分到32个频段，为每个频段计算均值，并将计算出来的均值作为此频段的平均能量；

比较每个频段与上一帧对应频段的大小关系，比前一阵大则为1，小则为0，得到32个bit值代表每一帧，分别对x₁和y₁执行上述操作，得到与x₁和y₁对应的两个长度相同的二进制序列；

将x₁与y₁的二进制序列进行一一对比，计算两个二进制序列的匹配概率，匹配概率可表示为

其中，n表示二进制序列中数码的总个数，m表示两个二进制序列对应数码位的数码相同的个数(两个二进制序列对应数码位上的数码同时为0或同时为1，则判断该数码相同)，将匹配概率与预设值k进行比对，若匹配概率不小于预设值k，则认为匹配成功，伴奏x₁与y₁趋于相同。理论上，若伴奏x₁与y₁相同，则匹配概率应为1，由于能量大小、编解码都会对伴奏部分造成影响，因而通过设置预设值k来判断伴奏x₁与y₁的相似度，匹配概率越接近1则伴奏x₁与y₁相同的可能性越大，故预设值k应趋近于1，例如，k＝0.9。

如果一个初选歌曲对的两首歌曲x、y的所有x_i与y_i均匹配成功，则认为此初选歌曲对的伴奏相同，将此初选歌曲对作为同源歌曲对，反之则将其从歌曲对列表中去除。

经过对上述的歌词筛选和伴奏筛选，歌曲对列表中剩余的歌曲对都为同源歌曲对。为实现同源歌曲双音轮唱的效果，需对同源歌曲对的音频数据进行合成处理，为便于说明，下面以歌曲x、y组成的同源歌曲对的合成处理方法进行说明。

在本发明实施例中，歌曲x、y的合成处理步骤如下：

将歌曲x和歌曲y的音频数据解码为44k16bit单声道音频数据。

将x、y两个单声道音频数据合并为一个双声道音频数据，左右声道可随机分配，这样用户带耳机或音箱听音乐的时候，会发现两个耳朵听到的音乐伴奏相同但演唱不同。

仅通过上述处理合成的音乐听起来会比较乱，为达到轮唱的效果，可以根据歌词信息的时间戳将所有的歌词句子切割为n个时间段t_ii∈(1，n)，其中n为歌词的句子数(仅指演唱的句子数，不包含词曲信息与伴奏的行)。如图5所示的《红玫瑰》，t₁为([00:16.28]～[00:18.65])、 t₂为([00:18.65]～[00:23.53])…，在t_i(i为单数)时间段内对左声道进行能量抑制，在t_i(i为双数)时间段内对右声道进行能量抑制，这样在播放时就会产生左右声道不同人声轮流演唱的效果。在本发明实施例中，对于一个t_i时间段的抑制分为三个步骤，具体方法如下(以t₁为例)：

在第一步骤中，淡出：在t₁的前1秒产生淡出效果，具体时间段为([00:15.28]～[00:16.28])，由于采样率为44100，所以这一秒内的左声道音频有44100个采样点，能量值为k_ii∈(1，44100)，则淡出后的新能量值为

在第二步骤中，将所有t₁时间段[00:16.28]～[00:18.65]内的采样点全部置0；

在第三步骤中，淡入：在t₁的后1秒产生淡入效果，具体时间段为([00:18.65]～[00:19.65])，这一秒内的左声道音频有44100个采样点，能量值为k_ii∈(1，44100)，则淡入后的新能量值为

本发明实施例将伴奏相同但演唱不同的两首歌曲作为同源歌曲对，通过对同源歌曲对的音频数据解码得到两个单声道音频数据，将两个单声道音频数据合并成双声道音频数据，并将双声道音频对应的播放时间划分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制，实现了伴奏相同但演唱不同的两首歌曲交替演唱的效果。本发明实施例提供了一种新颖的音乐自动合成方案，为计算机设备提供了一种新的功能，且兼具有投入成本低、合成效率高的优点。

为便于更好的实施本发明实施例提供的双音源音频数据处理方法，本发明实施例还提供一种双音源音频数据处理装置。其中名词的含义与上述音频数据的处理的方法中相同，具体实现细节可以参考方法实施例中的说明。

请参阅图7，图7为本发明实施例提供的双音源音频数据处理装置的结构示意图，所述装置包括获取模块500以及处理模块600。

其中，所述获取模块500，用于获取一同源歌曲对的音频数据，；

所述处理模块600包括解码子模块610、合并子模块620以及处理子模块630；解码子模块610，用于分别对所述同源歌曲对的音频数据进行解码处理，得到两个单声道音频数据；合并子模块620，用于将两个单声道音频数据合并为一个双声道音频数据；处理子模块630，用于将双声道音频对应的播放时间切分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制。

其中同源歌曲对为伴奏相同但演唱不同的两首歌曲。在本发明实施例中，同源歌曲对可以是同一首歌曲被同一个演唱者用两种不同的语言演唱而得到的两首歌曲，也可以是不同的演唱者演唱同一首歌曲而得到的两首歌曲。参见图8，所述获取同源歌曲对的获取模块500具体包括获取子模块510、歌词筛选子模块520以及伴奏筛选子模块530。其中，获取子模块510用于获取候选歌曲对的歌曲信息，所述歌曲信息包括两首歌曲对应的歌词文件和伴奏文件；歌词筛选子模块520用于根据候选歌曲对中两首歌曲的歌词文件，对候选歌曲对进行歌词筛选，若候选歌曲对中两首歌曲的歌词文件相同，则确定该候选歌曲对为初选歌曲对；伴奏筛选子模块530用于根据初选歌曲对中两首歌曲的伴奏文件，对初选歌曲对进行伴奏筛选，若初选歌曲对中两首歌曲的伴奏文件相同，则确定该初选歌曲对为所述同源歌曲对。

歌词文件是指歌曲中的歌词句子和每句歌词的时间信息，伴奏文件是指歌曲中仅有演奏而无歌词演唱的部分。

参见图9，图9是本发明实施例提供的音频数据处理装置的获取模块500的结构示意图。

作为一种可能的实施方式，所述获取子模块510可以包括第一获取单元511和第二获取单元512；其中，第一获取单元511，用于在歌曲数据库中搜索所有歌曲名相同但歌手名不同的歌曲，将搜索得到的所有歌曲进行两两组合，得到候选歌曲对；第二获取单元512，用于在同一位歌手的所有歌曲中搜索标注有语言标签的歌曲，所述语言标签包括歌曲名和语言版本，将所述标注有语言标签的一首歌曲和与所述语言标签中的歌曲名对应的另一首歌曲作为一个候选歌曲对。所述歌曲筛选子模块520可以包括解析单元521和歌词筛选单元522，其中，解析单元，用于分别解析候选歌曲对中两首歌曲的歌词文件，得到每一首歌曲的歌词句子数目及与每一句歌词对应的时间信息，所述时间信息包括每一句歌词的起始时间和结束时间；歌词筛选单元，用于判断所述候选歌曲对中两首歌曲的歌词句子数目是否相同，若是，则将两首歌曲的歌词句子一一对应，判断两首歌曲中相对应的歌词的时间信息是否相同，若是，则将所述候选歌曲对作为初选歌曲对。所述伴奏筛选子模块530可以包括提取单元531、映射单元532、伴奏筛选单元533和确定单元534；其中，提取单元531，用于分别提取初选歌曲对中两首歌曲的伴奏文件，所述伴奏文件包括至少一段伴奏音频及与所述伴奏音频对应的伴奏时间；映射单元532，用于将两首歌曲中伴奏时间相同的伴奏音频一一对应，组成至少一个伴奏对，伴奏筛选单元533，用于分别对每一个伴奏对的两段伴奏音频进行处理，得到与所述伴奏对对应的两个长度相同的二进制序列，计算两个二进制序列的匹配概率，并判断匹配概率是否大于预设值，若是，则确定所述伴奏对的两段伴奏音频相同；确定单元534，用于判断是否每一个伴奏对的两段伴奏音频都相同，若是，则确定所述初选歌曲对为所述同源歌曲对。

作为一种可能的实施方式，所述伴奏筛选单元533包括解码子单元5331、频谱生成子单元5332、转换子单元5333和计算子单元5334；其中，

解码子单元5331，用于对每一个伴奏对的两段伴奏音频分别进行解码处理，得到两个伴奏音频数据；频谱生成子单元5332，用于分别对两个伴奏音频数据进行傅里叶变换，生成两个频谱；转换子单元5333，用于将两个频谱等分为相同数量的频段，分别计算每个频谱中每个频段的平均能量值，比较每个频段与前一频段的大小，将比较结果用二进制表示，得到与所述频谱对应的二进制序列；

计算子单元5334，用于计算两个二进制序列的匹配概率，所述匹配概率为

其中，n表示二进制序列中数码的总个数，m表示两个二进制序列中对应数码位上的数码相同的个数，判断匹配概率是否大于预设值，若是，则确定所述伴奏对的两段伴奏音频相同。

进一步地，作为一种可能的实施方式，所述处理子模块630包括切分单元631和处理单元632，其中，切分单元631，用于根据双声道音频中每句歌词的时间信息将双声道音频的播放时间划分为多个播放时段，所述播放时段的数量与歌词的句子数目一致；处理单元632，用于在不同的播放时段交替地对双声道音频的左声道和右声道进行能量抑制。

在对双音源音频数据进行处理之后，还可以将处理得到的音频数据传输给用户终端，从而展示给用户。

该双音源音频数据处理装置具体可以集成在服务器或网关等网络设备中。

具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可参见前面的方法实施例，在此不再赘述。

由上述可知，本实施例提供的双音源音频数据处理装置，首先从歌曲数据库中筛选出伴奏相同但演唱不同的两首歌曲作为同源歌曲对，对同源歌曲对的音频数据执行解码、合并处理，得到双声道音频数据，并将双声道音频对应的播放时间划分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制，从而产生双音轮唱的效果。本发明实施例提供了一种新颖的音乐合成装置，为计算机设备提供了一种新的功能，且兼具合成效率高、成本低的优势。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见上文针对双音源音频数据处理方法的详细描述，此处不再赘述。

本发明实施例提供的音频数据处理装置，譬如为计算机、平板电脑、具有触摸功能的手机等等，所述音频数据的处理装置与上文实施例中的音频数据的处理方法属于同一构思，在所述音频数据的处理装置上可以运行所述音频数据的处理方法实施例中提供的任一方法，其具体实现过程详见所述音频数据的处理方法实施例，此处不再赘述。

图10是本发明实施例提供的双音源音频数据的处理装置的硬件结构示意图。如图10所示，该装置可以包括：一个或多个(图中仅示出一个)处理器1001、存储介质1002、总线1003以及接口1004。

其中，存储介质1002可用于存储一个或多个计算机可读指令，例如软件程序以及模块，如本发明实施例中的双音源音频数据的处理方法和装置对应的程序指令/模块。处理器1001通过总线1003与存储介质1002连接，并运行存储在存储介质1002内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的音频数据的处理方法。存储介质1002可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储介质1002可进一步包括相对于处理器1001远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。接口1004通过总线与处理器1001连接，接收处理器1001的指令，并根据指令接收外部设备的数据或将数据发送给外部设备。

需要说明的是，对本发明实施例所述双音源音频数据处理方法而言，本领域普通技术人员可以理解，实现本发明实施例所述音频数据的处理方法的全部或部分流程，是可以通过计算机程序来控制相关的硬件来完成，所述计算机程序可存储于一计算机可读取存储介质中，如存储在图1所示的服务器的存储器中，并被该服务器内的至少一个处理器执行，在执行过程中可包括如所述音频数据的处理方法的实施例的流程。所述服务器可以为一种计算机设备。其中，所述的存储介质可为磁碟、光盘、只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)等。

因此，本发明实施例提供了一种非易失性计算机可读存储介质，存储有计算机程序，所述计算机程序能够使计算机执行上述实施例所述的双音源音频数据的处理方法的步骤。

对本发明实施例的所述音频数据的处理装置而言，其各功能模块可以集成在一个处理芯片中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中，所述存储介质譬如为只读存储器，磁盘或光盘等。

以上对本发明实施例所提供的一种双音源音频数据的处理方法及装置进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

一种双音源音频数据的处理方法，其特征在于，包括：

获取一同源歌曲对的音频数据，所述同源歌曲对为伴奏相同但演唱不同的两首歌曲；

对所述同源歌曲对的音频数据进行解码处理，得到两个单声道音频数据；

将两个单声道音频数据合并为一个双声道音频数据；

将双声道音频对应的播放时间划分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制。
根据权利要求1所述的方法，其特征在于，所述获取一同源歌曲对的音频数据，所述同源歌曲对为伴奏相同但演唱不同的两首歌曲，包括：

获取候选歌曲对的歌曲信息，所述歌曲信息包括两首歌曲对应的歌词文件和伴奏文件；

根据候选歌曲对中两首歌曲的歌词文件，对候选歌曲对进行歌词筛选，若候选歌曲对中两首歌曲的歌词文件相同，则确定该候选歌曲对为初选歌曲对；

根据初选歌曲对中两首歌曲的伴奏文件，对初选歌曲对进行伴奏筛选，若初选歌曲对中两首歌曲的伴奏文件相同，则确定该初选歌曲对为所述同源歌曲对；

获取所述同源歌曲对对应的两首歌曲的音频数据。
根据权利要求2所述的方法，其特征在于，所述获取候选歌曲对的歌曲信息，包括如下步骤之一：

在歌曲数据库中搜索所有歌曲名相同但歌手名不同的歌曲，将搜索得到的所有歌曲进行两两组合，得到候选歌曲对，并获取所述候选歌曲对的歌曲信息；

在同一位歌手的所有歌曲中搜索标注有语言标签的歌曲，所述语言标签包括歌曲名和语言版本，将所述标注有语言标签的一首歌曲和与所述语言标签中的歌曲名对应的另一首歌曲作为一个候选歌曲对，并获取所述候选歌曲对的歌曲信息。
根据权利要求2所述的方法，其特征在于，所述根据候选歌曲对中两首歌曲的歌词文件，对候选歌曲对进行歌词筛选，若候选歌曲对中两首歌曲的歌词文件相同，则确定该候选歌曲对为初选歌曲对，包括：

分别解析候选歌曲对中两首歌曲的歌词文件，得到每一首歌曲的歌词句子数目及与每一句歌词对应的时间信息；

判断两首歌曲的歌词句子数目是否相同，若是，则将两首歌曲的歌词句子一一对应，判断两首歌曲中相对应的歌词的时间信息是否相同，若是，则将所述候选歌曲对作为初选歌曲对。
根据权利要求2所述的方法，其特征在于，所述根据初选歌曲对中两首歌曲的伴奏文件，对初选歌曲对进行伴奏筛选，若初选歌曲对中两首歌曲的伴奏文件相同，则确定该初选歌曲对为所述同源歌曲对，包括：

分别提取初选歌曲对中两首歌曲的伴奏文件，所述伴奏文件包括至少一段伴奏音频及与所述伴奏音频对应的伴奏时间；

将两首歌曲中伴奏时间相同的伴奏音频一一对应，组成至少一个伴奏对，

分别对每一个伴奏对的两段伴奏音频进行处理，得到与所述伴奏对对应的两个长度相同的二进制序列，计算两个二进制序列的匹配概率，并判断匹配概率是否大于预设值，若是，则确定所述伴奏对的两段伴奏音频相同；

判断是否每一个伴奏对的两段伴奏音频都相同，若是，则确定所述初选歌曲对为所述同源歌曲对。
根据权利要求5所述的方法，其特征在于，所述分别对每一个伴奏对的两段伴奏音频进行处理，得到与所述伴奏对对应的两个长度相同的二进制序列，计算两个二进制序列的匹配概率，并判断匹配概率是否大于预设值，若是，则确定所述伴奏音频对的两段伴奏音频相同，包括：

对每一个伴奏对的两段伴奏音频分别进行解码处理，得到两个伴奏音频数据；

分别对两个伴奏音频数据进行傅里叶变换，生成两个频谱；

将两个频谱等分为相同数量的频段，分别计算每个频谱中每个频段的平均能量值，比较每个频段与前一频段的大小，将比较结果用二进制表示，得到与所述频谱对应的二进制序列；

计算两个二进制序列的匹配概率，所述匹配概率为
其中，n表示二进制序列中数码的总个数，m表示两个二进制序列对应数码位的数码相同的个数，判断匹配概率是否大于预设值，若是，则确定所述伴奏对的两段伴奏音频相同。
根据权利要求5所述的方法，其特征在于，所述将所述双声道音频对应的播放时间切分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制，包括：

所述双声道音频对应的播放时间包括每句歌词的时间信息，根据每句歌词的时间信息将所述播放时间切分为多个播放时段，所述播放时段的数量与歌词的句子数目一致；

在不同的播放时段交替地对双声道音频的左声道和右声道进行能量抑制。
一种双音源音频数据的处理装置，其特征在于，包括处理器和非易失性存储介质，所述非易失性存储介质存储一个或多个计算机可读指令，所述处理器执行所述计算机可读指令以实现步骤：

获取一同源歌曲对的音频数据，所述同源歌曲对为伴奏相同但演唱不同的两首歌曲；

对所述同源歌曲对的音频数据进行解码处理，得到两个单声道音频数据；

将两个单声道音频数据合并为一个双声道音频数据；

将双声道音频对应的播放时间切分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制。
根据权利要求8所述的装置，其特征在于，所述处理器执行所述计算机可读指令以实现步骤：

获取候选歌曲对的歌曲信息，所述歌曲信息包括两首歌曲对应的歌词文件和伴奏文件；

根据候选歌曲对中两首歌曲的歌词文件，对候选歌曲对进行歌词筛选，若候选歌曲对中两首歌曲的歌词文件相同，则确定该候选歌曲对为初选歌曲对；

根据初选歌曲对中两首歌曲的伴奏文件，对初选歌曲对进行伴奏筛选，若初选歌曲对中两首歌曲的伴奏文件相同，则确定该初选歌曲对为所述同源歌曲对。
根据权利要求9所述的装置，其特征在于，所述处理器执行所述计算机可读指令以实现步骤：

在歌曲数据库中搜索所有歌曲名相同但歌手名不同的歌曲，将搜索得到的所有歌曲进行两两组合，得到候选歌曲对；

在同一位歌手的所有歌曲中搜索标注有语言标签的歌曲，所述语言标签包括歌曲名和语言版本，将所述标注有语言标签的一首歌曲和与所述语言标签中的歌曲名对应的另一首歌曲作为一个候选歌曲对。
根据权利要求9所述的装置，其特征在于，所述处理器执行所述计算机可读指令以实现步骤：

分别解析候选歌曲对中两首歌曲的歌词文件，得到每一首歌曲的歌词句子数目及与每一句歌词对应的时间信息；

判断所述候选歌曲对中两首歌曲的歌词句子数目是否相同，若是，则将两首歌曲的歌词句子一一对应，判断两首歌曲中相对应的歌词的时间信息是否相同，若是，则将所述候选歌曲对作为初选歌曲对。
根据权利要求9所述的装置，其特征在于，所述处理器执行所述计算机可读指令以实现步骤：

分别提取初选歌曲对中两首歌曲的伴奏文件，所述伴奏文件包括至少一段伴奏音频及与所述伴奏音频对应的伴奏时间；

将两首歌曲中伴奏时间相同的伴奏音频一一对应，组成至少一个伴奏对，

分别对每一个伴奏对的两段伴奏音频进行处理，得到与所述伴奏对对应的两个长度相同的二进制序列，计算两个二进制序列的匹配概率，并判断匹配概率是否大于预设值，若是，则确定所述伴奏对的两段伴奏音频相同；

判断是否每一个伴奏对的两段伴奏音频都相同，若是，则确定所述初选歌曲对为所述同源歌曲对。
根据权利要求12所述的装置，其特征在于，所述处理器执行所述计算机可读指令以实现步骤：

对每一个伴奏对的两段伴奏音频分别进行解码处理，得到两个伴奏音频数据；

分别对两个伴奏音频数据进行傅里叶变换，生成两个频谱；

将两个频谱等分为相同数量的频段，分别计算每个频谱中每个频段的平均能量值，比较每个频段与前一频段的大小，将比较结果用二进制表示，得到与所述频谱对应的二进制序列；

计算两个二进制序列的匹配概率，所述匹配概率为
其中，n表示二进制序列中数码的总个数，m表示两个二进制序列对应数码位的数码相同的个数，判断匹配概率是否大于预设值，若是，则确定所述伴奏对的两段伴奏音频相同。
根据权利要求8所述的装置，其特征在于，所述处理器执行所述计算机可读指令以实现步骤：

根据双声道音频中每句歌词的时间信息将双声道音频的播放时间划分为多个播放时段，所述播放时段的数量与歌词的句子数目一致；

在不同的播放时段交替地对双声道音频的左声道和右声道进行能量抑制。
一种非易失性计算机可读存储介质，其特征在于，存储有计算机程序，所述计算机程序能够使计算机执行如下步骤：

获取一同源歌曲对的音频数据，所述同源歌曲对为伴奏相同但演唱不同的两首歌曲；

对所述同源歌曲对的音频数据进行解码处理，得到两个单声道音频数据；

将两个单声道音频数据合并为一个双声道音频数据；

将双声道音频对应的播放时间划分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制。
根据权利要求15所述的非易失性计算机可读存储介质，其特征在于，所述计算机程序在使计算机执行所述获取一同源歌曲对的音频数据，所述同源歌曲对为伴奏相同但演唱不同的两首歌曲的步骤时，使计算机执行如下步骤：

获取候选歌曲对的歌曲信息，所述歌曲信息包括两首歌曲对应的歌词文件和伴奏文件；

根据候选歌曲对中两首歌曲的歌词文件，对候选歌曲对进行歌词筛选，若候选歌曲对中两首歌曲的歌词文件相同，则确定该候选歌曲对为初选歌曲对；

根据初选歌曲对中两首歌曲的伴奏文件，对初选歌曲对进行伴奏筛选，若初选歌曲对中两首歌曲的伴奏文件相同，则确定该初选歌曲对为所述同源歌曲对；

获取所述同源歌曲对对应的两首歌曲的音频数据。
根据权利要求16所述的非易失性计算机可读存储介质，其特征在于，所述计算机程序在使计算机执行所述获取候选歌曲对的歌曲信息的步骤时，使计算机执行如下步骤之一：

在歌曲数据库中搜索所有歌曲名相同但歌手名不同的歌曲，将搜索得到的所有歌曲进行两两组合，得到候选歌曲对，并获取所述候选歌曲对的歌曲信息；

在同一位歌手的所有歌曲中搜索标注有语言标签的歌曲，所述语言标签包括歌曲名和语言版本，将所述标注有语言标签的一首歌曲和与所述语言标签中的歌曲名对应的另一首歌曲作为一个候选歌曲对，并获取所述候选歌曲对的歌曲信息。
根据权利要求16所述的非易失性计算机可读存储介质，其特征在于，所述计算机程序在使计算机执行所述根据候选歌曲对中两首歌曲的歌词文件，对候选歌曲对进行歌词筛选，若候选歌曲对中两首歌曲的歌词文件相同，则确定该候选歌曲对为初选歌曲对的步骤时，使计算机执行如下步骤：

分别解析候选歌曲对中两首歌曲的歌词文件，得到每一首歌曲的歌词句子数目及与每一句歌词对应的时间信息；

判断两首歌曲的歌词句子数目是否相同，若是，则将两首歌曲的歌词句子一一对应，判断两首歌曲中相对应的歌词的时间信息是否相同，若是，则将所述候选歌曲对作为初选歌曲对。
根据权利要求16所述的非易失性计算机可读存储介质，其特征在于，所述计算机程序在使计算机执行所述根据初选歌曲对中两首歌曲的伴奏文件，对初选歌曲对进行伴奏筛选，若初选歌曲对中两首歌曲的伴奏文件相同，则确定该初选歌曲对为所述同源歌曲对的步骤时，使计算机执行如下步骤：

分别提取初选歌曲对中两首歌曲的伴奏文件，所述伴奏文件包括至少一段伴奏音频及与所述伴奏音频对应的伴奏时间；

将两首歌曲中伴奏时间相同的伴奏音频一一对应，组成至少一个伴奏对，

分别对每一个伴奏对的两段伴奏音频进行处理，得到与所述伴奏对对应的两个长度相同的二进制序列，计算两个二进制序列的匹配概率，并判断匹配概率是否大于预设值，若是，则确定所述伴奏对的两段伴奏音频相同；

判断是否每一个伴奏对的两段伴奏音频都相同，若是，则确定所述初选歌曲对为所述同源歌曲对。
根据权利要求19所述的非易失性计算机可读存储介质，其特征在于，所述计算机程序在使计算机执行所述分别对每一个伴奏对的两段伴奏音频进行处理，得到与所述伴奏对对应的两个长度相同的二进制序列，计算两个二进制序列的匹配概率，并判断匹配概率是否大于预设值，若是，则确定所述伴奏音频对的两段伴奏音频相同，使计算机执行如下步骤：

对每一个伴奏对的两段伴奏音频分别进行解码处理，得到两个伴奏音频数据；

分别对两个伴奏音频数据进行傅里叶变换，生成两个频谱；

将两个频谱等分为相同数量的频段，分别计算每个频谱中每个频段的平均能量值，比较每个频段与前一频段的大小，将比较结果用二进制表示，得到与所述频谱对应的二进制序列；

计算两个二进制序列的匹配概率，所述匹配概率为
，其中，n表示二进制序列中数码的总个数，m表示两个二进制序列对应数码位的数码相同的个数，判断匹配概率是否大于预设值，若是，则确定所述伴奏对的两段伴奏音频相同。
根据权利要求19所述的非易失性计算机可读存储介质，其特征在于，所述计算机程序在使计算机执行所述将所述双声道音频对应的播放时间切分为多个播放时段，在不同的播放时段对双声道音频的左声道或右声道进行能量抑制，使计算机执行如下步骤：

所述双声道音频对应的播放时间包括每句歌词的时间信息，根据每句歌词的时间信息将所述播放时间切分为多个播放时段，所述播放时段的数量与歌词的句子数目一致；

在不同的播放时段交替地对双声道音频的左声道和右声道进行能量抑制。