WO2016188211A1

WO2016188211A1 - 音频处理方法、装置及系统

Info

Publication number: WO2016188211A1
Application number: PCT/CN2016/077218
Authority: WO
Inventors: 赵伟峰; 李纯; 刘翔; 徐豪杰; 张德文; 郑飞; 曹利; 李天文; 陈向文; 王宝华; 王美星; 刘智勇; 黄斯亮; 宋波; 王伟龙; 邓小康; 谭升民; 傅鸿城; 张庆; 石玉磊
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2015-05-27
Filing date: 2016-03-24
Publication date: 2016-12-01
Also published as: EP3306606A4; US20180090116A1; US10403255B2; JP2018519536A; KR20180012800A; EP3306606A1

Abstract

一种音频处理方法、装置和系统，可以实现与他人合唱的K歌体验。该方法包括：获取歌曲的音频文件和所述歌曲的歌词文件；在所述歌词文件的第一歌词部分对应的显示时间播放所述音频文件并录制用户的音频数据；在所述歌词文件的第二歌词部分对应的显示时间播放所述音频文件；对所述用户的音频数据和所述音频文件在所述第一歌词部分对应的显示时间的音频数据进行混音处理。

Description

音频处理方法、装置及系统

相关申请的交叉引用

本申请要求2015年5月27日提交中国专利局、申请号为201510278911.5、发明名称为“一种K歌处理方法及装置”，以及2015年5月27提交中国专利局、申请号为201510280087.7、发明名称为“K歌处理方法、装置以及K歌处理系统”以及2015年5月27提交中国专利局、申请号为201510280492.9发明名称为“K歌处理方法及系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及音频处理领域，尤其涉及一种音频处理方法、装置以及系统。

背景技术

随着人们生活质量的提高，K歌应用正逐步走向人们的日常生活，K歌应用具有的功能也日益丰富。

K歌应用是音乐播放器和录音软件的结合体，既可以播放原唱，也可以录制用户的歌声，并将录制的歌声与伴奏进行混音得到音乐文件，用户还可以将上述音乐文件上传到网络，以便让更多的人听到自己的歌声。

通常，在用户录制自己的歌声时，K歌应用会使用伴奏音频文件为用户的歌声录制提供伴奏，然而，这过程中，只能用户一人单独K歌，无法达到与他人(例如明星)合唱的K歌体验。

发明内容

本发明实施例提供了一种音频处理方法、装置和系统，可以实现与他人合唱的K歌体验。

本发明实施例的第一方面提供一种音频处理方法，包括：

获取歌曲的音频文件和所述歌曲的歌词文件；

在所述歌词文件的第一歌词部分对应的显示时间播放所述音频文件并录制用户的音频数据；

在所述歌词文件的第二歌词部分对应的显示时间播放所述音频文件；

对所述用户的音频数据和所述音频文件在所述第一歌词部分对应的显示时间的音频数据进行混音处理。

本发明实施例第二方面提供了一种音频处理装置，包括至少一个处理器和存储器，所述存储器存储有程序指令，所述程序指令当由处理器执行时，配置所述音频处理装置执行根据本发明任意实施例的方法。

本发明实施例第三方面提供了一种音频处理系统，包括服务器和至少一个客户端，所述服务器和/或所述客户端被配置为执行根据本发明任意实施例的方法。

本发明实施例第四方面提供了一种音频处理装置，包括：

第一获取单元，用于获取歌曲的音频文件以及所述歌曲的歌词文件；

第一处理单元，用于在所述歌词文件的第一歌词部分对应的显示时间和第二歌词部分对应的显示时间播放所述音频文件，并在所述歌词文件的第一歌词部分对应的显示时间录制用户的音频数据；

第一混音单元，用于对所述用户的音频数据和所述音频文件在所述第一歌词部分对应的显示时间的音频数据进行混音处理。

相对于现有技术，本发明实施例中在第一歌词部分对应的显示时间播放音频文件(例如伴奏音频文件)和录制用户的音频数据，在第二歌词部分对应的显示时间播放音频文件(例如原唱音频文件)，由此，可以实现歌曲在第一歌词部分的显示时间由用户演唱，在第二歌词部分的显示时间由他人或者明星原唱，从而实现与他人或者明星合唱的K歌体验。

附图说明

图1为根据本发明一个示例实施例的音频处理方法示意图；

图2为根据本发明另一示例实施例的音频处理方法示意图；

图3为根据本发明又一示例实施例的音频处理方法示意图；

图4为根据本发明又一示例实施例的音频处理方法示意图；

图5为根据本发明又一示例实施例的音频处理方法示意图；

图6为根据本发明一个示例实施例的音频处理装置示意图；

图7为根据本发明另一示例实施例的音频处理装置示意图；

图8为根据本发明一个示例实施例的音频处理装置示意图；

图9为根据本发明一个示例实施例的音频处理系统示意图；

图10为根据本发明另一示例实施例的音频处理系统示意图。

具体实施方式

本发明实施例提供了一种音频处理方法、装置以及系统，可以实现与他人(例如明星)合唱的K歌体验，以下分别进行详细说明。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例提供一种音频处理方法，包括：获取歌曲的音频文件和所述歌曲的歌词文件；在所述歌词文件的第一歌词部分对应的显示时间播放所述音频文件并录制用户的音频数据；在所述歌词文件的第二歌词部分对应的显示时间播放所述音频文件；对所述用户的音频数据和所述音频文件在所述第一歌词部分对应的显示时间的音频数据进行混音处理。可选地，可以在所述歌词文件的第二歌词部分对应的显示时间播放所述音频文件，但不录制用户的音频数据。或者，在所述歌词文件的第二歌词部分对应的显示时间播放所述音频文件并录制用户的音频数据，但在混音处理或生成合唱文件时不使用或去除在所述歌词文件的第二歌词部分对应的显示时间录制的所述用户的音频数据。本发明实施例的音频处理方法可以由任意计算装置执行，所述计算装置包括但不限于：手机、个人计算机(PC，Personal Computer)和/或平板电脑等。本发明实施例的音频处理方法也可以由包括服务器和客户端的系统中的服务器或者客户端执行或者由服务器与客户端协作执行。

本发明实施例的音频处理方法的一个例子是K歌处理方法，本领域的技术人员可以理解音频处理方法可以有其它应用。此外，歌词文件可以由其它任意文本文件或者图片代替，歌曲的音频可以由其他音频代替，而不会脱离本发明的原理。

需要说明的是，客户端具体可以包括手机、个人计算机(PC，Personal Computer)和/或平板电脑等设备。具体实现时，可以通过这些客户端登录网页，或者在这些客户端上加载程序，或者使用各移动平台发布的应用程序(App，Application)来访问K歌服务。

请参阅图1，图1示出了根据本发明一个示例实施例的音频处理方法。在该实施例中以客户端作为音频处理方法的执行主体进行描述，本领域的技术人员可以理解该实施例的方法可以由其它主体执行。

101、客户端接收用户的请求。

例如，当用户想选取歌曲进行K歌时，需向客户端输入K歌请求，以触发K歌处理流程。

102、客户端根据该请求获取歌曲的音频文件以及对应的歌词文件。歌曲的音频文件例如可以包括歌曲的伴奏音频文件以及歌曲的原唱音频文件等。由此，客户端获取歌曲的音频文件可以包括客户端获取歌曲的伴奏音频文件以及歌曲的原唱音频文件等。

在接收到用户输入的K歌请求时，客户端可以根据该K歌请求确定用户选取的歌曲，并进一步获取该歌曲的伴奏音频文件、原唱音频文件以及对应的歌词文件。客户端例如可以从服务器获取歌曲的伴奏音频文件、原唱音频文件以及对应的歌词文件。

伴奏音频文件和原唱音频文件例如可以是裸音频数据，在实际应用过程中，如果获取的伴奏音频文件或原唱音频文件为压缩格式的音频数据，如mp3格式，则服务器先将该压缩格式的音频数据解压缩为裸音频数据。

需要说明的是，歌词文件例如可以包括用于标识歌词显示时间的时间信息，以便歌词文件根据该时间信息与伴奏音频文件、原唱音频文件同步。例如该歌词文件可以包括LRC歌词文件，该LRC歌词文件通过其包含的时间标签来标识歌词显示时间。

103、客户端在歌词文件的第一歌词部分对应的显示时间和第二歌词部分对应的显示时间播放音频文件，同时在歌词文件的第一歌词部分对应的显示时间录制用户的音频数据。

根据本发明的一个实施例在歌词文件的第二歌词部分对应的显示时间播放音频文件，但不录制用户的音频数据，例如关上用于录制用户的音频数据的麦克风。根据本发明的另一实施例在歌词文件的第二歌词部分对应的显示时间播放音频文件同时也录制用户的音频数据，但是在下文要描述的混音处理或生成合唱文件时去除(或者不使用)在歌词文件的第二歌词部分对应的显示时间录制的用户的音频数据。

根据本发明的实施例，在获取的歌曲的音频文件包括歌曲的伴奏音频文件以及歌曲的原唱音频文件时，在歌词文件的第一歌词部分对应的显示时间播放伴奏音频文件，在歌词文件的第二歌词部分对应的显示时间播放原唱音频文件。

可选地播放音频文件和录制用户的音频数据之前，在客户端对该歌词文件进行划分处理，以得到第一歌词部分和第二歌词部分。

客户端可以采用多种实施方式对该歌词文件进行划分处理，得到第一歌词部分和第二歌词部分，下面分别举例说明：

第一种是，在步骤103之前，客户端接收用户的划分指令，然后根据该划分指令对该歌词文件进行划分处理，得到第一歌词部分和第二歌词部分。

在本实施例中，可以在客户端预置多种歌词划分处理策略并通过上述歌词划分处理策略将歌词文件划分为两个歌词部分，下面进行举例：

(1)、客户端根据歌词文件中的时间信息确定该歌词文件的段落信息，再根据该段落信息将该歌词文件划分为两个歌词部分。

在本实施例中，该歌词文件的时间信息可以反映相应歌曲各个段落显示时间的起点和终点，由此，客户端可以根据该时间信息确定歌词文件包括几个段落且每个段落对应的显示时间的起点和终点。再根据上述段落信息对歌词文件进行划分时，服务器可以将预设的至少一个段落划为一个歌词部分，则其他部分划为另一个歌词部分。具体此处对每个歌词部分的段落数量以及具体为哪个或哪几个段落不设限定。例如，段落信息的结构体可以表示为：

typdef struct section_info{

int section_id；//段落id

int start_ms；//开始时间ms

int end_ms；//结束时间ms

int role_id；//角色id

}Ssection,*PSection；

其中，上述角色id用于表示该歌曲对应为女声演唱部分还是男声演唱部分，作为优选，可以将女声演唱部分对应的段落设置为一个歌词部分，将男声演唱部分对应的段落设置为另一个歌词部分，以便利用男女角色的区别来划分歌词，得到不同角色的两个歌词部分。

(2)、客户端确定该歌词文件的主歌部分和副歌部分，并将主歌部分确定为一个歌词部分，将副歌部分确定为另一个歌词部分。

在本实施例中，客户端可以利用主歌和副歌的区别来划分歌词，以便得到对应主歌的一个歌词部分，对应副歌的另一个歌词部分，从而通过主歌和副歌的区别将歌词文件划分为两个歌词部分。

(3)、客户端根据自定义的模板对该歌词文件进行划分处理，得到两个歌词部分；

在本实施例中，客户端可以预先自定义多个划分歌词的模板，再根据上述自定义的模板对该歌词文件进行划分处理，得到两个歌词部分。例如，将固定的N句歌词或者N个字设置为一个歌词部分，具体此处对于如何设置自定义的模板不做限定，本领域技术人员可以根据实际情况设置多种不同模板。

需要说明的是，客户端在接收到用户的划分指令时，根据该划分指令采用相应的歌词划分处理策略进行划分处理，从而得到对应的第一歌词部分和第二歌词部分。可选地，在实际应用过程中，客户端还可以提供一选取模块，供用户对划分得到的两个歌词部分进行选取，以指定哪一部分作为第一歌词部分或者哪一步部分作为第二部分。例如，通过选取模块，用户可以选择将男声演唱部分作为第一歌词部分，以供自己演唱，或者将男声演唱部分作为第二歌词部分，以由他人演唱或由明星原唱。

在客户端对所述歌词文件进行划分处理，得到第一歌词部分和第二歌词部分之后，客户端可以在第一歌词部分对应的显示时间播放伴奏音频文件和录制用户的音频数据，在第二歌词部分的显示时间播放原唱音频文件。

第二种是，客户端根据是否有声音输入来对歌词文件进行划分处理，得到第一歌词部分和第二歌词部分。

具体包括：客户端检测是否有声音输入，若是，则将歌词文件在对应显示时间内的歌词部分划分为第一歌词部分，并播放伴奏音频文件和切换到麦克风输入模式以录制用户的音频数据，若否，则将歌词文件在对应显示时间内的歌词部分划分为第二歌词部分，并播放原唱音频文件。可以理解的是，此处歌词文件的划分处理操作和播放、录制等操作同步进行，而无需等得到第一歌词部分和第二歌词部分之后，客户端再在第一歌词部分对应的显示时间播放伴奏音频文件和录制用户的音频数据，在第二歌词部分的显示时间播放原唱音频文件。

在本实施例中，上面仅以几个例子说明了如何对该歌词文件进行划分处理，得到第一歌词部分和第二歌词部分，在实际应用过程中，客户端可以对上述划分处理方式进行结合使用，还可以采用更多其他的划分处理方式，具体此处不做限定。

为方便用户快速识别哪部分为自己需要演唱的歌词，哪部分为他人或者明星演唱的歌词，客户端可以进一步对显示在客户端上的歌词进行标识，由此，作为优选，本实施例还可以进一步包括：客户端对显示在客户端的第一歌词部分设置第一标识，对显示在客户端的第二歌词部分设置第二标识。可以理解的是，上述标识可以为颜色标识，例如，第一歌词部分显示一种颜色，第二歌词部分显示另一个颜色；或者上述标识为高亮状态标识，例如，第一歌词部分显示为高亮状态，第二歌词部分显示为非高亮状态，具体此处对采用标识的具体实现形式不做限定，本领域技术人员可以根据需求获取更多其他的标识形式。

104、客户端对该用户的音频数据和音频文件在第一歌词部分对应的显示时间的音频数据进行混音处理，得到混音音频文件。

根据本发明的实施例，在得到用户的音频数据(例如麦克风采集的音频数据)后，客户端对该用户的音频数据和音频文件在第一歌词部分对应的显示时间的音频数据进行混音处理，得到混音音频文件，由此，该混音音频文件可以体现用户演唱部分的全部音频数据，包括用户的声音以及对应的伴奏。

混音处理的具体过程可参见现有的混音算法，例如，直接将对应采样点数据相加除以二。

在音频文件包括伴奏音频文件以及原唱音频文件的条件下，客户端对该用户的音频数据和伴奏音频文件在第一歌词部分对应的显示时间的音频数据进行混音处理。

根据本发明的可选实施例，客户端对该用户的音频数据和音频文件在第一歌词部分对应的显示时间的音频数据进行混音处理之后，在第一歌词部分对应的显示时间输出(或选取)混音音频文件，在第二歌词部分对应的显示时间输出(或选取)音频文件，以生成合唱文件。而在音频文件包括伴奏音频文件以及原唱音频文件的条件下，为生成合唱文件，在第二歌词部分对应的显示时间输出(或选取)的是原唱音频文件。

在生成合唱文件的过程中，若为第一歌词部分对应的显示时间，则获取混音音频文件在对应时间段的音频数据，若为第二歌词部分对应的显示时间，则获取该原唱音频文件在对应时间段的音频数据，再按照时间先后顺序将各个时间点的音频数据合成一个音频文件，合成的该音频文件即为合唱文件。需要强调的是，在上述生成合唱文件的过程中，由歌词的显示时间确定具体输出目标音频文件和原唱音频文件在哪个时间段的音频数据。由此，得到的合唱文件在第一歌词部分对应的显示时间，输出的为相应时间段的用户演唱部分，在第二歌词部分对应的显示时间，输出的为相应时间段的原唱部分。

可选地，客户端对上述合唱文件在切换点的音频数据进行平衡处理，其中，该切换点指由第一歌词部分对应的显示时间切换至第二歌词部分对应的显示时间的时间点或者由第二歌词部分对应的显示时间切换至第一歌词部分对应的显示时间的时间点。此处，由于混音音频文件由两个音频文件拼接而成，在拼接在切换点进行平衡处理可以保证混音音频文件的音频质量。在本实施例中，具体的平衡处理方式可参见现有的音频拼接技术，比如均值滤波、叠加处理等。

可选地，在本实施例中，用户还可以通过客户端将该合唱文件上传到网络，以便与其他人分享自己与他人或者明星的合唱。

上文描述了客户端获取的歌曲的音频文件可以包括歌曲的伴奏音频文件以及歌曲的原唱音频文件。可替代地，客户端获取的歌曲的音频文件可以是下文将要描述的目标音频文件，因此，客户端获取歌曲的音频文件例如可以包括客户端接收服务器发送的目标音频文件。此外，客户端获取歌曲的歌词文件例如可以包括客户端接收服务器发送的目标歌词文件。关于服务器发送目标音频文件和/或目标歌词文件的具体过程将在下文进行详细描述。在客户端接收服务器发送的目标音频文件和/或目标歌词文件的情况下，在上述步骤103中，客户端可以不对歌词文件进行划分处理。

相对于现有技术，本发明实施例中仅在第一歌词部分对应的显示时间播放伴奏音频文件和录制用户的音频数据，而在第二歌词部分对应的显示时间播放原唱音频文件，由此，可以实现歌曲在第一歌词部分的显示时间由用户演唱，在第二歌词部分的显示时间由他人或者明星原唱，从而实现与他人或者明星合唱的K歌体验。而且，在本实施例可以直接在客户端利用普通的伴奏音频文件便可实现与他人或者明星合唱的K歌体验。

请参阅图2，图2示出根据本发明另一实施例的音频处理方法。在该实施例中以服务器作为音频处理方法的执行主体进行描述，本领域的技术人员可以理解该实施例的方法可以由其它主体执行。

201、服务器获取歌曲的伴奏音频文件、原唱音频文件以及对应的歌词文件。关于伴奏音频文件、原唱音频文件以及对应的歌词文件在上文已有详细描述，为了简明这里不再重复。

202、服务器对该歌词文件进行划分处理，得到第一歌词部分和第二歌词部分，并对应生成歌词划分信息。

服务器可以采用多种实施方式对该歌词文件进行划分处理，得到第一歌词部分和第二歌词部分，下面分别举例说明第一种是：服务器根据该时间信息确定该歌词文件的段落信息，再根据该段落信息对该歌词文件进行划分处理，得到第一歌词部分和第二歌词部分。

第二种是：服务器确定该歌词文件的主歌部分和副歌部分，并将主歌部分确定为第一歌词部分，将副歌部分确定为第二歌词部分，或者将副歌部分确定为第一歌词部分，将主歌部分确定为第二歌词部分。

第三种是：服务器根据自定义的模板对该歌词文件进行划分处理，得到第一歌词部分和第二歌词部分。

需要说明的是，上面描述了如何对该歌词文件进行划分处理的几个例子，为了简明，这里对这些例子没有详细说明，这些例子的详细描述可以参照上文步骤中103的相关描述。

可选地，在服务器执行步骤202之前，还可以包括：接收客户端发送的划分指令，该划分指令用于指示用户指定的划分处理方式，则服务器将根据该划分指令对该歌词文件进行划分处理，得到第一歌词部分和第二歌词部分，由此，可以实现让用户选择如何划分歌词，并得到符合用户意愿的第一歌词部分和第二歌词部分。

在本实施例中，在经划分处理得到第一歌词部分和第二歌词部分后，服务器还对相应的划分处理结果进行记录，以对应生成歌词划分信息，其中，该歌词划分信息包括用于标识该第一歌词部分的标识信息。此处，由于歌词总共由两部分构成，在具有标识该第一歌词部分的标识信息后，服务器或者客户端等都可以识别对应的第二歌词部分。当然，在其他一些实施例中，该歌词划分信息还可以包括用于标识该第二歌词部分的标识信息。

203、服务器在第一歌词部分对应的显示时间输出(或选取)伴奏音频文件，在第二歌词部分的显示时间输出(或选取)原唱音频文件，以生成目标音频文件。

在生成目标音频文件的过程中，若为第一歌词部分对应的显示时间，则获取伴奏音频文件在对应时间段的音频数据，若为第二歌词部分对应的显示时间，则获取该原唱音频文件在对应时间段的音频数据，再按照时间先后顺序将各个时间点的音频数据合成一个音频文件，合成的该音频文件即为目标音频文件。需要强调的是，在上述生成目标音频文件的过程中，由歌词的显示时间确定具体输出伴奏音频文件和原唱音频文件在哪个时间段的音频数据。由此，在播放目标音频文件时，在第一歌词部分对应的显示时间，输出的为相应时间段的伴奏，在第二歌词部分对应的显示时间，输出的为相应时间段的原唱，即目标音频文件能够实现在伴奏与原唱之间自动切换。

可选地，所述方法还包括：服务器对该目标音频文件在切换点的音频数据进行平衡处理，其中，该切换点指由第一歌词部分对应的显示时间切换至第二歌词部分对应的显示时间的时间点或者由第二歌词部分对应的显示时间切换至第一歌词部分对应的显示时间的时间点。此处，由于目标音频文件由两个音频文件拼接而成，在拼接在切换点进行平衡处理可以保证目标音频文件的音频质量。在本实施例中，具体的平衡处理方式可参见现有的音频拼接技术，比如均值滤波、叠加处理等。

204、服务器向客户端发送目标音频文件和目标歌词文件。

在接收到客户端发送的请求(例如K歌请求)时，服务器向客户端发送目标音频文件和目标歌词文件，以便客户端以目标音频文件作为伴奏音频、以目标歌词文件作为待播放歌词向用户提供K歌服务。其中，该目标歌词文件通过在上述歌词文件中携带该歌词划分信息得到。在本实施例中，客户端在播放目标音频数据时，在第一歌词部分的显示时间，输出的为相应时间段的伴奏，在第二歌词部分对应的显示时间，输出的为相应时间段的原唱，由此，可以实现在第一歌词部分的显示时间由用户演唱，在第二歌词部分的显示时间由他人演唱(或由明星原唱)，从而实现与他人或明星合唱的K歌体验。可以理解的是，本实施例中仅通过服务器生成目标音频文件和目标歌词文件、并向客户端上述目标音频文件和目标歌词文件，便可实现与他人或明星合唱的K歌体验，此过程中无需改变客户端逻辑。

相对于现有技术，本发明实施例中服务器向客户端发送的目标音频文件在第一歌词部分的显示时间对应为伴奏，在第二歌词部分的显示时间对应为原唱，与现有技术中直接向客户端提供伴奏音频文件相比，本发明实施例可以实现在第一歌词部分的显示时间由用户演唱，在第二歌词部分的显示时间由他人或者明星原唱，从而实现与他人或者明星合唱的K歌体验。

请参阅图3，图3示出根据本发明另一示例实施例的音频处理方法，包括：

301、服务器获取歌曲的伴奏音频文件、原唱音频文件以及对应的歌词文件；

302、服务器对该歌词文件进行划分处理，得到第一歌词部分和第二歌词部分；

303、服务器在第一歌词部分对应的显示时间输出伴奏音频文件，在第二歌词部分的显示时间输出原唱音频文件，以生成目标音频文件；

304、服务器向客户端发送目标音频文件和目标歌词文件；

步骤301至304的过程与图2所示实施例中的步骤201至步骤204的过程相同，此处不再赘述。

305、客户端播放目标音频文件和目标歌词文件。

客户端在接收到服务器发送的目标音频文件和目标歌词文件后，客户端的K歌应用播放上述目标音频文件和目标歌词文件，其中，该目标音频文件作为伴奏音频进行播放。

306、客户端根据歌词划分信息在第一歌词部分对应的显示时间录制用户的音频数据。

在本实施例中，客户端根据歌词划分信息可以识别第一歌词部分对应的显示时间以及第二歌词部分对应的显示时间，并在第一歌词部分对应的显示时间录制用户的音频数据，在第二歌词部分对应的显示时间停止录制，此时客户端播放的目标文件对应他人或者明星原唱，由此，可实现在第一歌词部分的显示时间由用户演唱，在第二歌词部分的显示时间由他人或者明星原唱，从而实现与他人或者明星合唱的K歌体验。

307、客户端对用户的音频数据和目标音频文件进行混音处理，得到合唱文件。

在本实施例中，得到的合唱文件在第一歌词部分的显示时间为用户演唱的音频数据，在第二歌词部分的显示时间为他人或者明星原唱的音频数据(即该原唱音频文件在对应时间段的音频数据)。可选地，在本实施例中，用户还可以通过客户端将该合唱文件上传到网络，以便与其他人分享自己与他人或者明星的合唱。

请参阅图4，图4示出根据本发明又一实施例的音频处理方法，包括：

401、第一客户端接收第一用户的第一请求。

该第一请求例如是用于请求发起合唱的第一合唱请求。例如，在实际应用过程中，第一客户端可以设置对应于该第一合唱请求的按钮，在第一用户按下该按钮时，第一客户端接收第一合唱请求。

402、第一客户端根据该第一请求从服务器获取歌曲的伴奏音频文件和歌词文件，以便第一用户利用伴奏音频文件和歌词文件基于部分歌词进行录音，得到第一录制文件。关于伴奏音频文件、原唱音频文件以及对应的歌词文件在上文已有详细描述，为了简明这里不再重复。

在获取伴奏音频文件和歌词文件后，客户端播放上述伴奏音频文件和歌词文件，第一用户可以选择任意的歌词进行演唱，当然，第一用户不对全部歌词进行演唱，同时客户端对该第一用户利用上述伴奏音频文件和歌词文件基于部分歌词进行的演唱进行录音，以得到第一录制文件。

403、第一客户端基于所述第一录制文件确定第二歌词部分，并对应生成段落信息。

该第二歌词部分是指第一用户演唱过的歌词部分，即第一客户端基于第一录制文件识别出哪些歌词部分为第一用户演唱过的歌词部分，并对应生成段落信息，该段落信息包括用于标识该第二歌词部分的标识信息，以便对第一用户演唱过的歌词部分进行记载。

可选地，标识信息可以包括第二歌词部分所对应的显示时间，例如，第二歌词部分的开始时间是10S，结束时间是15S等，或者标识信息可以包括第二歌词部分的句子标识，例如，第二歌词部分为第1、3、5句等，具体此处对标识信息的具体形式不做限定，只要第一客户端能根据该标识识别出第二歌词部分即可。

第一客户端可以采用多种实施方式来确定第二歌词部分，例如，第一客户端可以对第一录制文件中声音的有效性来确定哪些歌词部分为第一用户演唱过的歌词部分，具体包括：

第一客户端判断第一用户在某一歌词部分录入的声音是否有效，若是，则确定对应的歌词部分为第二歌词部分。

可选地，第一客户端判断声音的音量是否大于第一预设值，若是，则确定第一用户在某一歌词部分录入的声音有效。具体此处可以参考VAD算法或者其改进算法。

作为优选，在确定第一用户在某一歌词部分录入的声音有效后，第一客户端进一步判断录入的声音所占用的时间与该歌词部分所占用的显示时间是否对应，若是，则确定该歌词部分为第二歌词部分。

例如，此处以歌词部分中的句子为单位，在确定在某一句歌词录入的声音有效后，如果在该句歌词录入的声音所占用的显示时间为20S-30S，而在该句歌词所占用的显示时间也为20至30，则可以确定该句歌词为第二歌词部分，具体此处可以设置一个阈值，当该句歌词所占用的显示时间与该句歌词所占用的显示时间的重合比例大于该阈值时，确定满足该句歌词所占用的显示时间与该句歌词所占用的显示时间对应。

可以理解的是，在本实施例中，还可以采用更多的实施方式来确定第二歌词部分，具体此处不做限定。在实际应用过程中，第一客户端可以引入包含上述确定方式的音频实时检测模块来确定第二歌词部分。

404、第一客户端对所述第一录制文件和所述伴奏音频文件进行混音处理，得到目标音频文件。

可选地，为防止第一录制文件在第二歌词部分以外的歌词部分还包括一些噪声或者被判断为无效的声音，则在执行步骤404之前还可以包括：

第一客户端根据段落信息对第一录制文件在第二歌词部分以外的歌词部分所对应的音频数据进行清零，由此，可以确保得到的第一录制文件仅在第二歌词部分的显示时间包含音频数据，相当于仅包含第一用户演唱的有效声音。

405、第一客户端向服务器发送目标音频文件和段落信息，以便第二客户端从服务器获取该目标音频文件和段落信息，并以该目标音频文件作为伴奏音频、根据段落信息向第二用户提供K歌服务。

第二客户端在从服务器获取该目标音频文件和段落信息，可以以该目标音频文件作为伴奏音频、根据段落信息向第二用户提供K歌服务。具体地，第二用户根据该段落信息可以确定哪些歌词部分已经被演唱，并在没有被演唱过的歌词部分进行演唱。

可选地，在本实施例还可以包括：该第一客户端生成配置文件，该配置文件包括第一用户所采用的音效参数；第一客户端向服务器发送该配置文件，以便第二客户端以该目标音频文件作为伴奏音频、根据段落信息和配置文件向第二用户提供K歌服务。可选地，上述音效参数包括混响参数、变声变调参数、声音美化参数等。

相对于现有技术，本发明实施例中的目标音频文件仅在第二歌词部分的显示时间由第一用户演唱，而在第二歌词部分以外的歌词部分为伴奏，由此，当第二客户端的以该目标音频文件作为伴奏音频时，可以根据段落信息在第二歌词部分以外的歌词部分进行演唱，以实现在第二歌词部分的显示时间由第一用户演唱，在第二歌词部分以外的歌词部分的显示时间由第二用户演唱，从而实现与他人合唱的K歌体验。

请参阅图5，图5示出本发明实施例中音频处理方法另一实施例，包括：

501、第一客户端接收第一用户的第一请求；

502、第一客户端根据该第一请求从服务器获取歌曲的伴奏音频文件和歌词文件，以便第一用户利用伴奏音频文件和歌词文件基于部分歌词进行录音，得到第一录制文件；

503、第一客户端基于所述第一录制文件确定第二歌词部分，并对应生成段落信息；

504、第一客户端对所述第一录制文件和所述伴奏音频文件进行混音处理，得到目标音频文件；

505、第一客户端向服务器发送目标音频文件和段落信息，以便第二客户端从服务器获取该目标音频文件和段落信息，并以该目标音频文件作为伴奏音频、根据段落信息向第二用户提供K歌服务。

步骤501至505的过程与图4所示实施例中的步骤401至步骤405的过程相同，此处不再赘述。

506、第二客户端接收第二用户发送的第二请求。

该第二请求用于请求加入合唱，以触发合唱加入流程。例如，在实际应用过程中，第二客户端可以设置对应于该第二合唱请求的按钮，在第二用户按下该按钮时，第二客户端接收第二合唱请求。

507、第二客户端根据该第二请求从服务器获取歌曲的目标音频文件、歌词文件以及段落信息，以便第二用户以目标音频文件作为伴奏音频并根据段落信息基于第二歌词部分以外的全部或部分歌词进行录音，得到第二录制文件。

在接收到第二请求时，第二客户端首先从服务器获取目标音频文件、歌词文件以及段落信息，然后播放上述目标音频文件和歌词文件，第二用户基于第二歌词部分以外的全部或部分歌词进行演唱，同时第二客户端对该第二用户以目标音频文件作为伴奏音频并根据段落信息基于第二歌词部分以外的全部或部分歌词进行的演唱进行录音，以得到第二录制文件。需要强调的是，如果第二用户基于第二歌词部分以外的部分歌词部分进行演唱，而不是基于第二歌词部分以外的全部歌词部分进行演唱，该歌曲还有一部分歌词可以由更多其他的用户加入合唱。

可选地，当第一客户端向服务器发送过配置文件，在服务器上还包括该配置文件时，步骤507具体可以包括：第二客户端从服务器获取歌曲的目标音频文件、歌词文件、段落信息以及配置文件，以便第二用户以目标音频文件作为伴奏音频并根据段落信息和配置文件基于第二歌词部分以外的部分或全部歌词部分进行录音，得到第二录制文件。在实际应用过程中，客户端根据配置文件中的音效参数进行相应配置，并下发给第二用户供该第二用户选择，用户也可以根据实际需要修改相应的参数配置。

508、第二客户端对第二录制文件和目标音频文件进行混音处理，得到混音音频文件。

可以理解的是，混音音频文件在第二歌词部分由第一用户演唱，在第二歌词部分以外的部分或全部歌词部分由第二用户演唱，由此，可以实现两个用户合唱的K歌体验。

可选地，在本实施例中，为防止第二录制文件在第二歌词部分以外的歌词部分还包括一些噪声或者被判断为无效的声音，则在执行步骤508之前还可以包括：第二客户端根据段落信息对第一录制文件在第二歌词部分所对应的音频数据进行清零。

上面对本发明实施例中的音频处理方法进行了描述，下面对本发明实施例中的音频处理装置进行描述，请参阅图6，图6是根据本发明示例实施例的音频处理装置，其包括第一接收单元601、第一获取单元602、第一处理单元603和第一混音单元604。

第一接收单元601用于接收用户的请求。

第一获取单元602用于根据所述请求获取歌曲的音频文件以及对应的歌词文件。其中，所述歌词文件包括用于标识歌词显示时间的时间信息。歌曲的音频文件例如可以包括歌曲的伴奏音频文件以及歌曲的原唱音频文件等。

第一处理单元603用于在所述第一歌词部分对应的显示时间和第二歌词部分对应的显示时间播放所述音频文件，同时在歌词文件的第一歌词部分对应的显示时间录制用户的音频数据。第一处理单元603，例如还可以用于对所述歌词文件进行划分处理，得到第一歌词部分和第二歌词部分。

在获取的歌曲的音频文件包括歌曲的伴奏音频文件以及歌曲的原唱音频文件时，第一处理单元603在所述第一歌词部分对应的显示时间播放所述伴奏音频文件和录制用户的音频数据，在第二歌词部分的显示时间播放所述原唱音频文件。

第一混音单元604用于对所述用户的音频数据和所述音频文件在所述第一歌词部分对应的显示时间的音频数据进行混音处理，得到混音音频文件。在音频文件包括伴奏音频文件以及原唱音频文件的条件下，第一混音单元604对该用户的音频数据和伴奏音频文件在第一歌词部分对应的显示时间的音频数据进行混音处理。

为便于理解，下面以一具体应用场景为例，对本实施例中的音频处理装置的内部运作流程进行描述：

第一接收单元601接收用户输入的K歌请求；第一获取单元602根据所述K歌请求获取歌曲的伴奏音频文件、原唱音频文件以及对应的歌词文件，其中，所述歌词文件包括用于标识歌词显示时间的时间信息；第一处理单元603对所述歌词文件进行划分处理，得到第一歌词部分和第二歌词部分，并在所述第一歌词部分对应的显示时间播放所述伴奏音频文件和录制用户的音频数据，在第二歌词部分的显示时间播放所述原唱音频文件。

本发明实施例提供的技术方案中，客户端的第一获取单元602在通过第一接收单元601接收到用户输入的K歌请求时，根据该K歌请求获取歌曲的伴奏音频文件、原唱音频文件以及对应的歌词文件，其中，该歌词文件包括用于标识歌词显示时间的时间信息；然后由第一处理单元603对该歌词文件进行划分处理，得到第一歌词部分和第二歌词部分，并在第一歌词部分对应的显示时间播放伴奏音频文件和录制用户的音频数据，在第二歌词部分的显示时间播放原唱音频文件；再对上述经录制得到的用户的音频数据和伴奏音频文件在第一歌词部分对应的显示时间的音频数据进行混音处理，得到混音音频文件，并在第一歌词部分对应的显示时间输出混音音频文件，在第二歌词部分对应的显示时间输出原唱音频文件，以生成合唱文件。因此相对于现有技术，本发明实施例中客户端在对歌词文件进行划分处理，得到第一歌词部分和第二歌词部分后，仅在第一歌词部分对应的显示时间播放伴奏音频文件和录制用户的音频数据，而在第二歌词部分对应的显示时间播放原唱音频文件，由此，可以实现一部分在第一歌词部分的显示时间由用户演唱，在第二歌词部分的显示时间由明星原唱，从而实现与明星合唱的K歌体验。

可选地，在本实施例中，所述音频处理装置还可以包括：

第一生成单元605，用于在所述第一歌词部分对应的显示时间输出(或选取)所述混音音频文件，在所述第二歌词部分对应的显示时间输出(或选取)所述音频文件，以生成合唱文件。而在音频文件包括伴奏音频文件以及原唱音频文件的条件下，为生成合唱文件，在第二歌词部分对应的显示时间输出(或选取)的是原唱音频文件。

可选地，所述第一接收单元601，还用于接收所述用户的划分指令；所述第一处理单元603，具体用于根据所述划分指令对所述歌词文件进行划分处理，得到第一歌词部分和第二歌词部分。

可选地，所述第一处理单元603，具体用于检测是否有声音输入，若是，则将所述歌词文件在对应显示时间内的歌词部分划分为第一歌词部分，并播放所述伴奏音频文件和录制用户的音频数据，若否，则将所述歌词文件在对应显示时间内的歌词部分划分为第二歌词部分，并播放所述原唱音频文件。

可选地，所述音频处理装置还可以包括：

标识单元，用于对显示在所述客户端的第一歌词部分设置第一标识，对显示在所述客户端的第二歌词部分设置第二标识。

可选地，所述音频处理装置还可以包括：

第一平衡处理单元，用于对所述合唱文件在切换点的音频数据进行平衡处理，其中，所述切换点指由所述第一歌词部分对应的显示时间切换至第二歌词部分对应的显示时间的时间点或者由所述第二歌词部分对应的显示时间切换至所述第一歌词部分对应的显示时间的时间点。

请参阅图7，图7示出根据本发明又一实施例的音频处理装置，其包括：

第二获取单元701，用于获取歌曲的伴奏音频文件、原唱音频文件以及对应的歌词文件，其中，所述歌词文件包括用于标识歌词显示时间的时间信息；

第二处理单元702，用于对所述歌词文件进行划分处理，得到第一歌词部分和第二歌词部分，并对应生成歌词划分信息，其中，所述歌词划分信息包括用于标识所述第一歌词部分的标识信息；

第二生成单元703，用于在第一歌词部分对应的显示时间输出(或选取)所述伴奏音频文件，在第二歌词部分的显示时间输出(或选取)所述原唱音频文件，以生成目标音频文件；

第一发送单元704，用于向所述客户端发送所述目标音频文件和所述目标歌词文件(例如，在接收到客户端发送的K歌请求时)，以便所述客户端以所述目标音频文件作为伴奏音频、以所述目标歌词文件作为待播放歌词向用户提供K歌服务，其中，所述目标歌词文件通过在所述歌词文件中携带所述歌词划分信息得到。

相对于现有技术，本发明实施例服务器中的音频处理装置向客户端发送的目标音频文件在第一歌词部分的显示时间对应为伴奏，在第二歌词部分的显示时间对应为原唱，与现有技术中直接向客户端提供伴奏音频文件相比，本发明实施例可以实现在第一歌词部分的显示时间由用户演唱，在第二歌词部分的显示时间由明星原唱，从而实现与明星合唱的K歌体验。

可选地，所述第二处理单元702，可以根据所述时间信息确定所述歌词文件的段落信息，根据所述段落信息对所述歌词文件进行划分处理，得到第一歌词部分和第二歌词部分。

可选地，所述第二处理单元702，可以确定所述歌词文件的主歌部分和副歌部分，并将所述主歌部分确定为第一歌词部分，将所述副歌部分确定为第二歌词部分，或者将所述副歌部分确定为第一歌词部分，将所述主歌部分确定为第二歌词部分。

可选地，所述第二处理单元702，可以根据自定义的模板对所述歌词文件进行划分处理，得到第一歌词部分和第二歌词部分。

可选地，，所述音频处理装置还可以包括：

第二平衡处理单元，用于对所述目标音频文件在切换点的音频数据进行平衡处理，其中，所述切换点指由所述第一歌词部分对应的显示时间切换至第二歌词部分对应的显示时间的时间点或者由所述第二歌词部分对应的显示时间切换至所述第一歌词部分对应的显示时间的时间点。

请参阅图8，图8示出根据本发明另一实施例的音频处理装置，包括：

801第二接收单元，用于接收第一用户的第一请求；

802第三获取单元，用于根据该第一请求从服务器获取歌曲的伴奏音频文件和歌词文件，以便第一用户利用伴奏音频文件和歌词文件基于部分歌词进行录音，得到第一录制文件；

803第三处理单元，用于基于所述第一录制文件确定第二歌词部分，并对应生成段落信息，所述段落信息至少包括用于标识所述第二歌词部分的标识信息；

804第二混音单元，用于对所述第一录制文件和所述伴奏音频文件进行混音处理，得到目标音频文件；

805第二发送单元，用于发送目标音频文件和段落信息，以便第二客户端从服务器获取该目标音频文件和段落信息，并以该目标音频文件作为伴奏音频、根据段落信息向第二用户提供K歌服务。

请参阅图9，图9示出根据本发明示例实施例的音频处理系统，其包括服务器901和客户端902。本发明上述实施例的音频处理方法可以由音频处理系统的服务器和/或客户端执行。

根据本发明的一个可选实施例，所述服务器901包括如图7所示实施例中描述的音频处理装置；

根据本发明的一个可选实施例，所述客户端902，包括如图6所示实施例中描述的音频处理装置。

请参阅图10，图10示出根据本发明另一示例实施例的音频处理系统，其包括第一客户端1001、第二客户端1002和服务器1003。

所述第一客户端1001，用于接收第一用户的第一请求，所述第一请求例如用于请求发起合唱；根据所述第一请求从服务器1003获取歌曲的伴奏音频文件和歌词文件，以便所述第一用户利用所述伴奏音频文件和歌词文件基于部分歌词进行录音，得到第一录制文件；基于所述第一录制文件确定第二歌词部分，并对应生成段落信息，其中，所述第二歌词部分指所述第一用户演唱过的歌词部分，所述段落信息包括用于标识所述第二歌词部分的标识信息；对所述第一录制文件和所述伴奏音频文件进行混音处理，得到目标音频文件；以及用于向所述服务器1003发送所述目标音频文件和段落信息，以便第二客户端从所述服务器1003获取所述目标音频文件和段落信息，并以所述目标音频文件作为伴奏音频、根据所述段落信息向第二用户提供K歌服务。

所述第二客户端1002，用于从所述服务器1003获取所述目标音频文件和段落信息，并以所述目标音频文件作为伴奏音频、根据所述段落信息向第二用户提供K歌服务。

可选地，所述第一客户端1001，具体可以用于判断所述第一用户在某一歌词部分录入的声音是否有效，若是，则确定对应的歌词部分为第二歌词部分。

可选地，所述第一客户端1001，具体可以用于判断所述声音的音量是否大于预设值，若是，则确定所述第一用户在某一歌词部分录入的声音有效。

可选地，所述第一客户端1001，具体可以用于判断判断所述第一用户在某一歌词部分录入的声音是否有效，若是，则进一步判断所述录入的声音所占用的时间与所述歌词部分所占用的显示时间是否对应，若是，则确定所述歌词部分为第二歌词部分。

可选地，所述第一客户端1001，还可以用于在所述第一客户端对所述第一录制文件和所述伴奏音频文件进行混音处理，得到目标音频文件之前，根据所述段落信息对所述第一录制文件在所述第二歌词部分以外的歌词部分所对应的音频数据进行清零。

可选地，所述标识信息包括第二歌词部分所对应的显示时间或者所述第二歌词部分的句子标识。

可选地，所述第一客户端1001，还可以用于在所述第一客户端向所述服务器发送所述目标音频文件和段落信息之前，生成配置文件，所述配置文件包括所述第一用户所采用的音效参数；以及用于向所述服务器发送所述配置文件。

可选地，所述第二客户端1002，具体可以用于接收第二用户发送的第二请求，所述第二请求用于请求加入合唱；根据所述第二请求从所述服务器获取歌曲的目标音频文件、歌词文件以及段落信息，以便所述第二用户以所述目标音频文件作为伴奏音频并根据所述段落信息基于所述第二歌词部分以外的全部或部分歌词进行录音，得到第二录制文件；以及对所述第二录制文件和所述目标音频文件进行混音处理，得到混音音频文件。

可选地，所述第二客户端1002，还可以用于在第二客户端对所述第二录制文件和所述目标音频文件进行混音处理，得到混音音频文件之前，根据所述段落信息对所述第一录制文件在所述第二歌词部分所对应的音频数据进行清零。

可选地，所述第二客户端1002，具体可以用于当所述服务器上还包括所述配置文件时，从所述服务器获取歌曲的目标音频文件、歌词文件、段落信息以及配置文件，以便所述第二用户以所述目标音频文件作为伴奏音频并根据所述段落信息和配置文件基于所述第二歌词部分以外的部分或全部歌词部分进行录音，得到第二录制文件。

可选地，所述第二客户端，具体可以用于接收第二用户发送的第三请求，所述第三请求用于请求加入合唱且指示仅在所述第二歌词部分以外的部分歌词进行录音；根据所述第三请求从所述服务器获取歌曲的目标音频文件、歌词文件以及段落信息，以便所述第二用户以所述目标音频文件作为伴奏音频并根据所述段落信息基于所述第二歌词部分以外的部分歌词部分进行录音，得到第三录制文件；确定第三歌词部分，并在所述段落信息中添加用于标识所述第三歌词部分的标识信息，其中，所述第三歌词部分指所述第二用户演唱过的歌词部分；对所述第三录制文件和所述目标音频文件进行混音处理，得到第三目标文件；以及向所述服务器发送所述第三目标文件和段落信息，以便第三客户端通过所述服务器供第三用户以所述第三目标文件作为伴奏音频并根据所述段落信息在所述第二歌词部分和所述第三歌词部分以外的歌词部分进行录音。

在本发明一个可选实施例中，图10中第二客户端1002用于执行本发明参照图1描述的示例实施例的音频处理方法，所述服务器1003用于执行本发明参照图2描述的示例实施例的音频处理方法，所述第一客户端1001用于执行本发明参照图4描述的示例实施例的音频处理方法，

此外，本发明一个示例实施例提供一种音频处理装置，包括至少一个处理器和存储器，所述存储器存储有程序指令，所述程序指令当由处理器执行时，配置所述音频处理装置执行根据上述任一实施例所述的方法。

此外，本发明一个示例实施例提供一种计算机可读存储介质，存储有程序指令，所述程序指令当由计算装置的处理器执行时，配置所述计算装置执行根据上述任一实施例所述的方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

一种音频处理方法，包括：

获取歌曲的音频文件和所述歌曲的歌词文件；

在所述歌词文件的第一歌词部分对应的显示时间播放所述音频文件并录制用户的音频数据；

在所述歌词文件的第二歌词部分对应的显示时间播放所述音频文件；

对所述用户的音频数据和所述音频文件在所述第一歌词部分对应的显示时间的音频数据进行混音处理。
如权利要求1所述的方法，其中，在所述歌词文件的第二歌词部分对应的显示时间不录制用户的音频数据。
如权利要求1所述的方法，

其中，获取歌曲的音频文件和所述歌曲的歌词文件之前，所述方法还包括：接收用户的请求，

其中，获取歌曲的音频文件和所述歌曲的歌词文件包括：根据所述请求获取歌曲的伴奏音频文件、原唱音频文件以及所述歌曲的歌词文件。
如权利要求3所述的方法，

其中，获取歌曲的音频文件和所述歌曲的歌词文件之后，所述方法还包括：对所述歌词文件进行划分处理，以得到所述第一歌词部分和所述第二歌词部分，

其中，在所述歌词文件的第一歌词部分对应的显示时间播放所述音频文件并录制用户的音频数据包括：在所述第一歌词部分对应的显示时间播放所述伴奏音频文件并录制用户的音频数据，

其中，在所述歌词文件的第二歌词部分对应的显示时间播放所述音频文件包括：在所述第二歌词部分对应的显示时间播放所述原唱音频文件。
如权利要求3所述的方法，其中，对所述用户的音频数据和所述音频文件在所述第一歌词部分对应的显示时间的音频数据进行混音处理包括：对所述用户的音频数据和所述伴奏音频文件在所述第一歌词部分对应的显示时间的音频数据进行混音处理。
如权利要求3所述的方法，其中所述混音处理生成混音音频文件，所述方法还包括：

根据第一歌词部分对应的显示时间的所述混音音频文件，以及第二歌词部分对应的显示时间的所述原唱音频文件，生成合唱文件。
如权利要求1所述的方法，还包括：

接收所述用户的划分指令；

根据所述划分指令对所述歌词文件进行划分处理，以得到第一歌词部分和第二歌词部分。
如权利要求1所述的方法，还包括：

检测是否有声音输入，若是，则将所述歌词文件在对应显示时间内的歌词部分划分为第一歌词部分，若否，则将所述歌词文件在对应显示时间内的歌词部分划分为第二歌词部分。
如权利要求1所述的方法，其中所述混音处理生成混音音频文件，所述方法还包括：

根据第一歌词部分对应的显示时间的所述混音音频文件，以及第二歌词部分对应的显示时间的所述歌曲的所述音频文件，生成合唱文件。
如权利要求9所述的方法，还包括：

对所述合唱文件在切换点的音频数据进行平衡处理，其中，所述切换点指由所述第一歌词部分对应的显示时间切换至第二歌词部分对应的显示时间的时间点或者由所述第二歌词部分对应的显示时间切换至所述第一歌词部分对应的显示时间的时间点。
如权利要求1所述的方法，其中在获取歌曲的音频文件和所述歌曲的歌词文件之前，还包括：

获取歌曲的伴奏音频文件、原唱音频文件以及所述歌曲的歌词文件；

对所述歌词文件进行划分处理，以得到第一歌词部分和第二歌词部分，并对应生成歌词划分信息，其中，所述歌词划分信息至少包括用于标识所述第一歌词部分的标识信息；

根据第一歌词部分对应的显示时间的伴奏音频文件，以及第二歌词部分对应的显示时间的原唱音频文件，生成所述歌曲的所述音频文件。
如权利要求11所述的方法，

其中，获取歌曲的音频文件和所述歌曲的歌词文件还包括获取所述歌词划分信息，

其中，在所述歌词文件的第一歌词部分对应的显示时间播放所述音频文件并录制用户的音频数据包括：根据所述歌词划分信息在所述第一歌词部分对应的显示时间录制用户的音频数据。
如权利要求1所述的方法，其中，所述歌词文件包括用于标识歌词显示时间的时间信息，所述方法还包括：

根据所述时间信息确定所述歌词文件的段落信息；

根据所述段落信息对所述歌词文件进行划分处理，得到第一歌词部分和第二歌词部分。
如权利要求1所述的方法，还包括：

确定所述歌词文件的主歌部分和副歌部分，并将所述主歌部分确定为第一歌词部分，将所述副歌部分确定为第二歌词部分，或者将所述副歌部分确定为第一歌词部分，将所述主歌部分确定为第二歌词部分。
如权利要求1所述的方法，还包括：

根据自定义的模板对所述歌词文件进行划分处理，得到第一歌词部分和第二歌词部分。
如权利要求1所述的方法，其中在获取歌曲的音频文件和所述歌曲的歌词文件之前，还包括：

接收另一用户的请求；

根据所述请求获取所述歌曲的伴奏音频文件和歌词文件；

利用所述伴奏音频文件和歌词文件基于部分歌词对所述另一用户进行录音，得到第一录制文件；

基于所述第一录制文件确定所述第二歌词部分，并对应生成段落信息，其中，所述段落信息至少包括用于标识所述第二歌词部分的标识信息；

对所述第一录制文件和所述伴奏音频文件进行混音处理，以得到所述歌曲的所述音频文件。
如权利要求16所述的方法，其中，基于所述第一录制文件确定所述第二歌词部分包括：

判断所述另一用户在某一歌词部分录入的声音是否有效，若是，则确定对应的歌词部分为第二歌词部分。
如权利要求16所述的方法，还包括生成配置文件，所述配置文件包括所述另一用户所采用的音效参数。
如权利要求18所述的方法，其中在所述歌词文件的第一歌词部分对应的显示时间播放所述音频文件并录制用户的音频数据包括：

以所述歌曲的所述音频文件作为伴奏音频并根据所述段落信息和配置文件基于所述第二歌词部分以外的歌词部分进行录音。
一种音频处理装置，包括至少一个处理器和存储器，所述存储器存储有程序指令，所述程序指令当由处理器执行时，配置所述音频处理装置执行根据权利要求1-19中任一项所述的方法。
一种音频处理系统，包括服务器和至少一个客户端，所述服务器和/或所述客户端被配置为执行根据权利要求1-19中任一项所述的方法。
如权利要求21所述的系统，其中至少一个客户端包括第一客户端，所述第一客户端被配置为执行根据权利要求1-10中任一项所述的方法。
如权利要求22所述的系统，其中所述服务器被配置为：

获取歌曲的伴奏音频文件、原唱音频文件以及所述歌曲的歌词文件，

对所述歌词文件进行划分处理，以得到第一歌词部分和第二歌词部分，并对应生成歌词划分信息，其中，所述歌词划分信息包括至少用于标识所述第一歌词部分的标识信息，

根据第一歌词部分对应的显示时间的伴奏音频文件，以及第二歌词部分对应的显示时间的原唱音频文件，生成所述歌曲的所述音频文件。
如权利要求23所述的系统，其中所述至少一个客户端还包括第二客户端，所述第二客户端被配置为：

接收另一用户的请求；

根据所述请求获取所述歌曲的伴奏音频文件和歌词文件；

利用所述伴奏音频文件和歌词文件基于部分歌词对所述另一用户进行录音，得到第一录制文件；

基于所述第一录制文件确定所述第二歌词部分，并对应生成段落信息，其中，所述段落信息包括用于标识所述第二歌词部分的标识信息；

对所述第一录制文件和所述伴奏音频文件进行混音处理，以得到所述歌曲的所述音频文件。
一种音频处理装置，包括：

第一获取单元，用于获取歌曲的音频文件以及所述歌曲的歌词文件；

第一处理单元，用于在所述歌词文件的第一歌词部分对应的显示时间和第二歌词部分对应的显示时间播放所述音频文件，并在所述歌词文件的第一歌词部分对应的显示时间录制用户的音频数据；

第一混音单元，用于对所述用户的音频数据和所述音频文件在所述第一歌词部分对应的显示时间的音频数据进行混音处理。
如权利要求25所述的装置，还包括第一接收单元，用于接收用户的请求，

其中所述第一获取单元进一步用于根据所述请求获取歌曲的伴奏音频文件、原唱音频文件以及所述歌曲的歌词文件。
如权利要求26所述的装置，其中，所述第一处理单元进一步用于：

对所述歌词文件进行划分处理，以得到第一歌词部分和第二歌词部分；

在所述第一歌词部分对应的显示时间播放所述伴奏音频文件并录制用户的音频数据，

在所述第二歌词部分对应的显示时间播放所述原唱音频文件。
如权利要求26所述的装置，

其中所述第一混音单元进一步用于对所述用户的音频数据和所述伴奏音频文件在所述第一歌词部分对应的显示时间的音频数据进行混音处理。
如权利要求25所述的装置，其中所述混音处理生成混音音频文件，所述装置还包括

第一生成单元，用于根据第一歌词部分对应的显示时间的所述混音音频文件，以及所述第二歌词部分对应的显示时间的所述原唱音频文件，生成合唱文件。
如权利要求25所述的装置，还包括：

第二获取单元，用于获取歌曲的伴奏音频文件、原唱音频文件以及所述歌曲的歌词文件；

第二处理单元，用于对所述歌词文件进行划分处理，得到第一歌词部分和第二歌词部分，并对应生成歌词划分信息，其中，所述歌词划分信息至少包括用于标识所述第一歌词部分的标识信息；

第二生成单元，用于根据第一歌词部分对应的显示时间的伴奏音频文件，以及第二歌词部分对应的显示时间的原唱音频文件，生成所述歌曲的所述音频文件。
如权利要求25所述的装置，还包括：

第二接收单元，用于接收另一用户的请求；

第三获取单元，用于根据所述请求获取所述歌曲的伴奏音频文件和歌词文件，并利用所述伴奏音频文件和歌词文件基于部分歌词对所述另一用户进行录音，得到第一录制文件；

第三处理单元，用于基于所述第一录制文件确定所述第二歌词部分，并对应生成段落信息，所述段落信息至少包括用于标识所述第二歌词部分的标识信息；

第二混音单元，用于对所述第一录制文件和所述伴奏音频文件进行混音处理，以得到所述歌曲的所述音频文件。