CN113703882A

CN113703882A - 歌曲处理方法、装置、设备及计算机可读存储介质

Info

Publication number: CN113703882A
Application number: CN202110251029.7A
Authority: CN
Inventors: 葛小藤
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-03-08
Filing date: 2021-03-08
Publication date: 2021-11-26

Abstract

本申请提供了一种歌曲处理方法、装置、设备及计算机可读存储介质，涉及人工智能技术领域；方法包括：响应于目标对象针对目标歌曲的合唱指令，呈现包括目标歌曲的至少两个原始合唱者的合唱者选择界面；基于合唱者选择界面，响应于针对原始合唱者的第一选择操作，确定演唱目标歌曲的至少两个合唱者，至少两个合唱者包括目标对象及至少一个目标原始合唱者；响应于基于至少两个合唱者触发的合唱录制指令，呈现对应目标歌曲的歌曲录制界面，并录制目标对象的第一歌曲数据；响应于针对目标歌曲的录制结束指令，生成包括第一歌曲数据及目标原始合唱者的第二歌曲数据的合唱媒体文件。通过本申请，能够实现对合唱者的选择，提升用户的自主选择性。

Description

歌曲处理方法、装置、设备及计算机可读存储介质

技术领域

本申请涉及人工智能技术领域技术，尤其涉及一种歌曲处理方法、装置、设备及计算机可读存储介质。

背景技术

人工智能技术是一门综合学科，既有硬件层面的技术也有软件层面的技术，其中，人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向，而语音技术是人工指令领域中的关键技术。让计算机能听、能看、能说、能感觉，是未来人机交互的发展方向。

随着人们生活质量的提高，K歌应用正逐步走向人们的日常生活，K歌应用具有的功能也日益丰富。

相关技术中，K歌应用提供了合唱功能，也即提供一个删除了部分原唱音频的视频文件，用户可以基于该视频文件，对删除的部分进行演唱，进而生成一个合唱音频文件；但通过上述方法实现合唱功能，用户只能够对固定的角色片段进行演唱，合唱方式单一、用户的自主选择性低。

发明内容

本申请实施例提供一种歌曲处理方法、装置、设备及计算机可读存储介质，能够实现对合唱者的选择，提升用户的自主选择性。

本申请实施例的技术方案是这样实现的：

本申请实施例提供一种歌曲处理方法，包括：

响应于目标对象针对目标歌曲的合唱指令，呈现包括所述目标歌曲的至少两个原始合唱者的合唱者选择界面；

基于所述合唱者选择界面，响应于针对所述原始合唱者的第一选择操作，确定演唱所述目标歌曲的至少两个合唱者，所述至少两个合唱者包括所述目标对象及至少一个目标原始合唱者；

响应于基于所述至少两个合唱者触发的合唱录制指令，呈现对应所述目标歌曲的歌曲录制界面，并录制所述目标对象的第一歌曲数据；

响应于针对所述目标歌曲的录制结束指令，生成包括所述第一歌曲数据及所述目标原始合唱者的第二歌曲数据的合唱媒体文件。

上述方案中，所述录制所述目标对象的第一歌曲数据，包括：

从所述目标歌曲对应的原始歌曲数据中，提取所述目标原始合唱者的歌曲数据；

在录制所述目标对象的歌曲数据的过程中，播放所述目标歌曲的伴奏音乐，并

在所述目标原始合唱者的演唱部分，播放所述目标原始合唱者的歌曲数据；

基于播放的所述伴奏音乐及所述目标原始合唱者的歌曲数据，录制所述目标对象的第一歌曲数据。

上述方案中，所述呈现包括所述目标歌曲的至少两个原始合唱者的合唱者选择界面之前，还包括：

呈现歌曲搜索界面，并在所述歌曲搜索界面中呈现搜索功能项；

接收到输入的歌曲信息；

响应于基于所述搜索功能项触发的针对所述歌曲信息的搜索指令，呈现与所述歌曲信息相匹配的歌曲；

响应于基于与所述歌曲信息相匹配的歌曲触发的歌曲选取操作，将所述选取操作对应的歌曲作为目标歌曲。

本申请实施例提供一种歌曲处理装置，包括：

呈现模块，用于响应于目标对象针对目标歌曲的合唱指令，呈现包括所述目标歌曲的至少两个原始合唱者的合唱者选择界面；

确定模块，用于基于所述合唱者选择界面，响应于针对所述原始合唱者的第一选择操作，确定演唱所述目标歌曲的至少两个合唱者，所述至少两个合唱者包括所述目标对象及至少一个目标原始合唱者；

录制模块，用于响应于基于所述至少两个合唱者触发的合唱录制指令，呈现对应所述目标歌曲的歌曲录制界面，并录制所述目标对象的第一歌曲数据；

生成模块，用于响应于针对所述目标歌曲的录制结束指令，生成包括所述第一歌曲数据及所述目标原始合唱者的第二歌曲数据的合唱媒体文件。

上述方案中，所述确定模块，还用于将所述第一选择操作所对应的原始合唱者作为目标原始合唱者；

将所述目标原始合唱者及所述目标对象，确定为演唱所述目标歌曲的至少两个合唱者。

上述方案中，所述确定模块，还用于当除所述目标原始合唱者以外的原始合唱者数量为至少两个时，接收到针对所述目标歌曲的合唱邀请指令；

响应于所述合唱邀请指令，发送合唱邀请信息，以邀请至少一个用户对象作为所述目标歌曲的合唱者。

上述方案中，所述确定模块，还用于响应于针对所述原始合唱者的第二选择操作，确定所述第二选择操作对应的原始合唱者；

获取除所述目标原始合唱者、及所述第二选择操作对应的原始合唱者外剩余的原始合唱者；

发送携带有所述剩余的原始合唱者的合唱邀请信息，以邀请至少一个用户对象演唱所述剩余的原始合唱者所对应的演唱部分。

上述方案中，所述确定模块，还用于接收并呈现至少一个用户对象的接受邀请信息，所述接受邀请信息用于指示所述至少一个用户对象所选取的演唱部分；

将除所述目标原始合唱者对应的演唱部分、及至少一个用户对象所选取的演唱部分外的歌曲内容，作为所述目标对象所要演唱的目标演唱部分；

所述录制模块，还用于在录制所述目标对象的歌曲数据的过程中，输出提示信息，以提示所述目标对象演唱所述目标演唱部分；

基于所述提示信息，录制所述目标对象的第一歌曲数据。

上述方案中，所述确定模块，还用于当存在用户对象接受合唱邀请时，获取录制的所述用户对象的歌曲数据；

基于所述第一歌曲数据、所述用户对象的歌曲数据、及目标原始合唱者的第二歌曲数据，合成对应所述目标歌曲的合唱媒体文件。

上述方案中，所述生成模块，还用于从所述目标歌曲的原始音频文件中，提取所述目标原始合唱者的第二歌曲数据；

基于所述第一歌曲数据及所述第二歌曲数据，合成对应所述目标歌曲的合唱媒体文件。

上述方案中，所述生成模块，还用于获取对应所述目标歌曲的图像文件；

基于所述第一歌曲数据、所述第二歌曲数据及所述图像文件，进行视频编码，得到对应所述目标歌曲的合唱视频文件。

上述方案中，所述生成模块，还用于从所述目标歌曲对应的原始歌曲数据中，提取所述目标原始合唱者的第二歌曲数据；

确定所述原始歌曲数据中存在除所述第一歌曲数据及所述第二歌曲数据外的目标歌曲数据时，采用所述目标原始合唱者的音色，生成对应所述目标歌曲数据的第三歌曲数据；

基于所述第一歌曲数据、所述第二歌曲数据及所述第三歌曲数据，合成对应所述目标歌曲的合唱媒体文件。

上述方案中，所述生成模块，还用于当检测到所述合唱媒体文件中包含未演唱部分时，呈现邀请提示信息，以提示邀请至少一个用户对象对所述未演唱部分进行演唱。

上述方案中，所述生成模块，还用于呈现所述目标歌曲的歌词；

响应于基于所述目标歌曲的歌词触发的歌词选取操作，将所选取的歌词作为所述目标对象所要演唱的目标演唱部分；

基于所述提示信息，录制所述目标对象的第一歌曲数据。

上述方案中，所述生成模块，还用于呈现对应所述合唱媒体文件的编辑界面；

响应于基于所述编辑界面触发的编辑操作，对所述合唱媒体文件的以下参数之一进行调节：人声音量、伴奏音量、混响模式、均衡状态。

上述方案中，所述录制模块，还用于从所述目标歌曲对应的原始歌曲数据中，提取所述目标原始合唱者的歌曲数据；

上述方案中，所述呈现模块，还用于呈现歌曲搜索界面，并在所述歌曲搜索界面中呈现搜索功能项；

接收到输入的歌曲信息；

本申请实施例提供一种计算机设备，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本申请实施例提供的歌曲处理方法。

本申请实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行时，实现本申请实施例提供的歌曲处理方法。

应用上述实施例，通过呈现包括目标歌曲的至少两个原始合唱者的合唱者选择界面；基于合唱者选择界面，响应于针对所述原始合唱者的第一选择操作，确定演唱所述目标歌曲的至少两个合唱者；响应于基于至少两个合唱者触发的合唱录制指令，呈现对应所述目标歌曲的歌曲录制界面，并录制目标对象的第一歌曲数据；响应于针对目标歌曲的录制结束指令，生成包括第一歌曲数据及所述目标原始合唱者的第二歌曲数据的合唱媒体文件；如此，在目标歌曲的原始合唱者的数量为至少两个时，目标对象可以通过合唱者选择界面，自主选择与其一起合唱目标歌曲的合唱者，提高了用户的自主选择性。

附图说明

图1是相关技术提供的合唱录制过程的界面示意图；

图2是本申请实施例提供的歌曲处理系统100的一个可选的架构示意图；

图3是本申请实施例提供的计算机设备500的结构示意图；

图4是本申请实施例提供的歌曲处理方法的流程示意图；

图5是本申请实施例提供的歌曲搜索过程的界面示意图；

图6是本申请实施例提供的歌手主页的示意图；

图7是本申请实施例提供的目标歌曲的详情页面示意图；

图8是本申请实施例提供的合唱者选择界面示意图；

图9是本申请实施例提供的歌曲录制界面示意图；

图10是本申请实施例提供的演唱部分选择界面示意图；

图11是本申请实施例提供的邀请提示信息的呈现界面示意图；

图12是本申请实施例提供的编辑界面示意图；

图13是本申请实施例提供的音频素材准备阶段的流程示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

在以下的描述中，所涉及的术语“第一\第二\第三”仅仅是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

对本申请实施例进行进一步详细说明之前，对本申请实施例中涉及的名词和术语进行说明，本申请实施例中涉及的名词和术语适用于如下的解释。

1)客户端，终端中运行的用于提供各种服务的应用程序，例如视频客户端、音乐客户端等。

2)响应于，用于表示所执行的操作所依赖的条件或者状态，当满足所依赖的条件或状态时，所执行的一个或多个操作可以是实时的，也可以具有设定的延迟；在没有特别说明的情况下，所执行的多个操作不存在执行先后顺序的限制。

图1是相关技术提供的合唱录制过程的界面示意图，参见图1，首先，当用户触发合唱功能后，如点击明星合唱的功能项，终端呈现合唱歌曲的选择界面101，用户可以基于该选择界面选择所要合唱的歌曲；当用户选择合唱歌曲后，呈现合唱歌曲对应的合唱录制界面102，这里在录制的过程中，终端会播放一个视频文件，在该视频文件中有部分原唱音频被删除了，被删除的部分即为用户需要演唱的部分，基于该视频对用户的歌曲数据及视频数据进行录制；录制完成后，基于视频文件、录制的歌曲数据及视频数据，合成合唱视频103；用户可以对合唱视频进行发布。

申请人在实施本申请实施例的过程中发现，相关技术中的合唱功能依托于平台上传的视频文件，视频文件中删除了部分原唱音频，用户只能够选择固定角色片段进行演唱，在这个过程中，用户既不能选择自己想要唱的部分，也不能选择和谁合唱，用户的自主选择性很低。

基于此，本申请实施例提供一种歌曲处理方法、装置、设备和计算机可读存储介质，能够提升用户的自主选择性。

参见图2，图2是本申请实施例提供的歌曲处理系统100的一个可选的架构示意图，为实现支撑一个示例性应用，终端(示例性示出了终端400-1和终端400-2)通过网络300连接服务器200，网络300可以是广域网或者局域网，又或者是二者的组合。

服务器200，用于存储各歌曲的至少一个原始合唱者的歌曲数据；

终端，用于响应于目标对象针对目标歌曲的合唱指令，呈现包括目标歌曲的至少两个原始合唱者的合唱者选择界面；基于合唱者选择界面，响应于针对原始合唱者的第一选择操作，确定演唱目标歌曲的至少两个合唱者，至少两个合唱者包括目标对象及至少一个目标原始合唱者；响应于基于至少两个合唱者触发的合唱录制指令，发送目标原始合唱者的第二歌曲数据的获取请求至服务器200；

服务器200，用于查找目标原始合唱者的第二歌曲数据，并返回给终端；

终端，用于呈现对应目标歌曲的歌曲录制界面，并录制目标对象的第一歌曲数据；响应于针对目标歌曲的录制结束指令，基于第一歌曲数据和第二歌曲数据，生成合唱媒体文件。

在一些实施例中，服务器200可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN，ContentDelivery Network)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载设备、智能电视等，但并不局限于此。

参见图3，图3是本申请实施例提供的计算机设备500的结构示意图，在实际应用中，计算机设备500可以为图1中的终端(如400-1)或服务器200，以计算机设备为图2所示的终端为例，对实施本申请实施例的歌曲处理方法的计算机设备进行说明。图3所示的计算机设备500包括：至少一个处理器510、存储器550、至少一个网络接口520和用户接口530。计算机设备500中的各个组件通过总线系统540耦合在一起。可理解，总线系统540用于实现这些组件之间的连接通信。总线系统540除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图3中将各种总线都标为总线系统540。

处理器510可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

用户接口530包括使得能够呈现媒体内容的一个或多个输出装置531，包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口530还包括一个或多个输入装置532，包括有助于用户输入的用户接口部件，比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。

存储器550可以是可移除的，不可移除的或其组合。示例性的硬件设备包括固态存储器，硬盘驱动器，光盘驱动器等。存储器550可选地包括在物理位置上远离处理器510的一个或多个存储设备。

存储器550包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM，Read Only Memory)，易失性存储器可以是随机存取存储器(RAM，Random Access Memory)。本申请实施例描述的存储器550旨在包括任意适合类型的存储器。

在一些实施例中，存储器550能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作系统551，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

网络通信模块552，用于经由一个或多个(有线或无线)网络接口520到达其他计算设备，示例性的网络接口520包括：蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB，Universal Serial Bus)等；

呈现模块553，用于经由一个或多个与用户接口530相关联的输出装置531(例如，显示屏、扬声器等)使得能够呈现信息(例如，用于操作外围设备和显示内容和信息的用户接口)；

输入处理模块554，用于对一个或多个来自一个或多个输入装置532之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。

在一些实施例中，本申请实施例提供的歌曲处理装置可以采用软件方式实现，图3示出了存储在存储器550中的歌曲处理装置555，其可以是程序和插件等形式的软件，包括以下软件模块：呈现模块5551、确定模块5552、录制模块5553及生成模块5554，这些模块是逻辑上的，因此根据所实现的功能可以进行任意的组合或进一步拆分。

将在下文中说明各个模块的功能。

在另一些实施例中，本申请实施例提供的歌曲处理装置可以采用硬件方式实现，作为示例，本申请实施例提供的歌曲处理装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本申请实施例提供的表情的处理方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Application Specific IntegratedCircuit)、DSP、可编程逻辑器件(PLD，Programmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmable Logic Device)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件。

将结合本申请实施例提供的终端的示例性应用和实施，说明本申请实施例提供的歌曲处理方法。

参见图4，图4是本申请实施例提供的歌曲处理方法的流程示意图，将结合图4示出的步骤进行说明。

步骤401：终端响应于目标对象针对目标歌曲的合唱指令，呈现包括目标歌曲的至少两个原始合唱者的合唱者选择界面。

在实际实施时，终端上设置有客户端，如K歌应用客户端、音乐客户端、即使通信客户端等，客户端提供有K歌功能，也即用户可以通过客户端录制自己的歌声，并生成相应的音频文件。这里，客户端提供有歌曲合唱功能，也即用户可以和歌曲的原始合唱者共同合唱一首歌曲，并生成相应的媒体文件。

这里，可以通过客户端触发针对目标歌曲的合唱指令，终端在接收到针对目标歌曲的合唱指令后，通过客户端呈现包括目标歌曲的至少两个原始合唱者。也即，目标歌曲的原始合唱者的数量为至少两个，如目标歌曲可以是男女对唱的歌曲，也可以是由某个团体组合演唱的歌曲。

在实际应用中，目标对象需要先选择所要合唱的目标歌曲，再触发针对目标歌曲的合唱指令。在一些实施例中，终端可以呈现歌曲的推荐界面，并在推荐界面中呈现推荐的歌曲，以使目标对象于推荐的歌曲，选择所要合唱的目标歌曲；在另一实施例中，终端可以呈现歌曲搜索界面，以使目标对象可以基于歌曲搜索界面自主搜索所要演唱的歌曲，进而基于搜索结果选择目标歌曲。

在一些实施例中，当目标对象基于歌曲搜索界面，来选择目标歌曲时，终端呈现歌曲搜索界面，并在歌曲搜索界面中呈现搜索功能项；接收到输入的歌曲信息；响应于基于搜索功能项触发的针对歌曲信息的搜索指令，呈现与歌曲信息相匹配的歌曲；响应于基于与歌曲信息相匹配的歌曲触发的歌曲选取操作，将选取操作对应的歌曲作为目标歌曲。

这里，歌曲信息可以是歌曲的演唱者名称，如组合名称、原始合唱者名称，也可以是歌曲名称；搜索功能项可以是搜索框和搜索按键组合的形式，也可以是语音搜索按键。在实际应用中，当搜索功能项为搜索框和搜索按键组合的形式时，用户基于搜索框输入歌曲信息，在输入完成后，触发搜索按键，终端接收到基于搜索按键触发的针对歌曲信息的搜索指令；当搜索功能项为语音搜索按键时，用户触发该语音搜索按键，便可以说出歌曲信息，终端采集用户，例如，用户按压语音搜索按键，并在按压的过程中说出歌曲信息，终端采集用户的语音信息，当用户释放该语音搜索按键时，终端基于采集到的语音信息进行语音识别，以获取歌曲信息，并触发针对该歌曲信息的搜索指令。

作为示例，图5是本申请实施例提供的歌曲搜索过程的界面示意图，参见图5，呈现歌曲搜索界面，并在歌曲搜索界面中呈现搜索框501及搜索按键502，目标对象在搜索框501中输入歌曲信息，如组合名称，然后点击搜索按键502，触发针对歌曲信息的搜索指令，终端呈现与该歌曲信息相匹配的多首歌曲503，如，输入为某个组合的组合名称，呈现该组合演唱的多首歌曲，以使用户可以从呈现的多个歌曲中，选择一首歌曲作为目标歌曲。

在一些实施例中，终端还可以呈现某个歌手(包括个人和组合)的歌手主页，并在该歌手主页中呈现该歌手所演唱的歌曲，以使用户可以基于该歌手主页，选择目标歌曲。在实际实施时，终端可以呈现推荐的多个歌手供用户选择，用户在选择某个歌手后，终端呈现该歌手的歌手主页；或者，用户可以基于上述歌曲搜索界面输入歌手名称，终端呈现与该歌手名称匹配的歌手的主页入口，该主页入口在接收到触发操作时，呈现相应歌手的歌手主页。

作为示例，参见图5，当输入的歌曲信息为组合名称时，还呈现该组合的主页入口503，目标对象点击该主页入口504后，呈现该组合的歌手主页；图6是本申请实施例提供的歌手主页的示意图，参见图6，呈现组合的歌手主页，在该歌手主页中，呈现该歌手的详细信息，包括该组合演唱的歌曲601，这里用户可以基于该歌手主页选择目标歌曲。

在一些实施例中，在目标对象选择所要合唱的目标歌曲后，可以自动触发针对目标歌曲的合唱指令，例如，参见图5，基于呈现的多首歌曲，目标对象点击其中的某一首歌曲，将其点击的歌曲作为目标歌曲，自动触发针对目标歌曲的合唱指令，进而呈现目标歌曲的合唱者选择界面；在另一些实施例中，在目标对象选择所要合唱的目标歌曲后，需要手动触发针对目标歌曲的合唱指令，如在用户选择目标歌曲之后，呈现合唱功能项，通过触发合唱功能项，触发针对目标歌曲的合唱指令。

作为示例，在目标对象选择所要合唱的目标歌曲后，呈现目标歌曲的详情页面，图7是本申请实施例提供的目标歌曲的详情页面示意图，参见图7，在详情页面呈现目标歌曲的详细信息，如名称、演唱者、演唱该歌曲的用户排行榜(历史最佳独唱)等，并呈现针对目标歌曲的合唱功能项701，用户点击该合唱功能项701，触发针对目标歌曲的合唱指令。

在一些实施例中，终端在接收到针对目标歌曲的指令后，获取目标歌曲的至少两个原始合唱者，并呈现合唱者选择界面，在合唱者选择界面呈现目标歌曲的原始合唱者。这里在呈现目标歌曲的至少两个原始合唱者时，可以是呈现目标歌曲的全部原始合唱者，也可以是呈现部分原始合唱者，例如，当目标歌曲的原始合唱者的数量为5个时，可以基于用户信息，确定用户对各原始合唱者的喜爱程度，呈现喜爱程度最高的3个原始合唱者。需要说明的是，原始合唱者指的是目标歌曲的原始音频文件的演唱者。

在实际实施时，在合唱者选择界面呈现至少两个原始合唱者时，可以以文本形式呈现原始合唱者，也可以以图像形式呈现原始合唱者，这里不对原始合唱者的呈现形式进行限定。

作为示例，图8是本申请实施例提供的合唱者选择界面示意图，在合唱者选择界面中，呈现目标歌曲的多个原始合唱者801，这里采用图像和文本结合的形式呈现原始合唱者，也即呈现的是各原始合唱者的名称和头像。

步骤402：基于合唱者选择界面，响应于针对原始合唱者的第一选择操作，确定演唱目标歌曲的至少两个合唱者。

其中，至少两个合唱者包括目标对象及至少一个目标原始合唱者。在实际实施时，第一选择操作可以用于选择与目标对象合唱的目标原始合唱者，也可以是选择目标对象所要演唱的角色，也即将目标对象所选择的原始合唱者对应的演唱部分作为目标对象所要演唱的部分，那么，未被用户选择的原始合唱者中，至少有一个原始合唱者是目标原始合唱者。

在实际应用中，第一选择操作可以是针对原始合唱者的点击操作，例如，将点击操作所对应的原始合唱者，作为所选择的原始合唱者；第一选择操作也可以包括针对原始合唱者的点击操作和针对确定功能项的点击操作，也即，用户通过点击操作来预选原始合唱者，这里，对于预选的原始合唱者，可以采用区别于其它原始合唱者的方式呈现，例如，可以对预选的原始合唱者高亮显示，在点击确定功能项后，确定预选的原始合唱者为最终选择的原始合唱者，也即，在点击确定功能项之前，可以对选择的原始合唱者进行修改。需要说明的是，第一选择操作的触发形式不限于上述两种方式，还可以采用其它方式触发。

以第一选择操作包括针对原始合唱者的点击操作和针对确定功能项的点击操作为例，参见图8，在合唱选择界面中，不仅呈现有目标歌曲的多个原始合唱者801，还呈现有确定功能项802；这里，可以通过点击名称或头像，来预选原始合唱者，如选择瞿xx，在选择完成后，对预选的原始合唱者进行区别显示，这时，可以点击确定功能项802，以确定最终该选择的原始合唱者。

在一些实施例中，可以通过以下方式确定演唱目标歌曲的至少两个合唱者：将第一选择操作所对应的原始合唱者作为目标原始合唱者；将目标原始合唱者及目标对象，确定为演唱目标歌曲的至少两个合唱者。

在实际实施时，第一选择操作用于选择与目标对象合唱的目标原始合唱者时，获取第一选择操作所对应的原始合唱者，将其作为目标原始合唱者，那么，演唱目标歌曲的合唱者包括所选择的目标原始合唱者和目标对象。这里，目标原始合唱者的数量可以为一个或者多个。

例如，当目标歌曲的原始合唱者包括原始合唱者A、原始合唱者B、原始合唱者C，目标对象可以选择其中的一个或者多个作为目标原始合唱者，如第一选择操作所对应的原始合唱者为原始合唱者A，那么，演唱目标歌曲的至少两个合唱者至少包括目标对象和原始合唱者A；如第一选择操作所对应的原始合唱为原始合唱者A和原始合唱者B，那么，演唱目标歌曲的至少两个合唱者至少包括目标对象、原始合唱者A和原始合唱者B。

在一些实施例中，当选择了目标原始合唱者之后，对于目标原始合唱者对应的演唱部分，由目标原始合唱者演唱；对于除目标原始合唱者以外的原始合唱者的演唱部分，可以由目标对象单独演唱，也可以由目标对象与其它对象共同演唱。这里的其它对象可以是其它用户对象，也可以是原始合唱者，如目标原始合唱者对象。

作为示例，当目标歌曲的原始合唱者包括原始合唱者A、原始合唱者B、原始合唱者C，其中，目标歌曲包括三个段落，原始合唱者A对应第一段落，原始合唱者的演唱部分为第二段落，原始合唱者C对应第三段落；根据用户的第一选择操作，将第一选择操作对应的原始合唱者A作为目标原始合唱者，那么，第一段落由原始合唱者A演唱，第二段落和第三段落可以都由目标对象演唱，也可以是目标对象仅演唱第二段落和第三段落中的一段，然后由其它对象演唱剩余的一段。

在一些实施例中，终端在将目标原始合唱者及目标对象，确定为演唱目标歌曲的至少两个合唱者之后，还可以当除目标原始合唱者以外的原始合唱者数量为至少两个时，接收到针对目标歌曲的合唱邀请指令；响应于合唱邀请指令，发送合唱邀请信息，以邀请至少一个用户对象作为目标歌曲的合唱者。

在实际实施时，当除目标原始合唱者以外的原始合唱者数量为至少两个时，目标对象可以邀请一个或多个用户对象与其一起合唱除目标原始合唱者以外的原始合唱者的演唱部分。这里，合唱邀请指令可以通过合唱邀请功能项触发，如终端可以呈现一个合唱邀请功能项，目标对象点击该邀请功能项，以触发合唱邀请指令。

在一些实施例中，合唱邀请信息可以发送给目标对象指定的用户对象，也即终端在接收到合唱邀请指令后，呈现用户对象选择界面，在用户对象选择界面中呈现可选择的用户对象，如呈现与目标对象存在社交关系的用户对象，用户可以基于呈现的用户对象，从中选择一个或者多个用户对象作为合唱邀请信息的接收者，终端将合唱邀请信息发送给合唱邀请信息的接收者。

在一些实施例中，合唱邀请信息可以发送给当前客户端的任意用户，如可以在客户端的推荐界面呈现该合唱邀请信息，以使所有用户对象在查看推荐界面时，都可以看到该合唱邀请信息；或者，可以将该合唱邀请信息，以系统消息的形式推送给所有在线用户对象的客户端。

需要说明的是，在发送合唱邀请信息时，可以基于当前客户端发送，也可以调用第三方客户端，通过第三方客户端发送该合唱邀请信息，例如，当前客户端为K歌应用客户端时，终端可以调用某一即时通信客户端，通过该即时通信客户端，发送合唱邀请信息。

在实际应用中，合唱邀请信息可以携带有原始合唱者，这里原始合唱者用于指示用户对象所要演唱的演唱部分，也即携带的原始合唱者对应的演唱部分，是用户对象所要演唱的部分。其中，携带的原始合唱者可以为一个或多个，当携带的原始合唱者数量为一个时，被邀请的用户对象仅能够选择演唱该原始合唱者所对应的演唱部分；当携带的原始合唱者为多个时，被邀请的用户对象可以从中选择一个原始合唱者的演唱部分进行演唱。

在一些实施例中，终端在接收到针对目标歌曲的合唱邀请指令之前，还可以响应于针对原始合唱者的第二选择操作，确定第二选择操作对应的原始合唱者；获取除目标原始合唱者、及第二选择操作对应的原始合唱者外剩余的原始合唱者；相应的，可以通过以下方式发送合唱邀请信息：发送携带有剩余的原始合唱者的合唱邀请信息，以邀请至少一个用户对象演唱剩余的原始合唱者所对应的演唱部分。

在实际实施时，目标对象在触发针对目标歌曲的合唱邀请指令之前，可以自主选择所要演唱的目标演唱部分，也即第二选择操作对应的原始合唱者的演唱部分，为目标对象所要演唱的目标演唱部分，那么，除目标原始合唱者的演唱部分及目标演唱部分以外的歌曲内容，是需要其他用户对象演唱的。基于此，可以生成一个合唱邀请信息，以邀请至少一个用户对象演唱剩余的原始合唱者所对应的演唱部分。

例如，目标歌曲的原始合唱者包括原始合唱者A、原始合唱者B、原始合唱者C，第一选择操作对应原始合唱者A，第二选择操作对应原始合唱者B，那么，原始合唱C的演唱部分是需要其它用户演唱的，那么，可以基于原始合唱者C生成一个合唱邀请信息，并发送该合唱邀请信息，以邀请至少一个用户对象演唱原始合唱者C所对应的演唱部分。

在一些实施例中，终端在发送合唱邀请信息之后，还可以接收并呈现至少一个用户对象的接受邀请信息，接受邀请信息用于指示至少一个用户对象所选取的演唱部分；将除目标原始合唱者对应的演唱部分、及至少一个用户对象所选取的演唱部分外的歌曲内容，作为目标对象所要演唱的目标演唱部分。相应的，可以通过以下方式录制目标对象的第一歌曲数据：在录制目标对象的歌曲数据的过程中，输出提示信息，以提示目标对象演唱目标演唱部分；基于提示信息，录制目标对象的第一歌曲数据。

在实际实施时，也可以是先发送合唱邀请信息，让接受合唱邀请的用户来选择所要演唱的演唱部分，然后将剩余部分作为目标对象所要演唱的目标演唱部分。这里，发送的合唱邀请信息携带除目标原始合唱者以外的原始合唱者，以使接收该合唱邀请信息的用户对象可以基于合唱邀请信息，选择所要演唱的演唱部分，如一个或多个原始合唱者对应的演唱部分。

在实际应用中，用户对象选择好所要演唱的演唱部分后，可以触发接受合唱邀请指令，以发送接受邀请信息至当前终端，终端接收到该接收邀请信息后，呈现该接收邀请信息，以提示目标对象，存在用户对象接受了合唱邀请，并告知目标对象该用户对象所选取的演唱部分，那么，除目标原始合唱者对应的演唱部分、及至少一个用户对象所选取的演唱部分外的歌曲内容，是目标对象所要演唱的目标演唱部分。在录制目标对象的歌曲的过程中，基于该目标演唱部分，输出提示信息，以提示目标对象演唱目标演唱部分。

步骤403：响应于基于至少两个合唱者触发的合唱录制指令，呈现对应目标歌曲的歌曲录制界面，并录制目标对象的第一歌曲数据。

在实际实施时，终端在接收到合唱录制指令后，会呈现对应目标歌曲的歌曲录制界面，目标对象可以基于歌曲录制界面，演唱目标歌曲，终端录制目标对象的第一歌曲数据。

这里，为提升目标对象的演唱体验，在录制目标对象的第一歌曲数据的过程中，终端会在歌曲录制界面中呈现目标歌曲的歌词、音调等信息，以帮助目标对象演唱目标歌曲。

作为示例，图9是本申请实施例提供的歌曲录制界面示意图，参见图9，在歌曲录制界面中，呈现目标歌曲的歌词901、音调902，目标对象可以基于呈现的目标歌曲的歌词901、音调902进行演唱。

终端还可以在歌曲录制界面呈现歌曲录制的多个功能项，如暂停、重新录制、完成等，以在歌曲录制过程中，能够实现暂停录制、恢复录制等功能。

在一些实施例中，为避免目标对象在合唱过程中唱错片段，在录制目标对象的第一歌曲数据的过程中，终端可以输出提示信息，以提示目标对象演唱其所要演唱的目标演唱部分。

在实际实施时，提示信息的输出方式有多种，例如，对目标演唱部分对应的歌曲进行区别显示；或者可以在到达目标演唱部分时，呈现文字提醒。

在一些实施例中，录制目标对象的第一歌曲数据：从目标歌曲对应的原始歌曲数据中，提取目标原始合唱者的歌曲数据；在录制目标对象的歌曲数据的过程中，播放目标歌曲的伴奏音乐，并在目标原始合唱者的演唱部分，播放目标原始合唱者的歌曲数据；基于播放的伴奏音乐及目标原始合唱者的歌曲数据，录制目标对象的第一歌曲数据。

在实际实施时，在录制目标对象的第一歌曲数据的过程中，在目标原始合唱者的演唱部分，播放伴奏音乐和目标原始合唱者的歌曲数据；在目标对象的目标演唱部分，仅播放伴奏音乐。如此，能够通过音频输出的方式，提示目标对象演唱目标演唱部分；并且能够给目标对象带来更好的唱歌体验，给目标对象一种与目标原始合唱者对唱的感觉。

在一些实施例中，终端在确定演唱目标歌曲的至少两个合唱者之后，还可以呈现目标歌曲的歌词；响应于基于目标歌曲的歌词触发的歌词选取操作，将所选取的歌词作为目标对象所要演唱的目标演唱部分；相应的，终端还可以通过以下方式录制目标对象的第一歌曲数据：在录制目标对象的歌曲数据的过程中，输出提示信息，以提示目标对象演唱目标演唱部分；基于提示信息，录制目标对象的第一歌曲数据。

在实际实施时，在确定演唱目标歌曲的至少两个合唱者之后，目标对象还可以进一步对所要演唱的目标演唱部分进行选择，这里在选择时，不再基于演唱角色进行选择，而是基于歌词进行选择，也即，目标对象可以选择某一原始合唱者所对应的演唱部分中的一部分进行演唱，而不一定需要选择该原始合唱者所对应的演唱部分的全部，如此，使得目标对象在选择目标演唱部分时，自主选择性更高。

例如，图10是本申请实施例提供的演唱部分选择界面示意图，参见图10，演唱部分选择界面呈现目标歌曲的歌词，每句歌词前呈现有一个选择项1001，点击该选择项便能够选择对应的歌词，这里，在选择完成后，点击确定按键1002，终端确定用户所选择的歌词为用户所要演唱的目标演唱部分。

在一些实施例中，对于目标对象未选择、且不属于目标原始合唱者的演唱部分的歌曲内容，可以邀请至少一个用户对象来演唱。

步骤404：响应于针对目标歌曲的录制结束指令，生成包括第一歌曲数据及目标原始合唱者的第二歌曲数据的合唱媒体文件。

在实际实施时，针对目标歌曲的录制结束指令可以是在整首歌曲全部录制完后自动触发的，也可以是由用户触发的，例如，参见图9，用户点击图9中的完成图标903，触发录制结束指令。

在一些实施例中，可以通过以下方式生成包括第一歌曲数据及目标原始合唱者的第二歌曲数据的合唱媒体文件：从目标歌曲的原始音频文件中，提取目标原始合唱者的第二歌曲数据；基于第一歌曲数据及第二歌曲数据，合成对应目标歌曲的合唱媒体文件。

在实际实施时，原始音频文件中包括伴奏数据和各原始合唱者的歌曲数据，需要从原始音频文件中提取出目标原始合唱者的第二歌曲数据，这里，可以通过以下方式提取目标原始合唱者的第二歌曲数据：首先将目标歌曲的原始音频文件转化为声谱图，对声谱图进行图像识别，以确定对应人声部分的声谱图和对应伴奏音乐的声谱图，将对应人声部分的声谱图转化为音频，生成对应人声部分的音频文件；将和对应伴奏音乐的声谱图转化为音频，生成对应伴奏音乐的音频文件；对人声部分的音频文件中的歌曲数据进行分离，以得到目标歌曲的各原始合唱者的单人音频轨道文件。其中，目标原始合唱者的单人音频轨道文件中的歌曲数据即为第二歌曲数据。这里，将第一歌曲数据与第二歌曲数据合成，便得到对应目标歌曲的合唱媒体文件。

在实际应用中，还可以加入伴奏数据，也即，将第一歌曲数据、第二歌曲数据及伴奏音乐数据合成，以得到对应目标歌曲的合唱媒体文件。

在一些实施例中，可以通过以下方式生成包括第一歌曲数据及目标原始合唱者的第二歌曲数据的合唱媒体文件：当存在用户对象接受合唱邀请时，获取录制的用户对象的歌曲数据；基于第一歌曲数据、用户对象的歌曲数据、及目标原始合唱者的第二歌曲数据，合成对应目标歌曲的合唱媒体文件。

在实际实施时，当邀请了其它用户对象一起合唱时，生成的合唱媒体文件中，处理第一歌曲数据和第二歌曲数据，还包括用户对象的歌曲数据。基于此，将第一歌曲数据、用户对象的歌曲数据、及目标原始合唱者的第二歌曲数据合成，得到对应目标歌曲的合唱媒体文件。

其中，用户对象的歌曲数据是由用户对象通过其自身终端录制后，发送给当前终端的。

在实际应用中，用户对象可以与目标对象同时进行歌曲录制，也可以在生成合唱媒体文件之前的任意时刻进行歌曲录制。

在一些实施例中，可以通过以下方式生成包括第一歌曲数据及目标原始合唱者的第二歌曲数据的合唱媒体文件：获取对应目标歌曲的图像文件；基于第一歌曲数据、第二歌曲数据及图像文件，进行视频编码，得到对应目标歌曲的合唱视频文件。

在实际实施时，合成媒体文件不仅可以是合成音频文件，还可以是合成视频文件，其中，合成视频文件中音频部分，是基于第一歌曲数据和第二歌曲数据合成，视频文件中的图像部分是基于目标歌曲的图像文件得到的；进而，基于第一歌曲数据、第二歌曲数据及图像文件，进行视频编码，得到对应目标歌曲的合唱视频文件。

这里，对应目标歌曲的图像文件可以是对应目标歌曲的图片文件，也可以是对应目标歌曲的视频文件。

在一些实施例中，视频文件中的图像部分还可以是基于目标歌曲的图像文件和对应目标对象的图像文件合成得到的，例如，可以在录制目标对象的第一歌曲数据的同时，录制目标对象的视频文件，将目标歌曲的图像文件与目标对象的视频文件合成，得到合唱视频文件中的画面部分。

在一些实施例中，可以通过以下方式生成包括第一歌曲数据及目标原始合唱者的第二歌曲数据的合唱媒体文件：从目标歌曲对应的原始歌曲数据中，提取目标原始合唱者的第二歌曲数据；确定原始歌曲数据中存在除第一歌曲数据及第二歌曲数据外的目标歌曲数据时，采用目标原始合唱者的音色，生成对应目标歌曲数据的第三歌曲数据；基于第一歌曲数据、第二歌曲数据及第三歌曲数据，合成对应目标歌曲的合唱媒体文件。

在实际实施时，对于目标歌曲数据，可以通过人工智能算法，基于目标原始合唱者的音频数据，提取目标原始合唱者的音色，进而采用目标原始合唱者的音色，生成对应目标歌曲数据的第三歌曲数据，这里的第三歌曲数据在听觉上，是由目标原始合唱者演唱的。

在一些实施例中，在生成包括第一歌曲数据及目标原始合唱者的第二歌曲数据的合唱媒体文件之后，还可以当检测到合唱媒体文件中包含未演唱部分时，呈现邀请提示信息，以提示邀请至少一个用户对象对未演唱部分进行演唱。

在实际实施时，可以根据目标原始合唱者的演唱部分、和目标对象选择的自身演唱的目标演唱部分，判断合唱媒体文件中是否包含未演唱部分；也可以对合唱媒体文件中的人声部分进行检测，以判断合唱媒体文件中是否包含未演唱部分。在合唱媒体文件中包含未演唱部分时，可以提示目标对象邀请至少一个用户对象对未演唱部分进行演唱。

作为示例，图11是本申请实施例提供的邀请提示信息的呈现界面示意图，参见图11，呈现邀请提示信息1101，以告知目标对象，合唱媒体文件中是否包含未演唱部分，并提示目标对象可以邀请至少一个用户对象对未演唱部分进行演唱。

在实际应用中，目标对象可以基于该邀请提示信息，触发针对合唱邀请信息的发送指令，终端在接收到发送指令后，发送合唱邀请信息，以邀请至少一个用户对象对未演唱部分进行演唱。例如，参见图11，当用户点击邀请按键1102时，终端发送合唱邀请信息。

在一些实施例中，终端在生成包括第一歌曲数据及目标原始合唱者的第二歌曲数据的合唱媒体文件之后，还可以呈现对应合唱媒体文件的编辑界面；响应于基于编辑界面触发的编辑操作，对合唱媒体文件的以下参数之一进行调节：人声音量、伴奏音量、混响模式、均衡状态。

在实际实施时，在生成合唱媒体文件后，目标对象还可以对合唱媒体文件的人声音量、伴奏音量、混响模式、均衡状态等进行调节。

图12是本申请实施例提供的编辑界面示意图，参见图12，呈现编辑界面，在编辑界面中呈现人声音量的调节控件1201、伴奏音量的调节控件1202等，目标对象可以基于这些调节控件，对相应的参数进行调节。

下面，将说明本申请实施例在一个实际的应用场景中的示例性应用。

在实际实施时，首先，终端呈现歌曲搜索界面，目标对象基于歌曲搜索界面，搜索找到所要合唱的目标歌曲，这里的目标歌曲的原始合唱者的数量为至少两个；然后，用户触发针对目标歌曲的合唱指令，终端呈现包括所述目标歌曲的至少两个原始合唱者的合唱者选择界面，用户基于合唱者选择界面，从至少两个原始合唱者中，选择至少一个作为与其合唱目标歌曲的目标原始合唱者；在接收到用户针对目标原始合唱者的选择操作后，呈现演唱部分选择界面，用户基于演唱部分选择界面，选择所要演唱的目标演唱部分；接着，用户可以触发合唱录制指令，终端接收到合唱录制指令后，对目标对象的歌曲数据进行录制，并在录制完成后，生成合唱媒体文件。这里，在生成合唱媒体文件后，终端还可以呈现合唱媒体文件的编辑界面，目标对象可以基于该编辑界面，对合唱媒体文件的人声音量、伴奏音量、混响模式、均衡状态等进行调节。

在实际应用中，终端呈现歌曲搜索界面后，用户可以基于歌曲搜索界面输入歌曲信息，以搜索想要合唱的歌曲，这里的歌曲信息可以是演唱者(如组合名称、原始合唱者名称)，也可以是歌曲名称。

作为示例，参见图5，呈现歌曲搜索界面，并在歌曲搜索界面中呈现搜索框501及搜索按键502，用户可以基于该搜索输入框输入歌曲信息，如输入组合名称；当接收到针对歌曲信息的搜索指令后，呈现与该歌曲信息相匹配的多个歌曲，例如，输入歌手名称，呈现相应歌手演唱的歌曲503。

这里，参见图5，当输入的歌曲信息为组合名称时，还呈现该组合的主页入口504，目标对象点击该主页入口后，呈现该组合的歌手主页；参见图6，呈现组合的歌手主页，在该歌手主页中，呈现该歌手的详细信息，包括该组合演唱的歌曲601，这里用户可以基于该歌手主页选择目标歌曲。

在选择目标歌曲后，可以直接触发针对目标歌曲的合唱指令，或者可以呈现目标歌曲的详情页面，用户基于该详情页面触发针对目标歌曲的合唱指令。

例如，参见图7，在详情页面呈现目标歌曲的详细信息，如名称、演唱者、演唱该歌曲的用户排行榜(历史最佳独唱)等，并呈现针对目标歌曲的合唱功能项701，用户点击该合唱功能项701，触发针对目标歌曲的合唱指令。

在实际应用中，终端在接收到针对目标歌曲的歌唱指令后，跳转至合唱者选择界面，例如，参见图8，在合唱者选择界面中，呈现目标歌曲的多个原始合唱者801，这里呈现的是各原始合唱者的名称和头像，用户可以通过点击名称或头像，来预选原始合唱者，在选择完成后，可以点击确定功能项802，以确定最终选择的目标原始合唱者。

在用户选择了目标原始合唱者之后，还终端进行页面跳转，跳转至演唱部分选择界面，这里，在演唱部分选择界面呈现目标歌曲的歌词，用户基于呈现的歌词选择所要演唱的目标演唱部分，也即选择要演唱哪几句歌词。

例如，参见图10，演唱部分选择界面呈现目标歌曲的歌词，每句歌词前呈现有一个选择项1001，点击该选择项便能够选择对应的歌词，这里，在选择完成后，点击确定按键1002，终端确定用户所选择的歌词为用户所要演唱的目标演唱部分。

这里，在选择目标演唱部分后，可以自动触发针对目标歌曲的合唱录制指令，终端呈现合唱录制界面，并对用户演唱的歌曲数据进行录制，并在录制完成后，生成合唱媒体文件。参见图9，在合唱录制界面中，呈现目标歌曲的歌词，用户可以根据呈现的歌词来进行演唱。

这里，可以是整首歌录制完成后确定录制完成，也可以是在接收到用户触发的录制结束指令后，确定录制完成。例如，用户点击图10中的完成图标1001，触发录制结束指令。

基于上述对本申请实施例的歌曲处理方法的说明，下面对本申请实施例的歌曲处理方法的技术侧实现进行说明。在实际实施时，本申请实施例的歌曲处理方法的技术侧实现包括三个部分：音频素材准备阶段、录音阶段、合成阶段。

首先对音频素材准备阶段进行说明。

图13是本申请实施例提供的音频素材准备阶段的流程示意图，参见图11，音频素材准备阶段包括：

步骤1301：将目标歌曲的原始音频文件转化为声谱图。

步骤1302：基于声谱图，生成对应人声部分的音频文件和对应伴奏音乐的音频文件。

这里，利用卷积神经网络，对声谱图进行图像识别，以确定对应人声部分的声谱图和对应伴奏音乐的声谱图，将对应人声部分的声谱图转化为音频，生成对应人声部分的音频文件；将和对应伴奏音乐的声谱图转化为音频，生成对应伴奏音乐的音频文件。

步骤1303：将对应人声部分的音频文件转换为pcm格式的音频文件。

步骤1304：按照预设步长和预设切割长度，将pcm格式的音频文件切分成若干个语音单元。

其中，预设步长小于预设切割长度。

步骤1305：依次提取各语音单元中的语音特征。

这里，语音特征包括：左右声道平衡度、音量、音长、力度、高音、音程等。

步骤1306：获取语音单元间的语音特征参数的匹配值。

步骤1307：判断匹配值是否高于预设阈值，若是，执行步骤1008；否则，不执行处理。

步骤1308：将两个语音单元按顺序保存在同一音频文件内。

步骤1309：将同一音频文件内，所有语音单元分离为对应各原始合唱者的单人音频轨道文件。

步骤1310：将多个单人音频轨道文件及伴奏音乐的音频文件上传至平台。

接着，对音频录制阶段进行说明。

在实际实施时，在将音频文件上传至平台后，需要对各原始合唱者的单人音频轨道文件打上标签，以基于标签确定该单人音频轨道文件所对应的原始合唱者。这里，在用户可以选择目标原始合唱者后，筛选出对应目标原始合唱者的单人音频轨道文件，以在后续合成合唱音频文件时，使用该目标原始合唱者的单人音频轨道文件。

在音频录制之前，需要将录音器初始化；在音频录制中，可以暂停录制、恢复录制，最后录制完成时，从录音器获取的缓冲数据，存入PCM文件，以得到用户的歌曲数据。

最后，对合成阶段进行说明。

这里，基于录制的用户的歌曲数据、伴奏音乐的音频文件、目标原始合唱者的单人音频轨道文件，合成合唱音频文件。这里，合成合唱音频文件后，用户可以选择保存在本地或直接出上传，保存在本地的合成合唱音频文件也可以随时上传。

在一些实施例中，本申请也可以生成合唱视频文件，这里合唱视频文件中的音频部分的合成方式与上述合唱音频文件的合成方式相同，合成视频文件中的图像部分可以是获取对应目标歌曲的视频文件，并录制用户的视频文件，将目标歌曲的视频文件中的图像与用户的视频文件中的图像进行合成；也可以是获取目标歌曲的图像及用户的图像，将目标歌曲的图像与用户的图像合成。

在一些实施例中，本申请实施例中的目标歌曲也可以是直播演唱会中的歌曲，也即可以基于直播演唱会中的歌曲实现合唱功能。

应用上述实施例，用户可以自主选择所要合唱的目标原始合唱者，也可以自主选择所要演唱的部分，提升了用户的自主选择性。

下面继续说明本申请实施例提供的歌曲处理装置555的实施为软件模块的示例性结构，在一些实施例中，如图3所示，存储在存储器540的歌曲处理装置555中的软件模块可以包括：

在一些实例中，所述确定模块，还用于将所述第一选择操作所对应的原始合唱者作为目标原始合唱者；

在一些实例中，所述确定模块，还用于当除所述目标原始合唱者以外的原始合唱者数量为至少两个时，接收到针对所述目标歌曲的合唱邀请指令；

在一些实例中，所述确定模块，还用于响应于针对所述原始合唱者的第二选择操作，确定所述第二选择操作对应的原始合唱者；

在一些实例中，所述确定模块，还用于接收并呈现至少一个用户对象的接受邀请信息，所述接受邀请信息用于指示所述至少一个用户对象所选取的演唱部分；

基于所述提示信息，录制所述目标对象的第一歌曲数据。

在一些实例中，所述确定模块，还用于当存在用户对象接受合唱邀请时，获取录制的所述用户对象的歌曲数据；

在一些实例中，所述生成模块，还用于从所述目标歌曲的原始音频文件中，提取所述目标原始合唱者的第二歌曲数据；

在一些实例中，所述生成模块，还用于获取对应所述目标歌曲的图像文件；

在一些实例中，所述生成模块，还用于从所述目标歌曲对应的原始歌曲数据中，提取所述目标原始合唱者的第二歌曲数据；

在一些实例中，所述生成模块，还用于当检测到所述合唱媒体文件中包含未演唱部分时，呈现邀请提示信息，以提示邀请至少一个用户对象对所述未演唱部分进行演唱。

在一些实例中，所述生成模块，还用于呈现所述目标歌曲的歌词；

基于所述提示信息，录制所述目标对象的第一歌曲数据。

在一些实例中，所述生成模块，还用于呈现对应所述合唱媒体文件的编辑界面；

在一些实例中，所述录制模块，还用于从所述目标歌曲对应的原始歌曲数据中，提取所述目标原始合唱者的歌曲数据；

在一些实例中，所述呈现模块，还用于呈现歌曲搜索界面，并在所述歌曲搜索界面中呈现搜索功能项；

接收到输入的歌曲信息；

本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行本申请实施例上述的歌曲处理方法。

本申请实施例提供一种存储有可执行指令的计算机可读存储介质，其中存储有可执行指令，当可执行指令被处理器执行时，将引起处理器执行本申请实施例提供的方法，例如，如图4示出的方法。

在一些实施例中，计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(HTML，Hyper TextMarkup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。

作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

以上所述，仅为本申请的实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本申请的保护范围之内。

Claims

1.一种歌曲处理方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述确定演唱所述目标歌曲的至少两个合唱者，包括：

将所述第一选择操作所对应的原始合唱者作为目标原始合唱者；

3.如权利要求2所述的方法，其特征在于，所述将所述目标原始合唱者及所述目标对象，确定为演唱所述目标歌曲的至少两个合唱者之后，还包括：

当除所述目标原始合唱者以外的原始合唱者数量为至少两个时，接收到针对所述目标歌曲的合唱邀请指令；

4.如权利要求3所述的方法，其特征在于，所述接收到针对所述目标歌曲的合唱邀请指令之前，所述方法还包括：

响应于针对所述原始合唱者的第二选择操作，确定所述第二选择操作对应的原始合唱者；

所述发送合唱邀请信息，包括：

5.如权利要求3所述的方法，其特征在于，所述发送合唱邀请信息之后，所述方法还包括：

接收并呈现至少一个用户对象的接受邀请信息，所述接受邀请信息用于指示所述至少一个用户对象所选取的演唱部分；

所述录制所述目标对象的第一歌曲数据，包括：

在录制所述目标对象的歌曲数据的过程中，输出提示信息，以提示所述目标对象演唱所述目标演唱部分；

基于所述提示信息，录制所述目标对象的第一歌曲数据。

6.如权利要求3所述的方法，其特征在于，所述生成包括所述第一歌曲数据及所述目标原始合唱者的第二歌曲数据的合唱媒体文件，包括：

当存在用户对象接受合唱邀请时，获取录制的所述用户对象的歌曲数据；

7.如权利要求1所述的方法，其特征在于，所述生成包括所述第一歌曲数据及所述目标原始合唱者的第二歌曲数据的合唱媒体文件，包括：

从所述目标歌曲的原始音频文件中，提取所述目标原始合唱者的第二歌曲数据；

8.如权利要求7所述的方法，其特征在于，所述基于所述第一歌曲数据及所述第二歌曲数据，合成对应所述目标歌曲的合唱媒体文件，包括：

获取对应所述目标歌曲的图像文件；

9.如权利要求1所述的方法，其特征在于，所述生成包括所述第一歌曲数据及所述目标原始合唱者的第二歌曲数据的合唱媒体文件，包括：

从所述目标歌曲对应的原始歌曲数据中，提取所述目标原始合唱者的第二歌曲数据；

10.如权利要求1所述的方法，其特征在于，所述生成包括所述第一歌曲数据及所述目标原始合唱者的第二歌曲数据的合唱媒体文件之后，还包括：

当检测到所述合唱媒体文件中包含未演唱部分时，呈现邀请提示信息，以提示邀请至少一个用户对象对所述未演唱部分进行演唱。

11.如权利要求1所述的方法，其特征在于，所述确定演唱所述目标歌曲的至少两个合唱者之后，还包括：

呈现所述目标歌曲的歌词；

所述录制所述目标对象的第一歌曲数据，包括：

基于所述提示信息，录制所述目标对象的第一歌曲数据。

12.如权利要求1所述的方法，其特征在于，所述生成包括所述第一歌曲数据及所述目标原始合唱者的第二歌曲数据的合唱媒体文件之后，还包括：

呈现对应所述合唱媒体文件的编辑界面；

13.一种歌曲处理装置，其特征在于，所述装置包括：

14.一种计算机设备，其特征在于，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现权利要求1至12任一项所述的歌曲处理方法。

15.一种计算机可读存储介质，其特征在于，存储有可执行指令，用于被处理器执行时，实现权利要求1至12任一项所述的歌曲处理方法。