CN111383669A

CN111383669A - 多媒体文件上传方法、装置、设备及计算机可读存储介质

Info

Publication number: CN111383669A
Application number: CN202010197648.8A
Authority: CN
Inventors: 冯威; 朱一闻; 曹偲; 郑冲; 黄朝银; 刘华平
Original assignee: Hangzhou Netease Cloud Music Technology Co Ltd
Current assignee: Hangzhou Netease Cloud Music Technology Co Ltd
Priority date: 2020-03-19
Filing date: 2020-03-19
Publication date: 2020-07-07
Anticipated expiration: 2040-03-19
Also published as: CN111383669B

Abstract

本申请的实施方式提供了一种多媒体文件上传方法、多媒体文件上传装置、电子设备以及计算机可读存储介质，涉及多媒体信号处理技术领域。该方法包括：根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别；从目标音频类别对应的音频库中选取待输出的音频文件，并根据用于表征音频文件选取的第二用户操作从待输出的音频文件中确定目标音频文件；播放目标音频文件的伴奏部分并进行多媒体信号采集；根据采集到的多媒体信号和伴奏部分生成多媒体文件，并将多媒体文件上传至目标音频类别对应的多媒体分区。可见，实施本申请实施例能够用于解决用户选歌效率较低的问题。

Description

多媒体文件上传方法、装置、设备及计算机可读存储介质

技术领域

本申请的实施方式涉及多媒体信号处理技术领域，更具体地，本申请的实施方式涉及多媒体文件上传方法、多媒体文件上传装置、电子设备以及计算机可读存储介质。

背景技术

随着计算机技术的不断发展，人们越来越多的由线下KTV转战线上唱歌软件来一展歌喉，唱歌软件相较于KTV而言更具便捷性，人们不用出门就可以在家利用唱歌软件来唱歌。一般来说，用户想要在唱歌软件中唱歌需要先进行选歌，具体地，用户可以在唱歌软件所提供的曲库中进行翻阅选取，进而通过音频录制等功能完成自己的演唱作品。但是，曲库中的歌曲通常繁杂众多且无序，用户很难从曲库中快速找到符合自己即时需求的歌曲进行演唱，这样容易造成用户选歌效率较低的问题。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解，因此，不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

基于上述问题，发明人进行了相应的思考，做出了有针对性的改进，提供了多媒体文件上传方法、多媒体文件上传装置、电子设备以及计算机可读存储介质，用于解决用户选歌效率较低的问题。

根据本申请实施例的第一方面，公开了一种多媒体文件上传方法，包括：

根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别；

从目标音频类别对应的音频库中选取待输出的音频文件，并根据用于表征音频文件选取的第二用户操作从待输出的音频文件中确定目标音频文件；

播放目标音频文件的伴奏部分并进行多媒体信号采集；

根据采集到的多媒体信号和伴奏部分生成多媒体文件，并将多媒体文件上传至目标音频类别对应的多媒体分区。

在一个实施例中，基于前述方案，根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别，包括：

当检测到用于触发多媒体信号采集功能启动的用户操作时，输出包括多个待选标识符的第一页面；当检测到用于表征音频类别选取的第一用户操作时，从多个待选标识符中选取与第一用户操作对应的目标标识符；将目标标识符对应的音频类别确定为目标音频类别；其中，多个待选标识符分别用于表示不同的音频类别；或者，

当检测到用于触发多媒体信号采集功能启动的用户操作时，采集用户输入的语音信号；解析语音信号，得到与语音信号对应的文本信息；从多种音频类别中确定与文本信息相匹配的目标音频类别。

在一个实施例中，基于前述方案，多种音频类别分别用于代表不同的用户心情，多种音频类别包括开心、伤心、郁闷、孤独以及平静。

在一个实施例中，基于前述方案，从目标音频类别对应的音频库中选取待输出的音频文件，包括：

从音频库中确定与目标音频类别对应的所有音频文件；

从所有音频文件中选取调用频率高于预设频率的预设数量的音频文件，作为待输出的音频文件。

在一个实施例中，基于前述方案，从目标音频类别对应的音频库中选取待输出的音频文件之后，上述方法还可以包括以下步骤：

识别各待输出的音频文件分别对应的歌曲高潮片段；

生成用于承载各歌曲高潮片段对应的歌词的多个第一滑动窗口；

输出用于承载第一滑动窗口的第二页面并播放第一滑动窗口对应的歌曲高潮片段；

当检测到页面切换操作时，根据页面切换操作控制第二页面中的第一滑动窗口进行滑动。

在一个实施例中，基于前述方案，输出用于承载第一滑动窗口的第二页面之后，上述方法还可以包括以下步骤：

若未检测到用于指示播放完整歌曲的第三用户操作，则执行播放第一滑动窗口对应的歌曲高潮片段；

若检测到第三用户操作，则将第一滑动窗口中的歌曲高潮片段的歌词更新为完整歌曲的歌词并播放完整歌曲；其中，待输出的音频文件与完整歌曲相对应。

在一个实施例中，基于前述方案，根据用于表征音频文件选取的第二用户操作从待输出的音频文件中确定目标音频文件，包括：

根据作用于第一滑动窗口的第二用户操作从待输出的音频文件中确定目标音频文件；其中，第二用户操作用于表征音频文件选取。

在一个实施例中，基于前述方案，播放目标音频文件的伴奏部分并进行多媒体信号采集之前，上述方法还可以包括以下步骤：

当未检测到第二用户操作而检测到音频搜索操作时，输出与音频搜索操作对应的音频列表；

根据用户选取操作从音频列表中确定出目标音频文件。

在一个实施例中，基于前述方案，播放目标音频文件的伴奏部分，包括：

显示目标音频文件对应的歌词，并根据伴奏部分对应的播放进度同步更新目标音频文件的歌词的显示进度；其中，显示的目标音频文件对应的歌词为歌曲高潮片段的歌词或完整歌曲的歌词。

在一个实施例中，基于前述方案，进行多媒体信号采集，包括：

根据检测到的用于表征信号采集方式选取的第四用户操作确定多媒体信号的采集方式；其中，采集方式包括音频信号采集和视频信号采集；

根据采集方式采集多媒体信号；

其中，当采集方式为音频信号采集时，多媒体信号为音频信号；当采集方式为视频信号采集时，多媒体信号为视频信号。

在一个实施例中，基于前述方案，当采集方式为视频信号采集时，根据采集方式采集多媒体信号，包括：

控制与摄像方式选择操作对应的摄像头采集视频信号；其中，第一滑动窗口还用于承载视频信号对应的视频内容。

在一个实施例中，基于前述方案，控制与摄像方式选择操作对应的摄像头采集视频信号之后，上述方法还可以包括以下步骤：

根据用于触发美化功能启动的第五用户操作对视频信号对应的视频内容进行美化。

在一个实施例中，基于前述方案，根据采集到的多媒体信号和伴奏部分生成多媒体文件，包括：

采集用户输入的发布语；

根据采集到的多媒体信号、伴奏部分和发布语生成多媒体文件。

在一个实施例中，基于前述方案，根据采集到的多媒体信号和伴奏部分生成多媒体文件之后，上述方法还可以包括以下步骤：

通过预览页面输出多媒体文件；

在检测到用于表征重新采集多媒体信号的第六用户操作时，响应第六用户操作并根据重新采集的结果更新多媒体文件。

在一个实施例中，基于前述方案，将多媒体文件上传至目标音频类别对应的多媒体分区，包括：

根据检测到的用户确认操作将多媒体文件上传至目标音频类别对应的多媒体分区。

在一个实施例中，基于前述方案，将多媒体文件上传至目标音频类别对应的多媒体分区之后，上述方法还可以包括以下步骤：

生成用于承载多媒体文件的第二滑动窗口；

输出用于承载第二滑动窗口的第三页面；第三页面用于承载第二滑动窗口以及承载目标音频类别对应的其他多媒体文件的滑动窗口，第三页面用于表征目标音频类别对应的多媒体分区。

将多媒体文件存储至用户对应的历史记录中，历史记录中包括按照时间顺序存储的用户的所有多媒体文件。

在一个实施例中，基于前述方案，将多媒体文件存储至用户对应的历史记录中之后，上述方法还可以包括以下步骤：

若检测到预设周期内存在满足预设条件的待合成多媒体文件，则将待合成多媒体文件进行合成并存储合成结果。

在一个实施例中，基于前述方案，预设条件可以包括：属于同一演唱家且满足预设数量条件，或属于同一音频类别且满足预设数量条件。

在一个实施例中，基于前述方案，将待合成多媒体文件进行合成并存储合成结果之后，上述方法还可以包括以下步骤：

输出用于提示用户查看合成结果的提示信息。

根据本申请实施例的第二方面，公开了一种多媒体文件上传装置，其特征在于，包括：音频类别确定单元、音频文件选取单元、音频文件确定单元、音频文件播放单元、多媒体信号采集单元、多媒体文件生成单元以及多媒体文件上传单元，其中：

音频类别确定单元，用于根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别；

音频文件选取单元，用于从目标音频类别对应的音频库中选取待输出的音频文件；

音频文件确定单元，用于根据用于表征音频文件选取的第二用户操作从待输出的音频文件中确定目标音频文件；

音频文件播放单元，用于播放目标音频文件的伴奏部分；

多媒体信号采集单元，用于进行多媒体信号采集；

多媒体文件生成单元，用于根据采集到的多媒体信号和伴奏部分生成多媒体文件；

多媒体文件上传单元，用于将多媒体文件上传至目标音频类别对应的多媒体分区。

在一个实施例中，基于前述方案，音频类别确定单元根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别，包括：

音频类别确定单元当检测到用于触发多媒体信号采集功能启动的用户操作时，输出包括多个待选标识符的第一页面；当检测到用于表征音频类别选取的第一用户操作时，从多个待选标识符中选取与第一用户操作对应的目标标识符；将目标标识符对应的音频类别确定为目标音频类别；其中，多个待选标识符分别用于表示不同的音频类别；或者，

音频类别确定单元当检测到用于触发多媒体信号采集功能启动的用户操作时，采集用户输入的语音信号；解析语音信号，得到与语音信号对应的文本信息；从多种音频类别中确定与文本信息相匹配的目标音频类别。

在一个实施例中，基于前述方案，音频文件选取单元从目标音频类别对应的音频库中选取待输出的音频文件，包括：

音频文件选取单元从音频库中确定与目标音频类别对应的所有音频文件；

音频文件选取单元从所有音频文件中选取调用频率高于预设频率的预设数量的音频文件，作为待输出的音频文件。

在一个实施例中，基于前述方案，上述装置还可以包括：

音频片段识别单元，用于在音频文件选取单元从目标音频类别对应的音频库中选取待输出的音频文件之后，识别各待输出的音频文件分别对应的歌曲高潮片段；

滑动窗口生成单元，用于生成用于承载各歌曲高潮片段对应的歌词的多个第一滑动窗口；

页面输出单元，用于输出用于承载第一滑动窗口的第二页面并播放第一滑动窗口对应的歌曲高潮片段；

滑动窗口控制单元，用于当检测到页面切换操作时，根据页面切换操作控制第二页面中的第一滑动窗口进行滑动。

在一个实施例中，基于前述方案，页面输出单元，具体用于在输出用于承载第一滑动窗口的第二页面之后，若未检测到用于指示播放完整歌曲的第三用户操作，则播放第一滑动窗口对应的歌曲高潮片段；

上述装置还可以包括：

歌词更新单元，用于在检测到第三用户操作时，将第一滑动窗口中的歌曲高潮片段的歌词更新为完整歌曲的歌词并播放完整歌曲；其中，待输出的音频文件与完整歌曲相对应。

在一个实施例中，基于前述方案，音频文件确定单元根据用于表征音频文件选取的第二用户操作从待输出的音频文件中确定目标音频文件，包括：

音频文件确定单元根据作用于第一滑动窗口的第二用户操作从待输出的音频文件中确定目标音频文件；其中，第二用户操作用于表征音频文件选取。

在一个实施例中，基于前述方案，上述装置还可以包括：

音频列表输出单元，用于在音频文件播放单元播放目标音频文件的伴奏部分并进行多媒体信号采集之前，且当未检测到第二用户操作而检测到音频搜索操作时，输出与音频搜索操作对应的音频列表；

音频文件确定单元，还用于根据用户选取操作从音频列表中确定出目标音频文件。

在一个实施例中，基于前述方案，音频文件播放单元播放目标音频文件的伴奏部分，包括：

音频文件播放单元显示目标音频文件对应的歌词，并根据伴奏部分对应的播放进度同步更新目标音频文件的歌词的显示进度；其中，显示的目标音频文件对应的歌词为歌曲高潮片段的歌词或完整歌曲的歌词。

在一个实施例中，基于前述方案，多媒体信号采集单元进行多媒体信号采集，包括：

多媒体信号采集单元根据检测到的用于表征信号采集方式选取的第四用户操作确定多媒体信号的采集方式；其中，采集方式包括音频信号采集和视频信号采集；

多媒体信号采集单元根据采集方式采集多媒体信号；

在一个实施例中，基于前述方案，当采集方式为视频信号采集时，多媒体信号采集单元根据采集方式采集多媒体信号，包括：

多媒体信号采集单元控制与摄像方式选择操作对应的摄像头采集视频信号；其中，第一滑动窗口还用于承载视频信号对应的视频内容。

在一个实施例中，基于前述方案，上述装置还可以包括：

视频内容美化单元，用于在多媒体信号采集单元控制与摄像方式选择操作对应的摄像头采集视频信号之后，根据用于触发美化功能启动的第五用户操作对视频信号对应的视频内容进行美化。

在一个实施例中，基于前述方案，多媒体文件生成单元根据采集到的多媒体信号和伴奏部分生成多媒体文件，包括：

多媒体文件生成单元采集用户输入的发布语；

多媒体文件生成单元根据采集到的多媒体信号、伴奏部分和发布语生成多媒体文件。

在一个实施例中，基于前述方案，上述装置还可以包括：

多媒体文件输出单元，用于在多媒体文件生成单元根据采集到的多媒体信号和伴奏部分生成多媒体文件之后，通过预览页面输出多媒体文件；

多媒体文件更新单元，用于在检测到用于表征重新采集多媒体信号的第六用户操作时，响应第六用户操作并根据重新采集的结果更新多媒体文件。

在一个实施例中，基于前述方案，多媒体文件上传单元将多媒体文件上传至目标音频类别对应的多媒体分区，包括：

多媒体文件上传单元根据检测到的用户确认操作将多媒体文件上传至目标音频类别对应的多媒体分区。

在一个实施例中，基于前述方案，滑动窗口生成单元，还用于在多媒体文件上传单元将多媒体文件上传至目标音频类别对应的多媒体分区之后，生成用于承载多媒体文件的第二滑动窗口；

页面输出单元，还用于输出用于承载第二滑动窗口的第三页面；第三页面用于承载第二滑动窗口以及承载目标音频类别对应的其他多媒体文件的滑动窗口，第三页面用于表征目标音频类别对应的多媒体分区。

在一个实施例中，基于前述方案，上述装置还可以包括：

多媒体文件存储单元，用于多媒体文件上传单元将多媒体文件上传至目标音频类别对应的多媒体分区之后，在将多媒体文件存储至用户对应的历史记录中，历史记录中包括按照时间顺序存储的用户的所有多媒体文件。

在一个实施例中，基于前述方案，上述装置还可以包括：

多媒体文件合成单元，用于在多媒体文件存储单元将多媒体文件存储至用户对应的历史记录中之后，若检测到预设周期内存在满足预设条件的待合成多媒体文件，则将待合成多媒体文件进行合成并存储合成结果。

在一个实施例中，基于前述方案，上述装置还可以包括：

提示信息输出单元，用于在多媒体文件合成单元将待合成多媒体文件进行合成并存储合成结果之后，输出用于提示用户查看合成结果的提示信息。

根据本申请实施例的第三方面，公开了一种电子设备，包括：处理器；以及存储器，存储器上存储有计算机可读指令，计算机可读指令被处理器执行时实现如第一方面公开的多媒体文件上传方法。

根据本申请实施例的第四方面，公开了一种计算机程序介质，其上存储有计算机可读指令，当计算机可读指令被计算机的处理器执行时，使计算机执行根据本申请第一方面公开的多媒体文件上传方法。

本申请实施例能够根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别(如，悲伤)。进而，可以从目标音频类别对应的音频库中选取待输出的音频文件(如，悲伤的歌曲)，并根据用于表征音频文件选取的第二用户操作从待输出的音频文件中确定目标音频文件。进而，可以播放目标音频文件的伴奏部分并进行多媒体信号采集。进而，可以根据采集到的多媒体信号和伴奏部分生成多媒体文件，并将多媒体文件上传至目标音频类别对应的多媒体分区(如，悲伤分区)。相较现有技术，实施本申请的实施例一方面能够通过向用户推荐与其所选择的音频类型相对应的音频文件，简化用户在海量无序音频中选择所需音频的操作，这样可以有利于提升用户选择歌曲的效率，改善用户的使用体验，提升用户的使用黏度；特别地，当用户需要查找与当前时刻情景/场景/情绪/心境等即时需求相符合的歌曲时，实施本申请实施例可以帮助用户快速定位到所需歌曲，以降低用户的选歌难度，一定程度地提升用户的选歌效率，进而改善用户的使用体验。另一方面，实施本申请实施例还能够通过将目标音频文件上传至相对应的多媒体分区，提升目标音频文件获得的反馈数量，进而增加发布了相同音频类型的多媒体文件的用户之间的互动，改善用户的线上社交体验。

本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本申请。

附图说明

通过参考附图阅读下文的详细描述，本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本申请的若干实施方式，其中：

图1示出的是根据本申请一示例实施方式的多媒体文件上传方法的流程示意图；

图2示出的是根据本申请一示例实施方式的包括多个待选标识符的第一页面示意图；

图3示出的是根据本申请一示例实施方式的用于承载第一滑动窗口的第二页面示意图；

图4示出的是根据本申请一示例实施方式的页面切换操作示意图；

图5示出的是根据本申请一示例实施方式的音频搜索页面示意图；

图6示出的是根据本申请一示例实施方式的音频列表示意图；

图7示出的是根据本申请一示例实施方式的多媒体信号的采集方式选取页面示意图；

图8示出的是根据本申请一示例实施方式的美化功能的界面示意图；

图9示出的是根据本申请一示例实施方式的根据伴奏部分对应的播放进度同步更新目标音频文件的歌词的显示进度的界面示意图；

图10示出的是根据本申请一示例实施方式的发布语录入界面示意图；

图11示出的是根据本申请一示例实施方式的用于承载第二滑动窗口的第三页面示意图；

图12示出的是根据本申请一示例实施方式的历史记录界面示意图；

图13示出的是根据本申请一示例实施方式的合成结果示意图；

图14示出的是根据本申请一示例实施方式的用于提示用户查看合成结果的提示信息的用户界面示意图；

图15示出的是根据本申请另一示例实施方式的用于提示用户查看合成结果的提示信息的用户界面示意图；

图16示出的是根据本申请另一示例实施方式的多媒体文件上传方法的流程示意图；

图17示出的是根据本申请一示例实施方式的多媒体文件上传装置的结构框图；

图18示出的是根据本申请另一可选示例实施方式的多媒体文件上传装置的结构框图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本申请，而并非以任何方式限制本申请的范围。相反，提供这些实施方式是为了使本申请更加透彻和完整，并且能够将本申请的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本申请的实施方式可以实现为一种装置、设备、方法或计算机程序产品。因此，本申请可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本申请的实施方式，提出了一种多媒体文件上传方法、多媒体文件上传装置、电子设备以及计算机可读存储介质。

附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。

下面参考本申请的若干代表性实施方式，详细阐释本申请的原理和精神。

发明概述

现有技术中的唱歌软件通常需要用户进入曲库自主选择歌曲，但是曲库中的歌曲种类繁多且无序，而用户选择歌曲的方式通常是根据自己的心情进行选择的，这样就会造成用户自主选择歌曲的效率较低的问题，容易导致用户体验不佳，进而会降低用户的使用黏度。此外，用户在演唱完一首歌曲时，通常会发布至唱歌平台中以供其他用户分享，但是，唱歌平台中分享歌曲的用户众多，不同的用户分享的歌曲类型不同，例如，心情是开心的用户所发布的歌曲有可能也是开心类型的，而心情是悲伤的用户所发布的歌曲有可能是悲伤类型的，那么，开心类型的歌曲就不太容易受到悲伤类型的歌曲的发布用户的反馈和认同感，容易对用户体验造成不良的影响。

针对上述问题，申请人想到可以让用户选择与其心情相对应的歌曲类型，并基于该歌曲类型对用户进行歌曲推荐，在用户选择了歌曲并演唱完毕之后，可以将用户的演唱作品发布至该歌曲类型相对应的分区中。这样，一方面有利于提升用户选择歌曲的效率；另一方面有利于用户获得反馈以及认同感，进而可以改善用户的使用体验，提升用户的使用黏度。

应用场景总览

需要注意的是，下述应用场景仅是为了便于理解本申请的精神和原理而示出，本申请的实施方式在此方面不受任何限制。相反，本申请的实施方式可以应用于适用的任何场景。

本申请的实施例可以适用于向用户推荐与其所选择的音频类别相对应的音频文件，并将用户录入的多媒体信号与音频文件中的背景音频进行合成并上传至该音频文件相对应的音频类别分区；其中，音频文件可以为歌曲、有声小说、相声以及影视片段等。

一方面，音频类别可以用于代表用户心情(如，开心、伤心、郁闷、孤独或平静等)。当用户所选择的音频类别为开心时，可以选取开心这一音频类别下的热门歌曲推荐给用户，以使得用户可以在热门歌曲中选择想要演唱的歌曲(即，上述的目标音频文件)。进而，可以采集用户录入的多媒体信号(如，音频信号或视频信号)，将该多媒体信号与目标音频文件的伴奏部分进行合成，得到多媒体文件。进而，可以将该多媒体文件上传至开心这一音频类别对应的分区，分区内还包括其他用户端上传的用于代表用户心情“开心”的多媒体文件。可见，本申请实施例可以根据用户的心情向用户推荐歌曲并将用户演唱的歌曲发布至对应的心情分区，相较于现有技术中用户需要根据需求从曲库中选歌的方案，能够减少用户的操作负担，改善用户的使用体验，提升用户的使用黏度。

另一方面，音频类别还可以用于代表有声小说类型(如，悬疑、惊悚、爱情等)。当用户选择的音频类别为悬疑时，可以选取悬疑这一音频类别下的热门有声小说片段推荐给用户，以使得用户可以在热门有声小说片段中选择想要配音的片段(即，上述的目标音频文件)。进而，可以采集用户录入的多媒体信号(如，音频信号或视频信号)，将该多媒体信号与目标音频文件的背景音部分进行合成，得到多媒体文件。进而，可以将该多媒体文件上传至悬疑这一音频类别对应的分区，分区内还包括其他用户端上传的用于代表有声小说类型“悬疑”的多媒体文件。可见，本申请实施例可以根据用户所选的有声小说类型向其推荐相对应的有声小说片段，避免用户通过繁复的操作(如，上滑操作和/或下滑操作)之后才能从有声小说库中选取想要配音的片段，进而可以改善用户的使用体验，提升用户的使用黏度。此外，用户还可以基于本申请提供的技术方案进行有声小说朗诵学习，生成的多媒体文件可以作为用户的学习过程记录，不同的用户均可以在分区内观看其他用户的多媒体文件，以便用户之间的交流学习。

又一方面，音频类别还可以用于代表相声类型(如，单口相声、对口相声等)。当用户选择的音频类别为对口相声时，可以选取对口相声这一音频类别下的热门相声片段推荐给用户，以使得用户可以在热门相声片段中选择想要配音的片段(即，上述的目标音频文件)。进而，可以采集用户录入的多媒体信号(如，音频信号或视频信号)，将该多媒体信号与目标音频文件的背景音部分进行合成，得到多媒体文件；其中，若目标音频文件为单口相声，则背景音部分不包含人声；若目标音频文件为对口相声，则背景音部分包含捧哏音频或逗哏音频。进而，可以将该多媒体文件上传至对口相声这一音频类别对应的分区，分区内还包括其他用户端上传的用于代表相声类型“对口相声”的多媒体文件。可见，本申请实施例可以根据用户所选的相声片段类型向其推荐相对应的相声片段，避免用户通过重复多次上滑下滑操作从相声库中选取所需的相声片段，进而改善用户的使用体验，提升用户的使用黏度。此外，用户还可以通过本申请提供的技术方案从相对应的相声片段类型分区中观看其他用户的相声作品，有利于用户提升自己的相声水平。

再一方面，音频类别还可以用于代表影视片段类型(如，家庭剧、喜剧、情景剧等)。当用户选择的音频类别为情景剧时，可以选取情景剧这一音频类别下的热门情景剧片段推荐给用户，以使得用户可以在热门情景剧片段中选择想要配音的片段(即，上述的目标音频文件)。进而，可以采集用户录入的多媒体信号(如，音频信号或视频信号)，将该多媒体信号与目标音频文件的背景音部分进行合成，得到多媒体文件。进而，可以将该多媒体文件上传至情景剧这一音频类别对应的分区，分区内还包括其他用户端上传的用于代表影视片段类型“情景剧”的多媒体文件。可见，本申请实施例可以根据用户所选的影视片段类型向其推荐所需的情景剧片段，帮助用户可以更快地确定出想要配音的目标音频文件，改善用户的使用体验，提升用户的使用黏度。此外，用户还可以通过本申请提供的技术方案提升自己的配音水平。

示例性方法

下面结合上述的应用场景，参考图1～图16来描述根据本申请示例性实施方式的多媒体文件上传方法。

请参阅图1，图1示出的是根据本申请一示例实施方式的多媒体文件上传方法的流程示意图，该多媒体文件上传方法可以由服务器或终端设备来实现。

如图1所示，根据本申请的一个实施例的多媒体文件上传方法包括：

步骤S110：根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别。

步骤S120：从目标音频类别对应的音频库中选取待输出的音频文件，并根据用于表征音频文件选取的第二用户操作从待输出的音频文件中确定目标音频文件。

步骤S130：播放目标音频文件的伴奏部分并进行多媒体信号采集。

步骤S140：根据采集到的多媒体信号和伴奏部分生成多媒体文件，并将多媒体文件上传至目标音频类别对应的多媒体分区。

实施图1所示的多媒体文件上传方法，能够通过向用户推荐与其所选择的音频类型相对应的音频文件，简化用户在海量无序音频中选择所需音频的操作，这样可以有利于提升用户选择歌曲的效率，改善用户的使用体验，提升用户的使用黏度；特别地，当用户需要查找与当前时刻情景/场景/情绪/心境等即时需求相符合的歌曲时，实施本申请实施例可以帮助用户快速定位到所需歌曲，以降低用户的选歌难度，一定程度地提升用户的选歌效率，进而改善用户的使用体验。另一方面，实施本申请实施例还能够通过将目标音频文件上传至相对应的多媒体分区，提升目标音频文件获得的反馈数量，进而增加发布了相同音频类型的多媒体文件的用户之间的互动，改善用户的线上社交体验。

下面对这些步骤进行详细描述。

在步骤S110：根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别。

其中，多种音频类别分别用于代表不同的用户心情，多种音频类别包括开心、伤心、郁闷、孤独以及平静；此外，可选的，多种音频类别还可以用于代表不同的语种，多种音频类别包括中文、英文、日文、韩文等语种；此外，可选的，多种音频类别还可以用于代表不同的音乐类型，多种音频类别包括爵士、蓝调、乡村、摇滚等音乐类型。另外，上述的用于表征音频类别选取的第一用户操作可以为针对触摸屏的触控操作，也可以为语音输入操作，也可以为手势操作等，本申请实施例不作限定；同理，在本申请实施例中，用于触发多媒体信号采集功能启动的用户操作、用于表征音频文件选取的第二用户操作、用于指示播放完整歌曲的第三用户操作、用于表征信号采集方式选取的第四用户操作、摄像方式选择操作、用于触发美化功能启动的第五用户操作、用于表征重新采集所述多媒体信号的第六用户操作以及用户确认操作均适用于上述限定。

本申请实施例中，可选的，根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别，包括：

其中，当多种音频类别分别用于代表不同的用户心情时，待选标识符可以为表情图，不同的表情图可以代表不同的用户心情。此外，在另一种可选的实施例中，当检测到用户触发多媒体信号采集功能启动的用户操作时，可以采集用户输入的语音信号(如，我今天很开心)，并解析语音信号，得到与语音信号相匹配的文本信息(即，我今天很开心)。进一步地，从多种音频类别中确定与文本信息相匹配的目标音频类别的方式具体可以为：识别文本信息中的关键词(如，开心)并从多种音频类别中匹配与该关键词相对应的目标音频类别(如，开心类别)。

请参阅图2，图2示出的是根据本申请一示例实施方式的包括多个待选标识符的第一页面示意图。图2所示的页面可以为音乐心情日记页面，用于提供多种待选标识符，以使得用户根据自己的心情在该页面中选取相对应的音频类别，该音频类别可以用于代表不同的用户心情。在图2中，包括多个待选标识符的第一页面中包括分别用于表示开心、伤心、郁闷、孤独以及平静的五个待选标识符，需要说明的是，在实际应用中，该页面中还可以包括用于表示其他心情的待选标识符(如，悲伤)，针对页面中待选标识符的数量，本申请实施例不作限定。另外，图2中对于待选标识符的形状、颜色、尺寸、样式等参数仅为示例性示出，在实际应用中，上述参数可以作以其他调整。此外，在图2所示的页面中，还可以包括用于提示用户进行音频类别选取的提示信息(即，今天你的心情如何？)，以及，还可以包括时间信息(即，2月11日星期二)。当检测到用于触发多媒体信号采集功能启动的用户操作时，可以输出音乐心情日记页面，并在检测到用于表征音频类别选取的第一用户操作时，从分别用于表示开心、伤心、郁闷、孤独以及平静的五个待选标识符中选取与第一用户操作对应的目标标识符(如，开心)，将目标标识符对应的音频类别(如，开心类别)确定为目标音频类别。

可见，实施该可选的实施例，能够提供多种音频类别的选择功能，以使得用户能够根据需求进行相应的选择，进而有利于根据用户所选的目标音频类别(如，开心类别)向用户推荐符合用户即时需求的歌曲，以提升用户的选歌满意度，进而改善用户的使用体验。

在步骤S120：从目标音频类别对应的音频库中选取待输出的音频文件，并根据用于表征音频文件选取的第二用户操作从待输出的音频文件中确定目标音频文件。

其中，音频库中包括多种音频类别分别对应的音频文件，每种音频类别在音频库中可以对应一个或多个音频文件，音频文件可以为歌曲、有声小说、相声或影视片段等，本申请实施例不作限定。另外，待输出的音频文件属于目标音频类别，待输出的音频文件可以为一个或多个，本申请实施例不作限定。

本申请实施例中，可选的，从目标音频类别对应的音频库中选取待输出的音频文件，包括：

从音频库中确定与目标音频类别对应的所有音频文件；

从所有音频文件中选取调用频率高于预设频率(如，1000次/月)的预设数量(如，5)的音频文件，作为待输出的音频文件。

其中，调用频率用于表征音频文件在预设时间段内(如，一个月内)被调用的次数(如，500次)。此外，可选的，从所有音频文件中选取调用频率高于预设频率的预设数量的音频文件，作为待输出的音频文件的方式具体可以为：从所有音频文件中确定出调用频率高于预设频率的参考音频文件；若参考音频文件的数量大于预设数量，则按照调用频率由高到低的顺序选取前N个参考音频文件作为待输出的音频文件，其中，N为正整数；若参考音频文件的数量不大于预设数量，则将所有的参考音频文件确定为待输出的音频文件。另外，待输出的音频文件可以为热门歌曲。

可见，实施该可选的实施例，能够根据用户选取的目标音频类别向用户推荐相对应的热门歌曲，以便用户能够更快地确定出所需的目标音频文件(如，歌曲)，进而可以改善用户的使用体验。

本申请实施例中，可选的，从目标音频类别对应的音频库中选取待输出的音频文件之后，上述方法还可以包括以下步骤：

识别各待输出的音频文件分别对应的歌曲高潮片段；

其中，多个第一滑动窗口用于分别承载不同的待输出音频文件对应的歌曲高潮片段的歌词。此外，可选的，输出用于承载第一滑动窗口的第二页面的方式具体可以为：根据待输出的音频文件的调用频率对多个第一滑动窗口进行排序，将排序结果中第一顺序位(即，调用频率最高)的待输出音频文件对应的第一滑动窗口显示于第二页面。进一步地，当检测到页面切换操作时，根据页面切换操作控制第二页面中的第一滑动窗口进行滑动的方式具体可以为：若页面切换操作的滑动方向与排序结果的排序顺序一致，则根据页面切换操作控制第二页面中的第一滑动窗口进行滑动，以显示排序结果中第二顺序位(即，调用频率第二高)的待输出音频文件对应的第一滑动窗口；其中，页面切换操作可以为滑动操作，该滑动操作可以为由右向左的滑动操作，也可以为由左向右的滑动操作，本申请实施例不作限定。同理，当再次检测到页面切换操作时，若页面切换操作的滑动方向与排序结果的排序顺序一致，则可以根据页面切换操作控制第二页面中的第一滑动窗口进行滑动，以显示排序结果中第三顺序位(即，调用频率第三高)的待输出音频文件对应的第一滑动窗口；若页面切换操作的滑动方向与排序结果的排序顺序不一致，则可以根据页面切换操作控制第二页面中的第一滑动窗口进行滑动，以显示排序结果中第一顺序位(即，调用频率第三高)的待输出音频文件对应的第一滑动窗口。当第二页面中显示的是排序结果中最后顺序位的第一滑动窗口时，若检测到页面滑动操作，则输出音频搜索页面，该音频搜索页面用于提供音频搜索功能，音频搜索页面中可以包括关键词搜索窗口。

此外，可选的，识别各待输出的音频文件分别对应的歌曲高潮片段的方式具体可以为：检测是否存在与待输出的音频文件对应的歌曲高潮片段，如果存在，则调用，如果不存在，则对待输出的音频文件进行切分，根据切分结果的音乐重复度识别歌曲高潮片段。

此外，可选的，第二页面包括用于表征可以自定义演唱片段的可交互区域，上述方法还可以包括以下步骤：若检测到作用于该可交互区域的用户操作时，则将用户自定义操作对应的歌曲片段确定为目标音频文件。

请参阅图3，图3示出的是根据本申请一示例实施方式的用于承载第一滑动窗口的第二页面示意图。如图3所示，第二页面用于承载第一滑动窗口，第一滑动窗口中包括歌曲高潮片段的歌名(即，寄给你全宇宙的爱和太古)、演唱家(如，陈XX)、歌曲高潮片段的歌词(即，雨后有车驶来行驶过暮色苍白旧铁皮往南开恋人已不再收听浓烟下的诗歌电台)、用于表征可以自定义演唱片段的可交互区域以及可以用于表示开始演唱的可交互区域。此外，在第二页面中，还可以显示与待输出的音频文件对应的标识符，如，用于表示开心的标识符。

基于图3所示的第二页面示意图，请参阅图4，图4示出的是根据本申请一示例实施方式的页面切换操作示意图。如图4所示，页面切换操作可以为滑动操作，例如，当用户在触摸屏上由右向左进行滑动时，终端可以控制第二页面中的第一滑动窗口A和第一滑动窗口B进行滑动，以实现切歌的效果，具体地，可以由第一滑动窗口A中的歌曲高潮片段切换为第一滑动窗口B中的歌曲高潮片段；其中，第一滑动窗口A和第一滑动窗口B均属于上述的多个第一滑动窗口。此外，可选的，用户也可以在触摸屏上由左向右进行滑动，以使得终端控制第一滑动窗口A向右滑动。

可见，实施该可选的实施例，能够为用户展示所推荐的多首歌曲，并为用户提供滑动切歌的功能，用户可以通过滑动切歌从多首歌曲中选取想要演唱的歌曲，并且，每首歌曲对应的滑动窗口还可以为用户播放所推荐的歌曲的高潮片段以及显示高潮片段的歌词，以便用户对推荐的歌曲进行预览，相较于传统的用户通过翻阅曲库中的歌曲名进行选歌，本申请通过播放的高潮片段及其歌词能够为用户提供快速的试听服务，有利于用户选择出最满意的歌曲进行演唱，可以改善用户的使用体验，提升用户的使用黏度。

进一步可选的，输出用于承载第一滑动窗口的第二页面之后，上述方法还可以包括以下步骤：

其中，更新后的第一滑动窗口用于显示完整歌曲的歌词。

可见，实施该可选的实施例，能够为用户提供多种播放方式，用户可以根据使用习惯选择播放方式为高潮部分播放或完整歌曲播放，并在检测到第三用户操作时及时更新所显示的歌词，以使歌词与所播放的歌曲相对应，进而改善用户的使用体验。

进一步可选的，根据用于表征音频文件选取的第二用户操作从待输出的音频文件中确定目标音频文件，包括：

其中，作用于第一滑动窗口的第二用户操作具体包括：作用于第一滑动窗口中用于表示开始演唱的可交互区域的第二用户操作。

可见，实施该可选的实施例，能够将用户从推荐歌曲中选择的歌曲作为目标音频文件，有利于提升用户选择需要演唱的歌曲的效率，改善用户的使用体验。

在步骤S130：播放目标音频文件的伴奏部分并进行多媒体信号采集。

其中，多媒体信号可以为视频信号或音频信号。此外，在进行多媒体信号采集之前，上述方法还可以包括以下步骤：进行演唱倒计时显示。具体地，在进行多媒体信号采集之前，可以显示演唱倒计时的读秒标识符，该读秒标识符通过读秒的方式为用户显示距离开始进行多媒体信号采集的所剩时长。通过进行演唱倒计时显示能够便于用户在演唱之前进行准备工作，避免立即开始采集多媒体信号而用户还没有准备好的情况，进而改善用户的使用体验。

另外，需要说明的是，上述的“播放目标音频文件的伴奏部分”与“进行多媒体信号采集”可以同时执行，这样可以使得伴奏部分与录制的人声保持同步。

本申请实施例中，可选的，播放目标音频文件的伴奏部分并进行多媒体信号采集之前，上述方法还可以包括以下步骤：

根据用户选取操作从音频列表中确定出目标音频文件。

其中，音频列表可以包括一个或多个歌曲名，本申请实施例不作限定。

此外，可选的，输出与音频搜索操作对应的音频列表的方式具体可以为：确定音频搜索操作对应的搜索关键词，从曲库中匹配与搜索关键词相对应的歌曲名、演唱家姓名以及歌词，并按照歌曲名、演唱家姓名以及歌词所属的音频文件对应的调用热度对歌曲名进行由高到低排序，得到音频列表。进一步地，根据用户选取操作从音频列表中确定出目标音频文件的方式具体可以为：确定用户选取操作对应的歌曲名，并调用与该歌曲名相对应的音频文件。

请参阅图5，图5示出的是根据本申请一示例实施方式的音频搜索页面示意图。当未检测到第二用户操作而检测到音频搜索操作时，可以输出音频搜索页面，音频搜索页面中可以包括用于输入搜索关键词的可交互区域、用于提示用户输入搜索关键词的提示信息以及与待输出的音频文件对应的标识符。

基于图5所示的音频搜索页面示意图，请参阅图6，图6示出的是根据本申请一示例实施方式的音频列表示意图。当检测到用户输入的搜索关键词(即，隔壁)之后，可以从曲库中匹配与搜索关键词相对应的歌曲名(即，隔壁泰山)、演唱家姓名(即，隔壁XX)以及歌词(我好想你曾在我隔壁的班级，人们把难言的…)。进而，可以按照歌曲名、演唱家姓名以及歌词所属的音频文件对应的调用热度对歌曲名进行由高到低排序，得到音频列表。在音频列表中，还可以包括用于表示开始演唱的可交互区域，当用户操作作用于该可交互区域时，可以触发执行播放目标音频文件的伴奏部分的步骤。

可见，实施该可选的实施例，能够为用户提供音频搜索功能，当用户未在推荐的歌曲中找到所需的歌曲时，可以进行音频搜索，以确定出需要演唱的歌曲，因此，该音频搜索功能有利于改善用户的使用体验。

本申请实施例中，可选的，进行多媒体信号采集，包括：

根据采集方式采集多媒体信号；

请参阅图7，图7示出的是根据本申请一示例实施方式的多媒体信号的采集方式选取页面示意图。如图7所示，用户可以通过第四用户操作(如，滑动操作)选取多媒体信号的采集方式，在图7中，默认的多媒体信号的采集方式为拍视频，当检测到用户由右向左的滑动操作时，则可以将拍视频切换为录音频。此外，在采集方式选取页面中，还包括歌曲名、演唱家姓名、部分歌词、滤镜功能键以及摄像头翻转功能键。

可见，该可选的实施例，能够为用户提供多种多媒体信号采集方式，用户可以根据需求选择多媒体信号采集方式，进而可以改善用户的使用体验，提升用户的使用黏度。

进一步可选的，当采集方式为视频信号采集时，根据采集方式采集多媒体信号，包括：

其中，摄像方式选择操作可以作用于上述的摄像头翻转功能键，用于指示通过前置摄像头/后置摄像头采集视频信号。

可见，实施该可选的实施例，能够为用户提供翻转摄像头进行视频信号采集的功能，以改善用户的使用体验。

进一步可选的，控制与摄像方式选择操作对应的摄像头采集视频信号之后，上述方法还可以包括以下步骤：

其中，视频内容中可以包括人像。

请参阅图8，图8示出的是根据本申请一示例实施方式的美化功能的界面示意图。如图8所示，当检测到用户触发美化功能启动的第五用户操作时，可以输出美化功能对应的虚拟功能键，虚拟功能键可以包括美白功能键、磨皮功能键、瘦脸功能键、大眼功能键、滤镜功能键以及贴纸功能键等。在图8中，还示出了用于调整美化程度的进度条以及对于美化操作的重置功能，用户可以根据美化功能对应的虚拟功能键对视频内容进行美化。

可见，实施该可选的实施例，能够提供对于视频内容的美化功能，用户可以通过美化功能调整视频内容的美化程度，以达到满意的效果，因此，美化功能能够用于改善用户的使用体验。

本申请实施例中，可选的，播放目标音频文件的伴奏部分，包括：

其中，根据伴奏部分对应的播放进度同步更新目标音频文件的歌词的显示进度的方式具体可以为：根据伴奏部分对应的播放进度将当前演唱的歌词进行逐字高亮显示、逐字增大字号显示或逐字变更颜色显示；其中，当前演唱的歌词的显示方式可以为滚动显示。此外，可选的，上述方法还可以包括以下步骤：根据伴奏部分的播放进度显示演唱进度。举例来说，若伴奏部分对应的总时长为65s，则在伴奏部分开始播放时从0s开始显示计时，直到显示到65s时结束计时，并在结束计时的时候同步完成多媒体信号采集，这样可以使用户及时了解演唱进度，以便用户适时作出演唱调整。。

请参阅图9，图9示出的是根据本申请一示例实施方式的根据伴奏部分对应的播放进度同步更新目标音频文件的歌词的显示进度的界面示意图。如图9所示，当开始采集多媒体信号时，可以显示目标音频文件对应的歌词(即，雨后有车驶来行驶过暮色苍白旧铁皮往南开恋人已不再收听浓烟下的)，并根据伴奏部分对应的播放进度同步更新目标音频文件的歌词的显示进度。此外，在图9所示的界面示意图中，还包括歌曲名、演唱家姓名、演唱进度、开启原唱功能键以及重唱功能键。

可见，实施该可选的实施例，能够通过显示进度表示当前的演唱进度，并同步更新歌词，以便用户根据歌词进行演唱，进而改善用户的使用体验。

在步骤S140：根据采集到的多媒体信号和伴奏部分生成多媒体文件，并将多媒体文件上传至目标音频类别对应的多媒体分区。

其中，多个音频类别分别对应于一个多媒体分区，多媒体分区可以为分享社区，用于上传同一音频类别的多媒体文件以实现社区内的用户对分享的上述多媒体文件进行阅览、收听、评论等交互操作。

本申请实施例中，可选的，根据采集到的多媒体信号和伴奏部分生成多媒体文件，包括：

采集用户输入的发布语；

其中，发布语中可以包括中文、英文、符号以及表情等，本申请实施例不作限定。

请参阅图10，图10示出的是根据本申请一示例实施方式的发布语录入界面示意图。如图10所示，发布语可以为：今天走在大街上踩到一坨粑粑[开心表情]，我可能要发财了真开心呀！此外，在该发布语录入界面中，还可以包括用于表示完成日记的功能键，其中，日记可以理解为本申请中的发布语。另外，在该发布语录入界面中，还可以包括重唱功能键、当前日期、歌曲名、演唱家姓名、以及目标音频文件所属的音频类别的标签(如，开心)。

可见，实施该可选的实施例，能够根据用户输入的发布语生成多媒体文件，以便该多媒体文件发布后其他用户能够阅读该发布语，丰富了分享内容，改善了用户使用体验。

本申请实施例中，可选的，根据采集到的多媒体信号和伴奏部分生成多媒体文件之后，上述方法还可以包括以下步骤：

通过预览页面输出多媒体文件；

其中，第六用户操作可以作用于上述的重唱功能键。此外，在根据重新采集的结果更新多媒体文件之前，上述方法还可以包括以下步骤：存储更新前的多媒体文件。

可见，实施该可选的实施例，能够提供重唱功能，在用户对演唱结果不满意时可以通过重唱功能更新多媒体文件，因此，重唱功能可以改善用户的使用体验。

本申请实施例中，可选的，将多媒体文件上传至目标音频类别对应的多媒体分区，包括：

其中，用户确认操作可以作用于表示完成日记的功能键。

可见，实施该可选的实施例，能够通过将多媒体文件上传至对应的分区，使得相同心情的人可以分享演唱结果。

本申请实施例中，可选的，将多媒体文件上传至目标音频类别对应的多媒体分区之后，上述方法还可以包括以下步骤：

生成用于承载多媒体文件的第二滑动窗口；

其中，输出用于承载第二滑动窗口的第三页面之后，上述方法还可以包括以下步骤：播放多媒体文件。此外，可选的，上述方法还可以包括以下步骤：当检测到页面切换操作时，根据页面切换操作控制第三页面中的第二滑动窗口进行滑动。

请参阅图11，图11示出的是根据本申请一示例实施方式的用于承载第二滑动窗口的第三页面示意图。如图11所示，用户可以在第三页面中查看自己或他人的演唱作品，其中，第三页面可以包括第二滑动窗口，第二滑动窗口用于承载上述的演唱作品，并实现播放功能。另外，在第三页面中，还包括演唱作品(即，多媒体文件)对应的用户名、用户头像、发布时间、歌曲名、播放量、当前日期、多媒体文件对应的音频类别(如，悲伤)、点赞功能键、评论功能键以及演唱功能键。

可见，实施该可选的实施例，能够通过多媒体分区提供分享社区，使得同一心情的用户可以分享演唱作品，用以改善用户的使用体验。

进一步可选的，将多媒体文件上传至目标音频类别对应的多媒体分区之后，上述方法还可以包括以下步骤：

请参阅图12，图12示出的是根据本申请一示例实施方式的历史记录界面示意图。如图12所示，历史记录界面可以通过“我的心情日记”进行命名，其中包括了按照时间存储的用户的所有多媒体文件，其中，所有多媒体文件的展示形式为封面。

可见，实施该可选的实施例，能够将多媒体文件进行存储，以便用户在查看历史记录时可以根据录制时间快速定位到所需的多媒体文件，改善用户的使用体验，提升用户的使用黏度。

进一步可选的，将多媒体文件存储至用户对应的历史记录中之后，上述方法还可以包括以下步骤：

若检测到预设周期(如，七天)内存在满足预设条件的待合成多媒体文件，则将待合成多媒体文件进行合成并存储合成结果。

其中，预设条件可以包括：属于同一演唱家且满足预设数量条件(如，3个)，或属于同一音频类别且满足预设数量条件。此外，将待合成多媒体文件进行合成的方式具体可以为：将待合成多媒体文件按照时间顺序进行依次拼接，得到合成结果。此外，在得到合成结果之后，上述方法还可以包括以下步骤：根据待合成多媒体文件所对应的音频类别生成多媒体文件合集名称(如，悲伤心情合集)；或者，根据待合成多媒体文件所对应的演唱家生成多媒体文件合集名称(如，【歌手名】歌曲心情合集)。

请参阅图13，图13示出的是根据本申请一示例实施方式的合成结果示意图。如图13所示，用户可以预览该合成结果，合成结果中包括名称(即，12月的孤单心情)、播放进度条、点赞功能键以及评论功能键。

可见，实施该可选的实施例，能够针对同一心情的演唱作品进行合成，为用户提供更为丰富的使用体验。

进一步可选的，将待合成多媒体文件进行合成并存储合成结果之后，上述方法还可以包括以下步骤：

输出用于提示用户查看合成结果的提示信息。

请参阅图14和图15，图14示出的是根据本申请一示例实施方式的用于提示用户查看合成结果的提示信息的用户界面示意图，图15示出的是根据本申请另一示例实施方式的用于提示用户查看合成结果的提示信息的用户界面示意图。

如图14所示，在将待合成多媒体文件进行合成并得到合成结果之后，可以在消息界面的私信区域向用户推送提示信息，提示信息可以包括提示标题(即，音乐心情日记)和提示内容(即，系统为你生成了【合集名称】～快去看看)。如图15所示，当用户点击了消息界面中的提示信息，则可以在音乐心情日记中显示完整的提示消息，完整的提示消息还包括了消息推送时间。

可见，实施该可选的实施例，能够在将待合成多媒体文件进行合成之后向用户推送提示信息，以提醒用户查看合成结果，进而改善用户的使用体验，提升用户的使用黏度。

请参阅图16，图16示出的是根据本申请另一示例实施方式的多媒体文件上传方法的流程示意图。如图16所示，另一示例实施方式的多媒体文件上传方法包括：步骤S1600～步骤S1636，其中：

步骤S1600：当检测到用于触发多媒体信号采集功能启动的用户操作时，输出包括多个待选标识符的第一页面；当检测到用于表征音频类别选取的第一用户操作时，从多个待选标识符中选取与第一用户操作对应的目标标识符；将目标标识符对应的音频类别确定为目标音频类别；其中，多个待选标识符分别用于表示不同的音频类别。进而执行步骤S1604。

步骤S1602：当检测到用于触发多媒体信号采集功能启动的用户操作时，采集用户输入的语音信号；解析语音信号，得到与语音信号对应的文本信息；从多种音频类别中确定与文本信息相匹配的目标音频类别。进而执行步骤S1604。

步骤S1604：从音频库中确定与目标音频类别对应的所有音频文件，从所有音频文件中选取调用频率高于预设频率的预设数量的音频文件，作为待输出的音频文件。

步骤S1606：识别各待输出的音频文件分别对应的歌曲高潮片段，生成用于承载各歌曲高潮片段对应的歌词的多个第一滑动窗口，输出用于承载第一滑动窗口的第二页面；若未检测到用于指示播放完整歌曲的第三用户操作，则执行步骤S1608；若检测到第三用户操作，则执行步骤S1610。

步骤S1608：播放第一滑动窗口对应的歌曲高潮片段。并执行步骤S1612。

步骤S1610：将第一滑动窗口中的歌曲高潮片段的歌词更新为完整歌曲的歌词并播放完整歌曲；其中，待输出的音频文件与完整歌曲相对应。并执行步骤S1612。

步骤S1612：当检测到页面切换操作时，根据页面切换操作控制第二页面中的第一滑动窗口进行滑动；若检测到第二用户操作，则执行步骤S1614；若未检测到第二用户操作而检测到音频搜索操作，则执行步骤S1616。

步骤S1614：根据作用于第一滑动窗口的第二用户操作从待输出的音频文件中确定目标音频文件；其中，第二用户操作用于表征音频文件选取。

步骤S1616：输出与音频搜索操作对应的音频列表；根据用户选取操作从音频列表中确定出目标音频文件。

步骤S1618：显示目标音频文件对应的歌词，并根据伴奏部分对应的播放进度同步更新目标音频文件的歌词的显示进度；其中，显示的目标音频文件对应的歌词为歌曲高潮片段的歌词或完整歌曲的歌词。

步骤S1620：根据检测到的用于表征信号采集方式选取的第四用户操作确定多媒体信号的采集方式；其中，采集方式包括音频信号采集和视频信号采集；根据采集方式采集多媒体信号；若采集方式为视频信号采集，则执行步骤S1622；若采集方式为音频信号采集，则执行步骤S1626。

步骤S1622：控制与摄像方式选择操作对应的摄像头采集视频信号；其中，第一滑动窗口还用于承载视频信号对应的视频内容。

步骤S1624：根据用于触发美化功能启动的第五用户操作对视频信号对应的视频内容进行美化。

步骤S1626：采集用户输入的发布语，根据采集到的多媒体信号、伴奏部分和发布语生成多媒体文件，通过预览页面输出多媒体文件；在检测到用于表征重新采集多媒体信号的第六用户操作时，响应第六用户操作并根据重新采集的结果更新多媒体文件。

步骤S1628：根据检测到的用户确认操作将多媒体文件上传至目标音频类别对应的多媒体分区。

步骤S1630：生成用于承载多媒体文件的第二滑动窗口；输出用于承载第二滑动窗口的第三页面；第三页面用于承载第二滑动窗口以及承载目标音频类别对应的其他多媒体文件的滑动窗口，第三页面用于表征目标音频类别对应的多媒体分区。

步骤S1632：将多媒体文件存储至用户对应的历史记录中，历史记录中包括按照时间顺序存储的用户的所有多媒体文件。

步骤S1634：若检测到预设周期内存在满足预设条件的待合成多媒体文件，则将待合成多媒体文件进行合成并存储合成结果。

步骤S1636：输出用于提示用户查看合成结果的提示信息。

需要说明的是，步骤S1600～步骤S1636与图1所示的各步骤及其实施例相对应，针对步骤S1600～步骤S1636的具体实施方式，请参阅图1所示的各步骤及其实施例，此处不再赘述。

可见，实施图16所示的多媒体文件上传方法，能够通过向用户推荐与其所选择的音频类型相对应的音频文件，简化用户在海量无序音频中选择所需音频的操作，这样可以有利于提升用户选择歌曲的效率，改善用户的使用体验，提升用户的使用黏度；特别地，当用户需要查找与当前时刻情景/场景/情绪/心境等即时需求相符合的歌曲时，实施本申请实施例可以帮助用户快速定位到所需歌曲，以降低用户的选歌难度，一定程度地提升用户的选歌效率，进而改善用户的使用体验。另一方面，实施本申请实施例还能够通过将目标音频文件上传至相对应的多媒体分区，提升目标音频文件获得的反馈数量，进而增加发布了相同音频类型的多媒体文件的用户之间的互动，改善用户的线上社交体验。

此外，尽管在附图中以特定顺序描述了本申请中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

示例性介质

在介绍了本申请示例性实施方式的方法之后，接下来，对本申请示例性实施方式的介质进行说明。

在一些可能的实施方式中，本申请的各个方面还可以实现为一种介质，其上存储有程序代码，当程序代码被设备的处理器执行时用于实现本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的多媒体文件上传方法中的步骤。

具体地，所述设备的处理器执行所述程序代码时用于实现如下步骤：根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别；从目标音频类别对应的音频库中选取待输出的音频文件，并根据用于表征音频文件选取的第二用户操作从待输出的音频文件中确定目标音频文件；播放目标音频文件的伴奏部分并进行多媒体信号采集；根据采集到的多媒体信号和伴奏部分生成多媒体文件，并将多媒体文件上传至目标音频类别对应的多媒体分区。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：当检测到用于触发多媒体信号采集功能启动的用户操作时，输出包括多个待选标识符的第一页面；当检测到用于表征音频类别选取的第一用户操作时，从多个待选标识符中选取与第一用户操作对应的目标标识符；将目标标识符对应的音频类别确定为目标音频类别；其中，多个待选标识符分别用于表示不同的音频类别；或者，

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：从音频库中确定与目标音频类别对应的所有音频文件；从所有音频文件中选取调用频率高于预设频率的预设数量的音频文件，作为待输出的音频文件。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：识别各待输出的音频文件分别对应的歌曲高潮片段；生成用于承载各歌曲高潮片段对应的歌词的多个第一滑动窗口；输出用于承载第一滑动窗口的第二页面并播放第一滑动窗口对应的歌曲高潮片段；当检测到页面切换操作时，根据页面切换操作控制第二页面中的第一滑动窗口进行滑动。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：若未检测到用于指示播放完整歌曲的第三用户操作，则执行播放第一滑动窗口对应的歌曲高潮片段；若检测到第三用户操作，则将第一滑动窗口中的歌曲高潮片段的歌词更新为完整歌曲的歌词并播放完整歌曲；其中，待输出的音频文件与完整歌曲相对应。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：根据作用于第一滑动窗口的第二用户操作从待输出的音频文件中确定目标音频文件；其中，第二用户操作用于表征音频文件选取。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：当未检测到第二用户操作而检测到音频搜索操作时，输出与音频搜索操作对应的音频列表；根据用户选取操作从音频列表中确定出目标音频文件。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：显示目标音频文件对应的歌词，并根据伴奏部分对应的播放进度同步更新目标音频文件的歌词的显示进度；其中，显示的目标音频文件对应的歌词为歌曲高潮片段的歌词或完整歌曲的歌词。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：根据检测到的用于表征信号采集方式选取的第四用户操作确定多媒体信号的采集方式；其中，采集方式包括音频信号采集和视频信号采集；根据采集方式采集多媒体信号；其中，当采集方式为音频信号采集时，多媒体信号为音频信号；当采集方式为视频信号采集时，多媒体信号为视频信号。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：控制与摄像方式选择操作对应的摄像头采集视频信号；其中，第一滑动窗口还用于承载视频信号对应的视频内容。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：根据用于触发美化功能启动的第五用户操作对视频信号对应的视频内容进行美化。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：采集用户输入的发布语；根据采集到的多媒体信号、伴奏部分和发布语生成多媒体文件。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：通过预览页面输出多媒体文件；在检测到用于表征重新采集多媒体信号的第六用户操作时，响应第六用户操作并根据重新采集的结果更新多媒体文件。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：根据检测到的用户确认操作将多媒体文件上传至目标音频类别对应的多媒体分区。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：生成用于承载多媒体文件的第二滑动窗口；输出用于承载第二滑动窗口的第三页面；第三页面用于承载第二滑动窗口以及承载目标音频类别对应的其他多媒体文件的滑动窗口，第三页面用于表征目标音频类别对应的多媒体分区。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：将多媒体文件存储至用户对应的历史记录中，历史记录中包括按照时间顺序存储的用户的所有多媒体文件。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：若检测到预设周期内存在满足预设条件的待合成多媒体文件，则将待合成多媒体文件进行合成并存储合成结果。

在本申请的一些实施方式中，所述设备的处理器执行所述程序代码时还用于实现如下步骤：输出用于提示用户查看合成结果的提示信息。

需要说明的是：上述的介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于：电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于：电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线、光缆、RF等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

示例性装置

在介绍了本申请示例性实施方式的介质之后，接下来，参考图17对本申请示例性实施方式的多媒体文件上传装置进行说明。

请参阅图17，图17示出的是根据本申请一示例实施方式的多媒体文件上传装置的结构框图。如图17所示，本申请一示例实施方式的多媒体文件上传装置包括：音频类别确定单元1701、音频文件选取单元1702、音频文件确定单元1703、音频文件播放单元1704、多媒体信号采集单元1705、多媒体文件生成单元1706以及多媒体文件上传单元1707，其中：

音频类别确定单元1701，用于根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别；

音频文件选取单元1702，用于从目标音频类别对应的音频库中选取待输出的音频文件；

音频文件确定单元1703，用于根据用于表征音频文件选取的第二用户操作从待输出的音频文件中确定目标音频文件；

音频文件播放单元1704，用于播放目标音频文件的伴奏部分；

多媒体信号采集单元1705，用于进行多媒体信号采集；

多媒体文件生成单元1706，用于根据采集到的多媒体信号和伴奏部分生成多媒体文件；

多媒体文件上传单元1707，用于将多媒体文件上传至目标音频类别对应的多媒体分区。

其中，多种音频类别分别用于代表不同的用户心情，多种音频类别包括开心、伤心、郁闷、孤独以及平静。

可见，实施图17所示的多媒体文件上传装置，能够通过向用户推荐与其所选择的音频类型相对应的音频文件，简化用户在海量无序音频中选择所需音频的操作，这样可以有利于提升用户选择歌曲的效率，改善用户的使用体验，提升用户的使用黏度；特别地，当用户需要查找与当前时刻情景/场景/情绪/心境等即时需求相符合的歌曲时，实施本申请实施例可以帮助用户快速定位到所需歌曲，以降低用户的选歌难度，一定程度地提升用户的选歌效率，进而改善用户的使用体验。另一方面，实施本申请实施例还能够通过将目标音频文件上传至相对应的多媒体分区，提升目标音频文件获得的反馈数量，进而增加发布了相同音频类型的多媒体文件的用户之间的互动，改善用户的线上社交体验。

作为一种可选的实施方式，音频类别确定单元1701根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别，包括：

音频类别确定单元1701当检测到用于触发多媒体信号采集功能启动的用户操作时，输出包括多个待选标识符的第一页面；当检测到用于表征音频类别选取的第一用户操作时，从多个待选标识符中选取与第一用户操作对应的目标标识符；将目标标识符对应的音频类别确定为目标音频类别；其中，多个待选标识符分别用于表示不同的音频类别；或者，

音频类别确定单元1701当检测到用于触发多媒体信号采集功能启动的用户操作时，采集用户输入的语音信号；解析语音信号，得到与语音信号对应的文本信息；从多种音频类别中确定与文本信息相匹配的目标音频类别。

可见，实施该可选的实施方式，能够提供多种音频类别的选择功能，以使得用户能够根据需求进行相应的选择，进而有利于根据用户所选的目标音频类别(如，开心类别)向用户推荐符合用户即时需求的歌曲，以提升用户的选歌满意度，进而改善用户的使用体验。

作为一种可选的实施方式，音频文件选取单元1702从目标音频类别对应的音频库中选取待输出的音频文件，包括：

音频文件选取单元1702从音频库中确定与目标音频类别对应的所有音频文件；

音频文件选取单元1702从所有音频文件中选取调用频率高于预设频率的预设数量的音频文件，作为待输出的音频文件。

可见，实施该可选的实施方式，能够根据用户选取的目标音频类别向用户推荐相对应的热门歌曲，以便用户能够更快地确定出所需的目标音频文件(如，歌曲)，进而可以改善用户的使用体验。

作为一种可选的实施方式，上述装置还可以包括：

音频片段识别单元(未图示)，用于在音频文件选取单元1702从目标音频类别对应的音频库中选取待输出的音频文件之后，识别各待输出的音频文件分别对应的歌曲高潮片段；

滑动窗口生成单元(未图示)，用于生成用于承载各歌曲高潮片段对应的歌词的多个第一滑动窗口；

页面输出单元(未图示)，用于输出用于承载第一滑动窗口的第二页面并播放第一滑动窗口对应的歌曲高潮片段；

滑动窗口控制单元(未图示)，用于当检测到页面切换操作时，根据页面切换操作控制第二页面中的第一滑动窗口进行滑动。

可见，实施该可选的实施方式，能够为用户展示所推荐的多首歌曲，并为用户提供滑动切歌的功能，用户可以通过滑动切歌从多首歌曲中选取想要演唱的歌曲，并且，每首歌曲对应的滑动窗口还可以为用户播放所推荐的歌曲的高潮片段以及显示高潮片段的歌词，以便用户对推荐的歌曲进行预览，相较于传统的用户通过翻阅曲库中的歌曲名进行选歌，本申请通过播放的高潮片段及其歌词能够为用户提供快速的试听服务，有利于用户选择出最满意的歌曲进行演唱，可以改善用户的使用体验，提升用户的使用黏度。

作为一种可选的实施方式，页面输出单元，具体用于在输出用于承载第一滑动窗口的第二页面之后，若未检测到用于指示播放完整歌曲的第三用户操作，则播放第一滑动窗口对应的歌曲高潮片段；

上述装置还可以包括：

歌词更新单元(未图示)，用于在检测到第三用户操作时，将第一滑动窗口中的歌曲高潮片段的歌词更新为完整歌曲的歌词并播放完整歌曲；其中，待输出的音频文件与完整歌曲相对应。

其中，更新后的第一滑动窗口用于显示完整歌曲的歌词。

可见，实施该可选的实施方式，能够为用户提供多种播放方式，用户可以根据使用习惯选择播放方式为高潮部分播放或完整歌曲播放，并在检测到第三用户操作时及时更新所显示的歌词，以使歌词与所播放的歌曲相对应，进而改善用户的使用体验。

作为一种可选的实施方式，音频文件确定单元1703根据用于表征音频文件选取的第二用户操作从待输出的音频文件中确定目标音频文件，包括：

音频文件确定单元1703根据作用于第一滑动窗口的第二用户操作从待输出的音频文件中确定目标音频文件；其中，第二用户操作用于表征音频文件选取。

可见，实施该可选的实施方式，能够将用户从推荐歌曲中选择的歌曲作为目标音频文件，有利于提升用户选择需要演唱的歌曲的效率，改善用户的使用体验。

作为一种可选的实施方式，上述装置还可以包括：

音频列表输出单元(未图示)，用于在音频文件播放单元1704播放目标音频文件的伴奏部分并进行多媒体信号采集之前，且当未检测到第二用户操作而检测到音频搜索操作时，输出与音频搜索操作对应的音频列表；

音频文件确定单元1703，还用于根据用户选取操作从音频列表中确定出目标音频文件。

可见，实施该可选的实施方式，能够为用户提供音频搜索功能，当用户未在推荐的歌曲中找到所需的歌曲时，可以进行音频搜索，以确定出需要演唱的歌曲，因此，该音频搜索功能有利于改善用户的使用体验。

作为一种可选的实施方式，音频文件播放单元1704播放目标音频文件的伴奏部分，包括：

音频文件播放单元1704显示目标音频文件对应的歌词，并根据伴奏部分对应的播放进度同步更新目标音频文件的歌词的显示进度；其中，显示的目标音频文件对应的歌词为歌曲高潮片段的歌词或完整歌曲的歌词。

可见，实施该可选的实施方式，能够通过显示进度表示当前的演唱进度，并同步更新歌词，以便用户根据歌词进行演唱，进而改善用户的使用体验。

作为一种可选的实施方式，多媒体信号采集单元1705进行多媒体信号采集，包括：

多媒体信号采集单元1705根据检测到的用于表征信号采集方式选取的第四用户操作确定多媒体信号的采集方式；其中，采集方式包括音频信号采集和视频信号采集；

多媒体信号采集单元1705根据采集方式采集多媒体信号；

可见，实施该可选的实施方式，能够为用户提供多种多媒体信号采集方式，用户可以根据需求选择多媒体信号采集方式，进而可以改善用户的使用体验，提升用户的使用黏度。

作为一种可选的实施方式，当采集方式为视频信号采集时，多媒体信号采集单元1705根据采集方式采集多媒体信号，包括：

多媒体信号采集单元1705控制与摄像方式选择操作对应的摄像头采集视频信号；其中，第一滑动窗口还用于承载视频信号对应的视频内容。

可见，实施该可选的实施方式，能够为用户提供翻转摄像头进行视频信号采集的功能，以改善用户的使用体验。

作为一种可选的实施方式，上述装置还可以包括：

视频内容美化单元(未图示)，用于在多媒体信号采集单元1705控制与摄像方式选择操作对应的摄像头采集视频信号之后，根据用于触发美化功能启动的第五用户操作对视频信号对应的视频内容进行美化。

可见，实施该可选的实施方式，能够提供对于视频内容的美化功能，用户可以通过美化功能调整视频内容的美化程度，以达到满意的效果，因此，美化功能能够用于改善用户的使用体验。

作为一种可选的实施方式，多媒体文件生成单元1706根据采集到的多媒体信号和伴奏部分生成多媒体文件，包括：

多媒体文件生成单元1706采集用户输入的发布语；

多媒体文件生成单元1706根据采集到的多媒体信号、伴奏部分和发布语生成多媒体文件。

可见，实施该可选的实施方式，能够根据用户输入的发布语生成多媒体文件，以便该多媒体文件发布后其他用户能够阅读该发布语，丰富了分享内容，改善了用户使用体验。

作为一种可选的实施方式，上述装置还可以包括：

多媒体文件输出单元(未图示)，用于在多媒体文件生成单元1706根据采集到的多媒体信号和伴奏部分生成多媒体文件之后，通过预览页面输出多媒体文件；

多媒体文件更新单元(未图示)，用于在检测到用于表征重新采集多媒体信号的第六用户操作时，响应第六用户操作并根据重新采集的结果更新多媒体文件。

可见，实施该可选的实施方式，能够提供重唱功能，在用户对演唱结果不满意时可以通过重唱功能更新多媒体文件，因此，重唱功能可以改善用户的使用体验。

作为一种可选的实施方式，多媒体文件上传单元1707将多媒体文件上传至目标音频类别对应的多媒体分区，包括：

多媒体文件上传单元1707根据检测到的用户确认操作将多媒体文件上传至目标音频类别对应的多媒体分区。

可见，实施该可选的实施方式，能够通过将多媒体文件上传至对应的分区，使得相同心情的人可以分享演唱结果。

作为一种可选的实施方式，滑动窗口生成单元，还用于在多媒体文件上传单元1707将多媒体文件上传至目标音频类别对应的多媒体分区之后，生成用于承载多媒体文件的第二滑动窗口；

可见，实施该可选的实施方式，能够通过多媒体分区提供分享社区，使得同一心情的用户可以分享演唱作品，用以改善用户的使用体验。

作为一种可选的实施方式，上述装置还可以包括：

多媒体文件存储单元(未图示)，用于多媒体文件上传单元1707将多媒体文件上传至目标音频类别对应的多媒体分区之后，在将多媒体文件存储至用户对应的历史记录中，历史记录中包括按照时间顺序存储的用户的所有多媒体文件。

可见，实施该可选的实施方式，能够将多媒体文件进行存储，以便用户在查看历史记录时可以根据录制时间快速定位到所需的多媒体文件，改善用户的使用体验，提升用户的使用黏度。

作为一种可选的实施方式，上述装置还可以包括：

多媒体文件合成单元(未图示)，用于在多媒体文件存储单元将多媒体文件存储至用户对应的历史记录中之后，若检测到预设周期内存在满足预设条件的待合成多媒体文件，则将待合成多媒体文件进行合成并存储合成结果。

其中，预设条件可以包括：属于同一演唱家且满足预设数量条件，或属于同一音频类别且满足预设数量条件。

可见，实施该可选的实施方式，能够针对同一心情的演唱作品进行合成，为用户提供更为丰富的使用体验。

作为一种可选的实施方式，上述装置还可以包括：

可见，实施该可选的实施方式，能够在将待合成多媒体文件进行合成之后向用户推送提示信息，以提醒用户查看合成结果，进而改善用户的使用体验，提升用户的使用黏度。

应当注意，尽管在上文详细描述中提及了多媒体文件上传装置的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

示例性电子设备

在介绍了本申请示例性实施方式的方法、介质和装置之后，接下来，介绍根据本申请的另一示例性实施方式的电子设备。

所属技术领域的技术人员能够理解，本申请的各个方面可以实现为系统、方法或程序产品。因此，本申请的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

下面参照图18来描述根据本申请的又一可选示例实施方式的多媒体文件上传装置1800。图18显示的多媒体文件上传装置1800仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图18所示，多媒体文件上传装置1800以电子设备的形式表现。多媒体文件上传装置1800的组件可以包括但不限于：上述至少一个处理单元1810、上述至少一个存储单元1820、连接不同系统组件(包括存储单元1820和处理单元1810)的总线1830。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元1810执行，使得所述处理单元1810执行本说明书上述示例性方法的描述部分中描述的根据本申请各种示例性实施方式的步骤。例如，所述处理单元1810可以执行如图1和图16中所示的各个步骤。

存储单元1820可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)18201和/或高速缓存存储单元18202，还可以进一步包括只读存储单元(ROM)18203。

存储单元1820还可以包括具有一组(至少一个)程序模块18205的程序/实用工具18204，这样的程序模块18205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线1830可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

多媒体文件上传装置1800也可以与一个或多个外部设备1900(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与多媒体文件上传装置1800交互的设备通信，和/或与使得该多媒体文件上传装置1800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1850进行。并且，多媒体文件上传装置1800还可以通过网络适配器1860与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图12所示，网络适配器1860通过总线1830与多媒体文件上传装置1800的其它模块通信。应当明白，尽管图中未示出，可以结合多媒体文件上传装置1800使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本申请实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本申请实施方式的方法。

虽然已经参考若干具体实施方式描述了本申请的精神和原理，但是应该理解，本申请并不限于所发明的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本申请旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims

1.一种多媒体文件上传方法，其特征在于，包括：

从所述目标音频类别对应的音频库中选取待输出的音频文件，并根据用于表征音频文件选取的第二用户操作从所述待输出的音频文件中确定目标音频文件；

播放所述目标音频文件的伴奏部分并进行多媒体信号采集；

根据采集到的多媒体信号和所述伴奏部分生成多媒体文件，并将所述多媒体文件上传至所述目标音频类别对应的多媒体分区。

2.根据权利要求1所述的方法，其特征在于，根据用于表征音频类别选取的第一用户操作从多种音频类别中确定目标音频类别，包括：

当检测到用于触发多媒体信号采集功能启动的用户操作时，输出包括多个待选标识符的第一页面；当检测到用于表征音频类别选取的第一用户操作时，从所述多个待选标识符中选取与所述第一用户操作对应的目标标识符；将所述目标标识符对应的音频类别确定为目标音频类别；其中，所述多个待选标识符分别用于表示不同的音频类别；或者，

当检测到用于触发多媒体信号采集功能启动的用户操作时，采集用户输入的语音信号；解析所述语音信号，得到与所述语音信号对应的文本信息；从所述多种音频类别中确定与所述文本信息相匹配的目标音频类别。

3.根据权利要求1所述的方法，其特征在于，所述多种音频类别分别用于代表不同的用户心情，所述多种音频类别包括开心、伤心、郁闷、孤独以及平静。

4.根据权利要求1所述的方法，其特征在于，从所述目标音频类别对应的音频库中选取待输出的音频文件，包括：

从所述音频库中确定与所述目标音频类别对应的所有音频文件；

从所述所有音频文件中选取调用频率高于预设频率的预设数量的音频文件，作为待输出的音频文件。

5.根据权利要求1所述的方法，其特征在于，从所述目标音频类别对应的音频库中选取待输出的音频文件之后，所述方法还包括：

识别各所述待输出的音频文件分别对应的歌曲高潮片段；

生成用于承载各所述歌曲高潮片段对应的歌词的多个第一滑动窗口；

输出用于承载所述第一滑动窗口的第二页面并播放所述第一滑动窗口对应的歌曲高潮片段；

当检测到页面切换操作时，根据所述页面切换操作控制所述第二页面中的所述第一滑动窗口进行滑动。

6.根据权利要求5所述的方法，其特征在于，输出用于承载所述第一滑动窗口的第二页面之后，所述方法还包括：

若未检测到用于指示播放完整歌曲的第三用户操作，则执行所述播放所述第一滑动窗口对应的歌曲高潮片段；

若检测到所述第三用户操作，则将所述第一滑动窗口中的所述歌曲高潮片段的歌词更新为完整歌曲的歌词并播放所述完整歌曲；其中，所述待输出的音频文件与所述完整歌曲相对应。

7.根据权利要求5所述的方法，其特征在于，根据用于表征音频文件选取的第二用户操作从所述待输出的音频文件中确定目标音频文件，包括：

根据作用于所述第一滑动窗口的第二用户操作从所述待输出的音频文件中确定目标音频文件；其中，所述第二用户操作用于表征音频文件选取。

8.一种多媒体文件上传装置，其特征在于，包括：

音频文件选取单元，用于从所述目标音频类别对应的音频库中选取待输出的音频文件；

音频文件确定单元，用于根据用于表征音频文件选取的第二用户操作从所述待输出的音频文件中确定目标音频文件；

音频文件播放单元，用于播放所述目标音频文件的伴奏部分；

多媒体信号采集单元，用于进行多媒体信号采集；

多媒体文件生成单元，用于根据采集到的多媒体信号和所述伴奏部分生成多媒体文件；

多媒体文件上传单元，用于将所述多媒体文件上传至所述目标音频类别对应的多媒体分区。

9.一种电子设备，其特征在于，包括：

处理器；以及

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现如权利要求1至7中任一项所述的多媒体文件上传方法。

10.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的多媒体文件上传方法。