CN105187936A

CN105187936A - 基于演唱音频评分的多媒体文件播放方法和装置

Info

Publication number: CN105187936A
Application number: CN201510326145.5A
Authority: CN
Inventors: 陈勇; 林剑宇
Original assignee: Fujian Star Net eVideo Information Systems Co Ltd
Current assignee: Fujian Star Net eVideo Information Systems Co Ltd
Priority date: 2015-06-15
Filing date: 2015-06-15
Publication date: 2015-12-23
Anticipated expiration: 2035-06-15
Also published as: WO2016201959A1; CN105187936B

Abstract

为实现更灵活、用户体验更佳的多媒体互动，发明人提供了一种基于演唱音频评分的多媒体文件播放方法，包括步骤：对第一视频文件进行分段，第一视频文件包含第一视频信息与第二音频信息；播放第一视频文件；获取演唱音频信号段落并对所述演唱音频信号段落进行评分，所述演唱音频信号段落与第一视频文件分段后得到的各段落在时间上相对应；根据评分结果在预设的视频库中选择一视频文件作为第二视频文件，在播放第一视频文件中的下一段落时，播放第二视频文件。发明人同时披露了实现上述方法的装置，可基于用户的演唱情况选择以及更改显示模块中的背景视频内容，以此提升演唱过程的互动娱乐性，提供用户以更有趣的演唱互动体验。

Description

基于演唱音频评分的多媒体文件播放方法和装置

技术领域

本发明涉及多媒体技术领域，特别涉及一种基于演唱音频评分的多媒体文件播放方法和装置。

背景技术

在以KTV、家庭演唱视听系统等为典型的应用场景，现有的实时演唱打分系统一般由音频采集模块实现实时采集演唱录音，然后通过音频分析、对比标准演唱信息，确定演唱正确与否，并依此打分，给出演唱得分，显示在显示模块上。同时，也会在显示模块上展示当前歌曲歌词、视频背景、五线谱标记的歌曲旋律等交互信息。然而，随着用户对用户体验提升的需求日渐增加，现有技术逐渐显露出如下不足：第一，现有的演唱系统，显示模块上的背景视频与用户当前演唱情况无关，也就是占据显示模块较大面积的背景视频对于人机交互几乎没有贡献；第二，现有的演唱系统，在显示模块上的交互大多采用贴图、动画的方式展现交互信息，例如，在演唱过程中只能发送掌声、口哨声、鬼脸等音频或图片到演唱显示屏上，系统资源占用高，表现方式单一，不够灵活。

发明内容

为此，需要提供一种基于演唱音频评分的多媒体文件播放方法和装置。

为实现上述目的，发明人提供了一种基于演唱音频评分的多媒体文件播放方法，包括如下步骤：

对第一视频文件进行分段，所述第一视频文件为歌曲视频文件，包含第一视频信息与第一音频信息；

播放第一视频文件；

获取演唱音频信号段落，并对所述演唱音频信号段落进行评分，所述演唱音频信号段落与第一视频文件分段后得到的各段落在时间上相对应；

根据评分结果，在预设的视频库中选择一视频文件作为第二视频文件，在播放第一视频文件中的下一段落时，播放第二视频文件，所述第二视频文件中包含第二视频信息。

进一步地，所述的基于演唱音频评分的多媒体文件播放方法中，对第一视频文件进行分段的方式包括预设分段方式或动态分段方式；

所述预设分段方式的分段在播放第一视频文件之前进行；

所述动态分段方式的分段在播放第一视频文件期间进行。

进一步地，所述的基于演唱音频评分的多媒体文件播放方法中，所述预设分段方式包括：按歌词句间时长分段、按主歌副歌分段、按歌词句数分段或按时长分段。

进一步地，所述的基于演唱音频评分的多媒体文件播放方法中，所述动态分段方式包括以下步骤：

判断当前段是否结束，所述判断当前段是否结束的方法具体包括：以相邻两句演唱得分的句间分数差为依据判断当前段是否结束；以相邻句子演唱得分的分数递增或递减为依据判断当前段是否结束；或以当前段之前的部分段落分数或全部段落分数的数值为依据判断当前段是否结束；

当判定当前段结束时，将当前段的结束时间点与上一段的结束时间点之间的部分划分为一个段落。

进一步地，所述的基于演唱音频评分的多媒体文件播放方法中，进行评分的方式包括：

基于音准的评分方式、基于声纹相似度的评分方式，或基于吐字清晰度的评分方式。

进一步地，所述的基于演唱音频评分的多媒体文件播放方法中，所述评分结果为对上一演唱音频信号段落的评分结果、对以上若干演唱音频信号段落的综合评分结果或对以上所有演唱音频信号段落的综合评分结果。

进一步地，所述的基于演唱音频评分的多媒体文件播放方法中，所述“在播放第一视频文件中的下一段落时，播放第二视频文件”具体包括：

在显示界面中以独占方式播放所述第二视频信息的画面；或

将显示界面划分为两个以上的视频区域，将第二视频信息的画面在其中至少一个视频区域中播放；

将第二视频信息的画面在另一显示界面中播放；或

在显示界面中将第二视频信息的画面叠加与第一视频信息的画面之上播放，叠加时第二视频信息的画面全部覆盖或部分覆盖第一视频信息的画面。

进一步地，所述的基于演唱音频评分的多媒体文件播放方法中，在播放第二视频文件中的第二视频信息时加载第一视频文件中的字幕信息，显示于第二视频信息的画面之上。

进一步地，所述的基于演唱音频评分的多媒体文件播放方法中，在显示界面中将第二视频信息的画面叠加于第一视频信息的画面之上播放，叠加时第二视频信息的画面部分覆盖第一视频信息的画面，但未覆盖第一视频信息的画面中的字幕部分。

进一步地，所述的基于演唱音频评分的多媒体文件播放方法中，在播放第二视频文件之前，判断第二视频文件是否包含第二音频信息；

当判定第二视频文件包含第二音频信息时，屏蔽第二音频信息并继续播放第一音频信息，或者以将第二音频信息与第一音频信息做混音处理后播放。

进一步地，所述的基于演唱音频评分的多媒体文件播放方法中，根据评分结果，并根据用户身份或第一视频文件的属性在预设的视频库中选择一视频文件作为第二视频文件，所述第一视频文件的属性选自以下属性中的一种或多种：歌曲类别，歌曲年代，歌曲风格，歌曲语种，歌曲关联的影视作品、演唱者以及演唱者属性。

进一步地，所述的基于演唱音频评分的多媒体文件播放方法中，所述预设的视频库位于本地、场所服务器或互联网云端。

发明人同时还提供了一种基于演唱音频评分的多媒体文件播放装置，包括分段单元、播放单元、音频获取单元、评分单元以及运算单元；

所述分段单元用于对第一视频文件进行分段，所述第一视频文件为歌曲视频文件，包含第一视频信息与第一音频信息；

所述播放单元用于播放第一视频文件；

所述音频获取单元用于获取演唱音频信号段落，并且所述评分单元用于对所述演唱音频信号段落进行评分，所述演唱音频信号段落与第一视频文件分段后得到的各段落在时间上相对应；

所述运算单元用于根据评分结果，在预设的视频库中选择一视频文件作为第二视频文件，在播放第一视频文件中的下一段落时，播放第二视频文件，所述第二视频文件中包含第二视频信息。

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，分段单元对第一视频文件进行分段的方式包括预设分段方式或动态分段方式；

所述预设分段方式的分段在播放单元播放第一视频文件之前进行；

所述动态分段方式的分段在播放单元播放第一视频文件期间进行。

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，所述预设分段方式包括：按歌词句间时长分段、按主歌副歌分段、按歌词句数分段或按时长分段。

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，分段单元进行动态分段的方式包括以下步骤：

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，所述评分单元进行评分的方式包括：

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，所述评分结果为对上一演唱音频信号段落的评分结果、对以上若干演唱音频信号段落的综合评分结果或对以上所有演唱音频信号段落的综合评分结果。

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，播放单元在播放第一视频文件中的下一段落时，播放第二视频文件具体包括：

在显示界面中以独占方式播放所述第二视频信息的画面；或

将第二视频信息的画面在另一显示界面中播放；或

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，播放单元在播放第二视频文件中的第二视频信息时加载第一视频文件中的字幕信息，显示于第二视频信息的画面之上。

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，播放单元在显示界面中将第二视频信息的画面叠加于第一视频信息的画面之上播放，叠加时第二视频信息的画面部分覆盖第一视频信息的画面，但未覆盖第一视频信息的画面中的字幕部分。

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，还包括音频处理单元；所述音频处理单元在播放单元播放第二视频文件之前，判断第二视频文件是否包含第二音频信息；并且当判定第二视频文件包含第二音频信息时屏蔽第二音频信息，播放单元继续播放第一音频信息，或者音频处理单元对第二音频信息与第一音频信息做混音处理后由播放单元播放。

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，运算单元根据评分结果，并根据用户身份或第一视频文件的属性在预设的视频库中选择一视频文件作为第二视频文件，所述第一视频文件的属性选自以下属性中的一种或多种：歌曲类别，歌曲年代，歌曲风格，歌曲语种，歌曲关联的影视作品、演唱者以及演唱者属性。

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，所述预设的视频库位于本地、场所服务器或互联网云端。

区别于现有技术，上述技术方案提供了一种采用视频交互的人机互动模式，可基于用户的演唱情况选择以及更改显示模块中的背景视频内容，以此提升演唱过程的互动娱乐性，提供用户以更有趣的演唱互动体验。

附图说明

图1为本发明一实施方式所述基于演唱音频评分的多媒体文件播放方法的流程图；

图2为本发明一实施方式所述基于演唱音频评分的多媒体文件播放装置的结构示意图；

图3-图5分别为用于说明本实施方式中三种播放第二视频文件的方式的界面示意图。

附图标记说明：

1-分段单元

2-视频播放单元

3-音频获取单元

4-评分单元

5-运算单元

6-音频处理单元

10-显示界面

11-显示界面A

12-显示界面B

101-视频画面A

102-视频画面B

具体实施方式

为详细说明技术方案的技术内容、构造特征、所实现目的及效果，以下结合具体实施例并配合附图详予说明。

请参阅图1，为本发明一实施方式所述基于演唱音频评分的多媒体文件播放方法的流程图。所述方法包括如下步骤：

S1、对第一视频文件进行分段；

其中，所述第一视频文件包含第一视频信息与第一音频信息。也就是说，第一视频文件是一个可以同时播放出画面和声音的多媒体文件。

本实施方式中，步骤S1里的分段方式为预设分段方式。进一步地，所述预设分段方式又可以包括按歌词句间时长分段、按主歌副歌分段、按歌词句数分段或按时长分段等分段方式。

在其他实施方式中，步骤S1里的分段方式还可以是动态分段方式。所述动态分段方式可以包括如下几种操作模式：

以句间分数差为依据判断当前段是否结束；

以分数递增或递减为依据判断当前段是否结束；

以部分分数或全部分数的数值为依据判断当前段是否结束。

也就是说，预设分段方式相对于动态分段方式而言，为一种静态分段方式，是根据歌曲的某些既有特定特征而在播放之前就已经确定了的分段方式。而动态分段方式则是根据歌唱用户在演唱过程中的某些动态的参数如一句与上一句之间的分数差、分数递增与否、上一段落的分数或本曲目之前的全部分数的数值为依据，判断当前段落是否结束，以此作为分段依据。

由于本实施方式中所采用的分段方式为预设分段方式，所以其分段结果在播放视频之前已经得到确定。在其他实施方式中，如果采取的分段方式为动态分段方式的话，那么实际分段工作并不是在本步骤就已全部完成，而是在播放多媒体文件视频与获取演唱音频的过程中逐步完成的。

本实施方式中，分段的实际操作是对歌曲进行段落标记，例如对段落1，标记其开始时间为0秒处，段落2，标记其开始时间为30秒处，以此类推。

S2、播放第一视频文件；

S3、获取演唱音频信号段落；

S4、对所述演唱音频信号段落进行评分；

其中，所述演唱音频信号段落与第一视频文件分段后得到的各段落在时间上相对应。

本步骤中，评分所采用的标准可以是基于音准的评分方式、基于声纹相似度的评分方式，或基于吐字清晰度的评分方式等各种常见的、常用的、可由计算机分析并量化考评的评分方式。

S5、根据评分结果，在预设的视频库中选择一视频文件作为第二视频文件；

其中，所述第二视频文件中包含第二视频信息。也就是说，第二视频文件可以是只具有画面(视频)信息的视频文件，也可以是同时包括有视频信息和音频信息的多媒体文件。

本步骤中，所述“根据评分结果，在预设的视频库中选择一视频文件作为第二视频文件”中的评分结果可以是上一演唱音频信号段落的评分结果、可以是以上若干演唱音频信号段落的综合评分结果，也可以是以上所有演唱音频信号段落的综合评分结果，总之，这里所说的“评分结果”可以是任何与本首歌曲的本次演唱相关的在先评分的结果，在某些实施方式中，评分标准是始终维持同一标准(如一直是基于音准评分)，在其他某些实施方式中，评分标准还可以是动态变化的，例如当音准评分较高时输出的评分结果为音准评分，而基于吐字清晰度的评分基准所得分数较高时，输出的评分结果为就吐字清晰度的评分结果。

在本步骤需要确定第二视频文件，而第二视频文件来源于预设视频库。这一预设视频库中所具有的素材内容可以是与该歌曲的演唱者相关的，也可以是与该歌曲的内容或题材相关。总之，以特定素材内容的视频库作为待选目标，能够让用户感到亲切和熟悉，具有更好的代入效果。

本实施方式中，确定第二视频文件的算法为一预设策略，这一预设策略除了与评分结果相关之外，还与用户身份相关，而通过用户身份或者说用户ID可以获取用户的性别、国籍、出生年代等信息。也就是说，首先根据用户ID判断或估测出一个适于其爱好或审美倾向的选择视频的范围，然后在此基础上再进行与评分结果相关的选择。或者反之。这一技术有赖于后台所事先存储的用户数据。例如根据用户ID得知用户性别，则选取的视频范围为与其异性或同性的角色的视频。又例如，根据用户ID得知其以往最喜欢的歌手，则选取的视频范围为该歌手的MV、电影、电视剧情节等。还比如，根据用户ID得知其喜欢的风景或建筑风格，则选取的视频或图像范围为相应的风景或建筑视频或图像。这样一来，这一技术环节将选择视频的范围与用户ID进行映射，更有针对性地为提升用户观感做出贡献。

以一个具体例子而言：当用户上一段落所得得分位于60分以下区间时，第二视频文件的画面内容为歌曲原唱人物的伤心流泪的表情段落。当用户上一段落所得得分位于60-70分区间时，第二视频文件的画面内容为歌曲原唱人物的失望的表情段落。当用户上一段落所得得分位于70-80分区间时，第二视频文件的画面内容为歌曲原唱人物的若有所思的表情段落。当用户上一段落所得得分位于80-0分区间时，第二视频文件的画面内容为歌曲原唱人物的微笑的表情段落。当用户上一段落所得得分位于90-100分区间时，第二视频文件的画面内容为歌曲原唱人物的开怀大笑的表情段落。这样一来，用户可以直观地根据视频上的内容了解自己上一段落的歌唱水平，得到有趣的互动娱乐体验。

本实施方式中，根据评分结果并根据用户身份或第一视频文件的属性在预设的视频库中选择一视频文件作为第二视频文件，所述第一视频文件的属性选自以下属性中的一种或多种：歌曲类别，歌曲年代，歌曲风格，歌曲语种，歌曲关联的影视作品、演唱者以及演唱者属性。所述预设的视频库位于本地、场所服务器或互联网云端。

S6、在播放第一视频文件中的下一段落时，播放第二视频文件。

本实施方式中，在播放第一视频文件中的下一段落时，播放第二视频文件的方式具体为：在显示界面中以独占方式播放所述第二视频信息的画面。

在其他实施方式中，在播放第一视频文件中的下一段落时，播放第二视频文件的方式还可以是其他方式，例如：

将第二视频信息的画面在另一显示界面中播放；或

请参阅图3-图5，分别为用于说明本实施方式中三种播放第二视频文件的方式的界面示意图。图3所示的实施例是将第二视频文件(视频A)在唯一的显示界面屏幕上独占播放，播放画面为视频画面A101。图4所示的实施例是将显示界面10划分为两个视频区域(左右分)，将第二视频信息(视频A)的画面即视频画面A101，在显示界面10其中的一个视频区域中播放，原视频(视频B)即视频画面B102，播放于显示界面10中的另一个视频区域。当然，也可以采取上下分屏等其他分屏方式，或将第二视频文件在小窗口中播放等方式播放。

如图5所示实施例，当引入另一显示设备之后，该显示设备具有显示界面A11，可以将第二视频文件(视频A)的画面，即视频画面A101在该另一显示设备的显示界面A11上播放，而将多媒体文件的原视频内容(视频B)的视频画面B102在本机的显示界面B12上播放。当然，也可反之。

本实施方式中有一针对于具有字幕信息的歌曲的优选步骤，即：在播放第二视频文件中的第二视频信息时加载第一视频文件中的字幕信息，显示于第二视频信息的画面之上。进一步地，在其他某些实施方式中，可以在显示界面中将第二视频信息的画面叠加于第一视频信息的画面之上播放，叠加时第二视频信息的画面部分覆盖第一视频信息的画面，但未覆盖第一视频信息的画面中的字幕部分。

进一步地，本实施方式中，还包括一个步骤：判断第二视频文件是否包含第二音频信息；当判定第二视频文件包含第二音频信息时，屏蔽第二音频信息并继续播放第一音频信息，或者以将第二音频信息与第一音频信息做混音处理后播放。

请参阅图2，为本发明一实施方式所述基于演唱音频评分的多媒体文件播放装置的结构示意图。所述装置包括分段单元1、播放单元2、音频获取单元3、评分单元4以及运算单元5；

所述分段单元1用于对第一视频文件进行分段，所述第一视频文件包含第一视频信息与第一音频信息；

所述播放单元2用于播放第一视频文件；

所述音频获取单元3用于获取演唱音频信号段落，并且所述评分单元4用于对所述演唱音频信号段落进行评分，所述演唱音频信号段落与第一视频文件分段后得到的各段落在时间上相对应；

所述运算单元5用于根据评分结果，在预设的视频库中选择一视频文件作为第二视频文件，播放单元2在播放第一视频文件中的下一段落时，播放第二视频文件，所述第二视频文件中包含第二视频信息。

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，分段单元1对第一视频文件进行分段的方式包括预设分段方式或动态分段方式；

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，分段单元1进行动态分段的方式包括以下步骤：

判断当前段是否结束，所述判断当前段是否结束的方法具体包括：以句间分数差为依据判断当前段是否结束；以分数递增或递减为依据判断当前段是否结束；或以部分分数或全部分数的数值为依据判断当前段是否结束；

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，所述评分单元4进行评分的方式包括：

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，播放单元2在播放第一视频文件中的下一段落时，播放第二视频文件具体包括：

在显示界面中以独占方式播放所述第二视频信息的画面；

将第二视频信息的画面在另一显示界面中播放；或

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，播放单元2在播放第二视频文件中的第二视频信息时加载第一视频文件中的字幕信息，显示于第二视频信息的画面之上。

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，播放单元2在显示界面中将第二视频信息的画面叠加于第一视频信息的画面之上播放，叠加时第二视频信息的画面部分覆盖第一视频信息的画面，但未覆盖第一视频信息的画面中的字幕部分。

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，还包括音频处理单元6；所述音频处理单元6在播放单元2播放第二视频文件之前，判断第二视频文件是否包含第二音频信息；并且当判定第二视频文件包含第二音频信息时屏蔽第二音频信息，播放单元2继续播放第一音频信息，或者音频处理单元6对第二音频信息与第一音频信息做混音处理后由播放单元2播放。

进一步地，所述的基于演唱音频评分的多媒体文件播放装置中，运算单元5根据评分结果，并根据用户身份或第一视频文件的属性在预设的视频库中选择一视频文件作为第二视频文件，所述第一视频文件的属性选自以下属性中的一种或多种：歌曲类别，歌曲年代，歌曲风格，歌曲语种，歌曲关联的影视作品、演唱者以及演唱者属性。

以下详述本实施方式中的基于演唱音频评分的多媒体文件播放装置具体如何实现基于交互的多媒体文件播放的功能，包括如下步骤：

S1、分段单元1对第一视频文件进行分段；

本实施方式中，分段单元1进行分段的方式为预设分段方式。进一步地，分段单元1进行分段的方式还可以是按歌词句间时长分段、按主歌副歌分段、按歌词句数分段或按时长分段等分段方式。

在其他实施方式中，分段单元1进行分段的方式还可以是动态分段方式。所述动态分段方式可以包括如下几种操作模式：

以句间分数差为依据判断当前段是否结束；

以分数递增或递减为依据判断当前段是否结束；

以部分分数或全部分数的数值为依据判断当前段是否结束。

S2、播放单元2播放第一视频文件；

S3、音频获取单元3获取演唱音频信号段落；

S4、运算单元4对所述演唱音频信号段落进行评分；

本步骤中，评分单元4评分所采用的标准可以是基于音准的评分方式、基于声纹相似度的评分方式，或基于吐字清晰度的评分方式等各种常见的、常用的、可由计算机分析并量化考评的评分方式。

S5、运算单元5根据评分结果，在预设的视频库中选择一视频文件作为第二视频文件；

本实施方式中，所谓的评分结果可以是评分单元4对于上一演唱音频信号段落的评分结果、可以是对于以上若干演唱音频信号段落的综合评分结果，还可以是对于以上所有演唱音频信号段落的综合评分结果，总之，这里所说的“评分结果”可以是任何与本首歌曲的本次演唱相关的在先评分的结果，在某些实施方式中，评分标准是始终维持同一标准(如一直是基于音准评分)，在其他某些实施方式中，评分标准还可以是动态变化的，例如当音准评分较高时输出的评分结果为音准评分，而基于吐字清晰度的评分基准所得分数较高时，输出的评分结果为就吐字清晰度的评分结果。

在本步骤中，运算单元5需要确定第二视频文件，而第二视频文件来源于预设视频库。这一预设视频库中所具有的素材内容可以是与该歌曲的演唱者相关的，也可以是与该歌曲的内容或题材相关。总之，以特定素材内容的视频库作为待选目标，能够让用户感到亲切和熟悉，具有更好的代入效果。

本实施方式中，运算单元5确定第二视频文件的算法为一预设策略，这一预设策略除了与评分结果相关之外，还与用户身份相关，而通过用户身份或者说用户ID可以获取用户的性别、国籍、出生年代等信息。也就是说，首先根据用户ID判断或估测出一个适于其爱好或审美倾向的选择视频的范围，然后在此基础上再进行与评分结果相关的选择。或者反之。这一技术有赖于后台所事先存储的用户数据。例如根据用户ID得知用户性别，则选取的视频范围为与其异性或同性的角色的视频。又例如，根据用户ID得知其以往最喜欢的歌手，则选取的视频范围为该歌手的MV、电影、电视剧情节等。还比如，根据用户ID得知其喜欢的风景或建筑风格，则选取的视频或图像范围为相应的风景或建筑视频或图像。这样一来，这一技术环节将选择视频的范围与用户ID进行映射，更有针对性地为提升用户观感做出贡献。

本实施方式中，运算单元5根据评分结果并根据用户身份或第一视频文件的属性在预设的视频库中选择一视频文件作为第二视频文件，所述第一视频文件的属性选自以下属性中的一种或多种：歌曲类别，歌曲年代，歌曲风格，歌曲语种，歌曲关联的影视作品、演唱者以及演唱者属性。所述预设的视频库位于本地、场所服务器或互联网云端。

S6、播放单元2在播放第一视频文件中的下一段落时，播放第二视频文件。

本实施方式中，播放单元2在播放第一视频文件中的下一段落时，播放第二视频文件的方式具体为：在显示界面中以独占方式播放所述第二视频信息的画面。

在其他实施方式中，播放单元2在播放第一视频文件中的下一段落时，播放第二视频文件的方式还可以是其他方式，例如：

将第二视频信息的画面在另一显示界面中播放；或

进一步地，本实施方式中，还包括由音频处理单元6进行的一个涉及音频的判断和处理步骤，包括：音频处理单元6判断第二视频文件是否包含第二音频信息；当音频处理单元6判定第二视频文件包含第二音频信息时，播放单元2屏蔽第二音频信息并继续播放第一音频信息，或者音频处理单元6对第二音频信息与第一音频信息做混音处理，然后播放单元2播放经处理的音频信号。

以上实施方式所述的基于演唱音频评分的多媒体文件播放装置能有效针对用户个性提供给用户独特而有趣味的交互式视觉体验，为用户的演唱过程带来变化和新奇的乐趣。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括……”或“包含……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的要素。此外，在本文中，“大于”、“小于”、“超过”等理解为不包括本数；“以上”、“以下”、“以内”等理解为包括本数。

本领域内的技术人员应明白，上述各实施例可提供为方法、装置、或计算机程序产品。这些实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。上述各实施例涉及的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成，所述的程序可以存储于计算机设备可读取的存储介质中，用于执行上述各实施例方法所述的全部或部分步骤。所述计算机设备，包括但不限于：个人计算机、服务器、通用计算机、专用计算机、网络设备、嵌入式设备、可编程设备、智能移动终端、智能家居设备、穿戴式智能设备、车载智能设备等；所述的存储介质，包括但不限于：RAM、ROM、磁碟、磁带、光盘、闪存、U盘、移动硬盘、存储卡、记忆棒、网络服务器存储、网络云存储等。

上述各实施例是参照根据实施例所述的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到计算机设备的处理器以产生一个机器，使得通过计算机设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机设备以特定方式工作的计算机设备可读存储器中，使得存储在该计算机设备可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机设备上，使得在计算机设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已经对上述各实施例进行了描述，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改，所以以上所述仅为本发明的实施例，并非因此限制本发明的专利保护范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围之内。

Claims

1.一种基于演唱音频评分的多媒体文件播放方法，其特征在于，包括如下步骤：

播放第一视频文件；

2.如权利要求1所述的基于演唱音频评分的多媒体文件播放方法，其特征在于，对第一视频文件进行分段的方式包括预设分段方式或动态分段方式；

所述预设分段方式的分段在播放第一视频文件之前进行；

所述动态分段方式的分段在播放第一视频文件期间进行。

3.如权利要求2所述的基于演唱音频评分的多媒体文件播放方法，其特征在于，所述预设分段方式包括：按歌词句间时长分段、按主歌副歌分段、按歌词句数分段或按时长分段。

4.如权利要求2或3所述的基于演唱音频评分的多媒体文件播放方法，其特征在于，所述动态分段方式包括以下步骤：

5.如权利要求1或2所述的基于演唱音频评分的多媒体文件播放方法，其特征在于，进行评分的方式包括：

6.如权利要求1或2所述的基于演唱音频评分的多媒体文件播放方法，其特征在于，所述评分结果为对上一演唱音频信号段落的评分结果、对以上若干演唱音频信号段落的综合评分结果或对以上所有演唱音频信号段落的综合评分结果。

7.如权利要求1或2所述的基于演唱音频评分的多媒体文件播放方法，其特征在于，所述“在播放第一视频文件中的下一段落时，播放第二视频文件”具体包括：

在显示界面中以独占方式播放所述第二视频信息的画面；或

将第二视频信息的画面在另一显示界面中播放；或

8.如权利要求7所述的基于演唱音频评分的多媒体文件播放方法，其特征在于，在播放第二视频文件中的第二视频信息时加载第一视频文件中的字幕信息，显示于第二视频信息的画面之上。

9.如权利要求7所述的基于演唱音频评分的多媒体文件播放方法，其特征在于，在显示界面中将第二视频信息的画面叠加于第一视频信息的画面之上播放，叠加时第二视频信息的画面部分覆盖第一视频信息的画面，但未覆盖第一视频信息的画面中的字幕部分。

10.如权利要求1或2所述的基于演唱音频评分的多媒体文件播放方法，其特征在于，在播放第二视频文件之前，判断第二视频文件是否包含第二音频信息；

11.如权利要求1或2所述的基于演唱音频评分的多媒体文件播放方法，其特征在于，根据评分结果，并根据用户身份或第一视频文件的属性在预设的视频库中选择一视频文件作为第二视频文件，所述第一视频文件的属性选自以下属性中的一种或多种：歌曲类别，歌曲年代，歌曲风格，歌曲语种，歌曲关联的影视作品、演唱者以及演唱者属性。

12.如权利要求1或2所述的基于演唱音频评分的多媒体文件播放方法，其特征在于，所述预设的视频库位于本地、场所服务器或互联网云端。

13.一种基于演唱音频评分的多媒体文件播放装置，其特征在于，包括分段单元、播放单元、音频获取单元、评分单元以及运算单元；

所述播放单元用于播放第一视频文件；

14.如权利要求13所述的基于演唱音频评分的多媒体文件播放装置，其特征在于，分段单元对第一视频文件进行分段的方式包括预设分段方式或动态分段方式；

15.如权利要求14所述的基于演唱音频评分的多媒体文件播放装置，其特征在于，所述预设分段方式包括：按歌词句间时长分段、按主歌副歌分段、按歌词句数分段或按时长分段。

16.如权利要求14或15所述的基于演唱音频评分的多媒体文件播放装置，其特征在于，分段单元进行动态分段的方式包括以下步骤：

17.如权利要求13或14所述的基于演唱音频评分的多媒体文件播放装置，其特征在于，所述评分结果为对上一演唱音频信号段落的评分结果、对以上若干演唱音频信号段落的综合评分结果或对以上所有演唱音频信号段落的综合评分结果。

18.如权利要求13或14所述的基于演唱音频评分的多媒体文件播放装置，其特征在于，播放单元在播放第一视频文件中的下一段落时，播放第二视频文件具体包括：

在显示界面中以独占方式播放所述第二视频信息的画面；或

将第二视频信息的画面在另一显示界面中播放；或

19.如权利要求18所述的基于演唱音频评分的多媒体文件播放装置，其特征在于，播放单元在播放第二视频文件中的第二视频信息时加载第一视频文件中的字幕信息，显示于第二视频信息的画面之上。

20.如权利要求13或14所述的基于演唱音频评分的多媒体文件播放装置，其特征在于，还包括音频处理单元；所述音频处理单元在播放单元播放第二视频文件之前，判断第二视频文件是否包含第二音频信息；并且当判定第二视频文件包含第二音频信息时屏蔽第二音频信息，播放单元继续播放第一音频信息，或者音频处理单元对第二音频信息与第一音频信息做混音处理后由播放单元播放。

21.如权利要求13或14所述的基于演唱音频评分的多媒体文件播放装置，其特征在于，运算单元根据评分结果，并根据用户身份或第一视频文件的属性在预设的视频库中选择一视频文件作为第二视频文件，所述第一视频文件的属性选自以下属性中的一种或多种：歌曲类别，歌曲年代，歌曲风格，歌曲语种，歌曲关联的影视作品、演唱者以及演唱者属性。