CN112653918B

CN112653918B - 预览视频生成方法、装置、电子设备及存储介质

Info

Publication number: CN112653918B
Application number: CN202011484135.1A
Authority: CN
Inventors: 陈妙; 钟宜峰; 吴耀华; 李琳
Original assignee: China Mobile Communications Group Co Ltd; MIGU Culture Technology Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; MIGU Culture Technology Co Ltd
Priority date: 2020-12-15
Filing date: 2020-12-15
Publication date: 2023-04-07
Anticipated expiration: 2040-12-15
Also published as: CN112653918A

Abstract

本发明实施例公开了一种预览视频生成方法、装置、电子设备及存储介质，该方法包括：获取视频中对应于预定的关键信息的关键帧集合；获取所述视频中对应于预定的辅助信息的视频辅助帧集合；基于所述关键帧集合和所述视频辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧；基于所述视频的最优关键帧，生成所述预览视频。本发明实施例，具有预览视频生成效率高的优点，并且生成的预览视频针对性强，有效地提升用户对赛事的直观的感受。

Description

预览视频生成方法、装置、电子设备及存储介质

技术领域

本发明涉及视频处理技术领域，具体涉及一种预览视频生成方法、装置、电子设备及存储介质。

背景技术

预览视频通常为短视频，是对完整的视频采用如几秒左右短时间动态短视频方式进行展示，例如：对于体育赛事来说，可以通过短视频进行体育赛事预览。目前动态短视频的的做法是人工合成或者是基于运动的前景图像帧提取，之后进行合成。合成效率低且选择的视频帧相对主观，针对性差，进而，造成通过观看预览视频对完整的视频的直观感受差。

发明内容

基于现有技术中存在的问题，本发明实施例提出一种预览视频生成方法、装置、电子设备及存储介质。

第一方面，本发明实施例提供了一种预览视频生成方法，包括：

获取视频中对应于预定的关键信息的关键帧集合；

获取所述视频中对应于预定的辅助信息的视频辅助帧集合；

基于所述关键帧集合和所述视频辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧；

基于所述视频的最优关键帧，生成所述预览视频。

进一步地，所述关键帧集合至少包括对应于比分变化的第一视频关键帧集合和对应于动作回放的第二视频关键帧集合，所述在基于所述关键帧集合和所述视频辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧之前，还包括：对所述第一视频关键帧集合进行筛选的步骤，具体包括：

当所述第一视频关键帧集合和所述第二视频关键帧集合中存在两个关键帧之间的时间差小于预定时间差时，从所述第一视频关键帧集合中删除对应的关键帧。

进一步地，所述获取视频中对应于预定的关键信息的关键帧集合，包括：

以第一预定帧间隔从所述视频中提取多个第一视频帧；

依次对相邻两次提取的第一视频帧进行比分检测及识别，以将比分变化的第一视频帧加入所述第一视频关键帧集合；

以第二预定帧间隔从所述视频中提取多个第二视频帧；

当所述多个第二视频帧达到预定数量时，将所述多个第二视频帧组合为一个短视频；

判断所述短视频是否为动作回放视频；

如果所述短视频是动作回放视频，则进一步判断连续多个短视频是否均为同一回放视频；

确定连续所述多个短视频均为同一回放视频时，从所述多个短视频中筛选出一视频帧加入所述第二视频关键帧集合。

进一步地，所述获取所述视频中对应于预定的辅助信息的视频辅助帧集合，包括：

从所述视频中提取音频信息；

提取所述音频信息的音频特征；

基于所述音频特征，从所述视频中得到第一辅助帧，并将所述第一辅助帧加入所述视频辅助帧集合；

和/或，

对所述视频的各视频帧进行弹幕内容识别；

统计各视频帧的弹幕内容中的关键词数量；

根据各视频帧的弹幕内容中的关键词数量，从各视频帧中筛选出第二辅助帧，并将所述第二辅助帧加入所述视频辅助帧集合；

和/或，

对所述视频的各视频帧进行预设画面识别；

将存在所述预设画面的视频帧作为第三辅助帧，并将所述第三辅助帧加入所述视频辅助帧集合。

进一步地，所述基于所述关键帧集合和所述视频辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧，包括：

以所述第一视频关键帧集合中的第一视频帧和所述第二视频关键帧集合中的第二视频帧为聚类中心，对所述第一视频关键帧集合、第二视频关键帧集合和视频辅助帧集合进行聚类；

对聚类后每个类别中的视频帧的数量进行统计；

将数量最多的类别中的第一视频帧或者第二视频帧作为所述最优关键帧。

进一步地，在基于所述关键帧集合和所述视频辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧之前，还包括对所述第一视频关键帧集合和所述第二视频关键帧集合中的关键帧进行筛选，具体包括：

获取所述视频的精彩集锦；

以第三预定帧间隔从所述精彩集锦中提取多个第三视频帧；

根据所述第三视频帧，对所述第一视频关键帧集合和所述第二视频关键帧集合进行筛选，以优化所述第一视频关键帧集合和所述第二视频关键帧集合。

进一步地，所述基于所述视频的最优关键帧，生成所述预览视频，包括：

从所述视频辅助帧集合中选择与所述最优关键帧满足预定时间间隔的辅助帧；

将满足预定时间间隔的辅助帧作为起始点和结束点，从所述视频中生成所述预览视频。

第二方面，本发明实施例还提供了一种预览视频生成装置，包括：

关键帧识别模块，用于获取视频中对应于预定的关键信息的关键帧集合；

辅助帧识别模块，用于获取所述视频中对应于预定的辅助信息的辅助帧集合；

选择模块，用于基于所述关键帧集合和所述辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧；

预览视频生成模块，用于基于所述视频的最优关键帧，生成所述预览视频。

第三方面，本发明实施例还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的预览视频生成方法。

第四方面，本发明实施例还提供了一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如第一方面所述的预览视频生成方法。

由上述技术方案可知，本发明实施例提供的预览视频生成方法、装置、电子设备及存储介质，通过对视频中如比分变化、回放等关键帧的识别，并通过如音频、弹幕等辅助帧的识别得到辅助帧，然后，基于辅助帧从关键帧中选择出最优关键帧，进而，根据最优关键帧生成预览视频，具有预览视频生成效率高的优点，并且生成的预览视频针对性强，有效地提升了用户对赛事的直观的感受，方便用户选择观看视频。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些图获得其他的附图。

图1是本发明一实施例提供的预览视频生成方法的流程图；

图2是本发明另一实施例提供的预览视频生成方法的流程图；

图3是本发明一实施例提供的预览视频生成装置的结构框图；

图4是本发明一实施例提供的电子设备的结构示意图。

具体实施方式

下面结合附图，对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

以下结合附图描述根据本发明实施例的直播的录屏方法、装置、电子设备及存储介质。

图1示出了本发明一实施例提供的预览视频生成方法的流程图。如图1所示，本发明实施例提供的预览视频生成方法，具体包括如下内容：

S101：获取视频中对应于预定的关键信息的关键帧集合。

在具体示例中，关键帧集合至少包括对应于比分变化的第一视频关键帧集合和对应于动作回放的第二视频关键帧集合，所述在基于所述关键帧集合和所述视频辅助帧集合，可以从视频中识别出比分变化的第一视频关键帧集合以及动作回放的第二视频关键帧集合。

本实施例中，视频例如为体育赛事视频，体育赛事视频为但不限于足球比赛视频、篮球比赛视频等。

比分变化的第一视频关键帧集合中的视频帧，指比分改变时的视频帧，例如：对于足球比赛而言，假设进球发生在比赛开始后的第5分钟，比分从0：0变化到0：1时，则第一视频关键帧集合中的视频帧包括比分变化瞬间的一帧图像。例如：5分至5分02秒时间内的一个视频帧。

动作回放通常是连续的一段视频，因此，针对每个动作回放，第二视频关键帧集合中的视频帧可以是动作回放这一段视频中选择出的一帧图像。

S102：获取所述视频中对应于预定的辅助信息的视频辅助帧集合。

在本发明的一个实施例中，可以根据视频的音频信息、弹幕内容和预设画面中的至少一种，从视频中识别出视频辅助帧集合。

在本实施例中，对音频信息进行过零率、色谱图等特征的提取，基于这些特征，确定出是否属于观众欢呼等场景，如果是，则将对应的视频帧加入视频辅助帧集合；对各视频帧进行弹幕内容的统计，确定各视频帧的弹幕内容中包括多少关键词，关键词为但不限于“进球了”、“精彩”、“666”等表示精彩瞬间的关键词。对各视频帧的关键词统计结果进行差异性比较，当出现波峰时，即：突然有大量表示精彩瞬间的关键词出现时，表示当前画面比较精彩，则将该视频帧加入视频辅助帧集合；预设画面例如指包括广告、红包等画面的视频帧，如果视频帧中出现包括红包或者广告等画面，则将该视频帧加入视频辅助帧集合。

S103：基于所述关键帧集合和所述视频辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧。

在本发明的具体示例中，可以对第一视频关键帧集合、第二视频关键帧集合和视频辅助帧集合进行聚类，并根据聚类结果得到视频的最优关键帧。

需要说明的是，聚类以第一视频关键帧集合和第二视频关键帧集合中的各个视频帧作为聚类中心进行聚类，例如：第一视频关键帧集合中包括5帧，第二视频关键帧集合中包括3帧，则聚类后包括8个类型；然后，可以统计每个类型的聚类结果中视频帧的数量，将数量最多的聚类结果中的关键帧作为最优关键帧。

当然，从关键帧集合中得到所述视频的最优关键帧之前，还包括：对所述第一视频关键帧集合进行筛选的步骤，具体包括：当所述第一视频关键帧集合和所述第二视频关键帧集合中存在两个关键帧之间的时间差小于预定时间差时，从所述第一视频关键帧集合中删除对应的关键帧。例如：首先对关键帧进行提取，当第一视频关键帧集合fk1、第二视频关键帧集合fk2中有两个关键帧之间时间差<10s(即：预定时间差)时，则认为时基于同一个进球，留取fk2中的关键帧，舍去fk1中相应的关键帧。针对赛事而言，如果回放和进球瞬间相隔时间很近，可以认为该回放就是很对进球瞬间的回放。此时，由于回放会对重点区域进行聚焦，因此保留回放而舍弃进球瞬间的关键帧。

S104：基于视频的最优关键帧，生成预览视频。

本示例中，从视频中确定出最优关键帧后，可以根据生成的预览视频的时长，基于最优关键帧在视频中的时间点，从视频中截取出预览视频，例如：需要生成的预览视频的时长为6秒，最优关键帧在视频中出现的时间为20分钟15秒，则可以从20分钟15秒为时间点向前推3秒开始截取，到20分钟15秒的时间点向后推3秒为止停止截取，即：从视频中截取20分钟12秒至20分钟18秒的这一段的视频作为预览视频。

可以理解的是，上述示例中预览视频的截取方式仅是示例性的，在其它示例中，也可以以20分钟15秒的时间点为起始时间开始截取，并以20分钟15秒的时间点延后6秒为结束时间停止截取，此时，截取的预览视频为视频中的20分钟15秒至20分钟21秒的这一段视频。此外，还可以以20分钟15秒的时间点为结束时间，并以20分钟15秒的时间点向前推6秒为起始时间开始截取，此时，截取的预览视频为视频中的20分钟09秒至20分钟15秒的这一段视频。

根据本发明实施例的预览视频生成方法，通过对视频中的如比分变化、回放等关键帧的识别，并通过如音频、弹幕等辅助帧的识别得到的辅助帧，然后，基于辅助帧从关键帧中选择出最优关键帧，进而，根据最优关键帧生成预览视频，具有预览视频生成效率高的优点，并且生成的预览视频针对性强，有效地提升了用户对赛事的直观的感受，方便用户选择观看视频。

在本发明的一个实施例中，从视频中识别出比分变化的第一视频关键帧集合，包括：以第一预定帧间隔从所述视频中提取多个第一视频帧；依次对相邻两次提取的第一视频帧进行比分检测及识别，以将比分变化的第一视频帧加入所述第一视频关键帧集合。

以体育赛事为例，如图2所示，从视频中识别出比分变化的第一视频关键帧集合包括体育赛事进球识别。

具体来说，对于体育赛事进球识别，对体育视频隔N1帧(即：第一预定帧间隔)提取视频帧，对视频帧进行比分牌检测及识别，对识别结果进行后校验，将其范围限定在合理比分之内，之后判断比分数字是否发生变化，从而判断出是否进球。将进球对应的视频帧fk1加入到候选关键帧(即：第一视频关键帧集合)中Candidate_keyframes＝[fk1]。如果比赛没有进球，则候选关键帧为空。

在本发明的一个实施例中，从视频中识别出动作回放的第二视频关键帧集合，包括：以第二预定帧间隔从所述视频中提取多个第二视频帧；当所述多个第二视频帧达到预定数量时，将所述多个第二视频帧组合为一个短视频；判断所述短视频是否为动作回放视频；如果短视频是动作回放视频，则进一步判断连续多个短视频是否均为同一回放视频；确定连续多个短视频均为同一回放视频时，从所述多个短视频中筛选出一视频帧加入所述第二视频关键帧集合。

以体育赛事为例，如图2所示，从视频中识别出动作回放的第二视频关键帧集合包括画面回放识别。

具体来说，对体育视频隔N2帧(即：第二预定帧间隔)提取视频帧fn,…,fn+M，同时将视频帧进行组合，当总帧数达到M帧(即：预定数量)时，将M帧视频输入到神经网络中，判断出该短视频是否属于回放，如果是，判断是否具有连续多个短视频识别为回放场景，如果是，则提取连续回放场景的中间帧fk2加入到候选关键帧(即：第二视频关键帧集合)Candidate_keyframes中。Candidate_keyframes＝[fk1，…fk2]。

在本发明的一个实施例中，根据视频的音频信息、弹幕内容和预设画面中的至少一种，从视频中识别出视频辅助帧集合，包括：从所述视频中提取所述音频信息；提取所述音频信息的音频特征；基于所述音频特征，从所述视频中得到第一辅助帧，并将所述第一辅助帧加入所述视频辅助帧集合；和/或，对所述视频的各视频帧进行弹幕内容识别；统计各视频帧的弹幕内容中的关键词数量；根据各视频帧的弹幕内容中的关键词数量，从各视频帧中筛选出第二辅助帧，并将所述第二辅助帧加入所述视频辅助帧集合；和/或，对所述视频的各视频帧进行预设画面识别；将存在所述预设画面的视频帧作为第三辅助帧，并将所述第三辅助帧加入所述视频辅助帧集合，以优化第一视频关键帧集合和第二视频关键帧集合。

如图2所示，根据音频信息确定欢呼音频的识别，对视频提取音频信息，对音频信息提取过零率、色谱图等特征，基于该特征，可利用神经网络判断当前的音频是否属于观众欢呼、主持人激动等场景，如果是，则将相应的视频帧加入到辅助帧Auxiliary_frame＝[Ak1]列表中(即：视频辅助帧集合)；弹幕内容统计识别，对当前画面(如第n帧)进行弹幕内容识别，统计当前帧画面中具有“进球了”、“精彩”、“666”等表示精彩瞬间等字样的关键词，并对关键词进行统计，统计结果记为Cn。对全场的各视频帧的字幕内容进行差异性统计，当出现波峰时，即突然有大量精彩瞬间字样的字幕出现时，表示当前画面比较精彩，将对应的视频帧Ak2＝n加入到辅助帧Auxiliary_frame＝[A k1,…Ak2](即：视频辅助帧集合)；预设画面例如包括广告、红包等的画面，则对各视频帧进行识别，判断是否出现如红包或者广告等画面，如果出现，则将该该视频帧加入到辅助帧Auxiliary_frame＝[A k1,…Ak2,Ak3]中(即：视频辅助帧集合)。

需要说明的是，上述fk1、fk2、Ak1、Ak2、Ak3代表的是从视频中识别得到的所有的视频帧。也就是说，fk1、fk2、Ak1、Ak2和Ak3均可以包括多个视频帧。

在本发明的一个实施例中，对第一视频关键帧集合、第二视频关键帧集合和视频辅助帧集合进行聚类，并根据聚类结果得到所述视频的最优关键帧，包括：以所述第一视频关键帧集合中的第一视频帧和所述第二视频关键帧集合中的第二视频帧为聚类中心，对所述第一视频关键帧集合、第二视频关键帧集合和视频辅助帧集合进行聚类；对聚类后每个类别中的视频帧的数量进行统计；将数量最多的类别中的第一视频帧或者第二视频帧作为所述最优关键帧。

在该示例中，在对第一视频关键帧集合、第二视频关键帧集合和视频辅助帧集合进行聚类，并根据聚类结果得到所述视频的最优关键帧之前，还可以包括：获取所述视频的精彩集锦；以第三预定帧间隔从所述精彩集锦中提取多个第三视频帧；根据所述第三视频帧，对所述第一视频关键帧集合和所述第二视频关键帧集合进行筛选。

如图2所示，首先对关键帧进行提取，例如：当fk1、fk2中有两个关键帧之间时间差<预定时间(如10秒)，则认为是基于同一个进球，留取fk2中的关键帧。利用辅助帧对关键帧进行优化，具体为将fk1、fk2、Ak1、Ak2、Ak3进行组合，之后利用聚类算法进行聚类。以fk1、fk2为聚类中心，完成聚类后进行每个类别的数据统计，选取具有关键帧、辅助帧数量最多的类别中心作为最终的最优关键帧。

如图2所示，如果具有精彩集锦，则对于精彩集锦，进行视频抽帧，例如间隔N3帧进行提取。针对精彩集锦帧以及之前得到的关键帧，可以基于结构相似性度量算法、互信息算法等进行两幅图像相似度判别。当相似度满足一定的阈值时，表明该关键帧出现在精彩集锦中，此时，可以仅保留第一视频关键帧集合和第二视频关键帧集合中与精彩集锦匹配的视频帧，这样，可以减少视频帧的处理量，有效提升预览视频的生成效率。

在本发明的一个实施例中，基于所述视频的最优关键帧，生成所述预览视频，包括：从所述视频辅助帧集合中选择与所述最优关键帧满足预定时间间隔的辅助帧；将满足预定时间间隔的辅助帧作为起始点和结束点，从所述视频中生成所述预览视频。例如：基于该最优关键帧，可通过选取类别中的Ak1、Ak2、Ak3中满足短视频生成时间要求的帧作为帧的起始结束点，进行预览视频的生成。

根据本发明实施例的预览视频生成方法，具有预览视频生成效率高的优点，并且生成的预览视频针对性强，有效地提升用户对赛事的直观的感受。

图3示出了本发明一实施例提供的预览视频生成装置的结构示意图，如图3所示，本发明实施例提供的预览视频生成装置，包括：关键帧识别模块310、辅助帧识别模块320、选择模块330和预览视频生成模块340。其中：

关键帧识别模块310，用于获取视频中对应于预定的关键信息的关键帧集合；

辅助帧识别模块320，用于获取所述视频中对应于预定的辅助信息的辅助帧集合；

选择模块330，用于基于所述关键帧集合和所述辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧；

预览视频生成模块340，用于基于所述视频的最优关键帧，生成所述预览视频。

根据本发明实施例的预览视频生成装置，通过对视频中的如比分变化、回放等关键帧的识别，并通过如音频、弹幕等辅助帧的识别得到的辅助帧，然后，基于辅助帧从关键帧中选择出最优关键帧，进而，根据最优关键帧生成预览视频，具有预览视频生成效率高的优点，并且生成的预览视频针对性强，有效地提升了用户对赛事的直观的感受，方便用户选择观看视频。

需要说明的是，本发明实施例的预览视频生成装置的具体实现方式与本发明实施例的预览视频生成方法的具体实现方式类似，具体请参见方法部分的描述，为了减少冗余，具体此处不做赘述。

基于相同的发明构思，本发明又一实施例提供了一种电子设备，参见图4，所述电子设备具体包括如下内容：处理器401、存储器402、通信接口403和通信总线404；

其中，所述处理器401、存储器402、通信接口403通过所述通信总线404完成相互间的通信；所述通信接口403用于实现各设备之间的信息传输；

所述处理器401用于调用所述存储器402中的计算机程序，所述处理器执行所述计算机程序时实现上述预览视频生成方法的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：获取视频中对应于预定的关键信息的关键帧集合；获取所述视频中对应于预定的辅助信息的视频辅助帧集合；基于所述关键帧集合和所述视频辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧；基于所述视频的最优关键帧，生成所述预览视频。

基于相同的发明构思，本发明又一实施例提供了一种非暂态计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述预览视频生成方法的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：获取视频中对应于预定的关键信息的关键帧集合；获取所述视频中对应于预定的辅助信息的视频辅助帧集合；基于所述关键帧集合和所述视频辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧；基于所述视频的最优关键帧，生成所述预览视频。

此外，上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的指标监控方法。

此外，在本发明中，诸如“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

此外，在本发明中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

此外，在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种预览视频生成方法，其特征在于，包括：

获取视频中对应于预定的关键信息的关键帧集合，所述关键帧集合至少包括对应于比分变化的第一视频关键帧集合和对应于动作回放的第二视频关键帧集合；

获取所述视频中对应于预定的辅助信息的视频辅助帧集合；

基于所述视频的最优关键帧，生成所述预览视频；

所述获取视频中对应于预定的关键信息的关键帧集合，包括：

以第一预定帧间隔从所述视频中提取多个第一视频帧；

以第二预定帧间隔从所述视频中提取多个第二视频帧；

判断所述短视频是否为动作回放视频；

2.根据权利要求1所述的预览视频生成方法，其特征在于，所述在基于所述关键帧集合和所述视频辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧之前，还包括：对所述第一视频关键帧集合进行筛选的步骤，具体包括：

3.根据权利要求1或2所述的预览视频生成方法，其特征在于，所述获取所述视频中对应于预定的辅助信息的视频辅助帧集合，包括：

从所述视频中提取音频信息；

提取所述音频信息的音频特征；

和/或，

对所述视频的各视频帧进行弹幕内容识别；

统计各视频帧的弹幕内容中的关键词数量；

和/或，

对所述视频的各视频帧进行预设画面识别；

4.根据权利要求2所述的预览视频生成方法，其特征在于，所述基于所述关键帧集合和所述视频辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧，包括：

对聚类后每个类别中的视频帧的数量进行统计；

5.根据权利要求4所述的预览视频生成方法，其特征在于，在基于所述关键帧集合和所述视频辅助帧集合，从所述关键帧集合中得到所述视频的最优关键帧之前，还包括对所述第一视频关键帧集合和所述第二视频关键帧集合中的关键帧进行筛选，具体包括：

获取所述视频的精彩集锦；

以第三预定帧间隔从所述精彩集锦中提取多个第三视频帧；

6.根据权利要求1所述的预览视频生成方法，其特征在于，所述基于所述视频的最优关键帧，生成所述预览视频，包括：

7.一种预览视频生成装置，其特征在于，包括：

关键帧识别模块，用于获取视频中对应于预定的关键信息的关键帧集合，所述关键帧集合至少包括对应于比分变化的第一视频关键帧集合和对应于动作回放的第二视频关键帧集合；

预览视频生成模块，用于基于所述视频的最优关键帧，生成所述预览视频；

所述装置包括：

以第一预定帧间隔从所述视频中提取多个第一视频帧；

以第二预定帧间隔从所述视频中提取多个第二视频帧；

判断所述短视频是否为动作回放视频；

8.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现根据权利要求1至6任一所述的预览视频生成方法。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现根据权利要求1至6任一所述的预览视频生成方法。