CN110769314B

CN110769314B - 一种视频播放方法、装置和计算机可读存储介质

Info

Publication number: CN110769314B
Application number: CN201911139212.7A
Authority: CN
Inventors: 范立志; 吴晓亮; 王琳
Original assignee: Samsung Electronics China R&D Center; Samsung Electronics Co Ltd
Current assignee: Samsung Electronics China R&D Center; Samsung Electronics Co Ltd
Priority date: 2019-11-20
Filing date: 2019-11-20
Publication date: 2022-05-13
Anticipated expiration: 2039-11-20
Also published as: CN110769314A

Abstract

本发明实施方式公开了一种视频播放方法、装置和计算机可读存储介质。方法包括：获取用户浏览第一视频时的用户行为，提取与所述用户行为的时间点相关的视频片段的特征；基于所述视频片段的特征训练深度学习模型；将第二视频分为各个视频分段，提取各个视频分段的特征，将各个视频分段的特征输入到所述训练后的深度学习模型；基于所述训练后的深度学习模型对各个视频分段的分类结果，对各个视频分段执行区别播放操作。基于用户行为训练出视频分类模型，实现区别播放操作。还可以实现自动智能快速播放，在节约时间的同时，不需要用户频繁操作。

Description

一种视频播放方法、装置和计算机可读存储介质

技术领域

本发明涉及电子通信技术领域，更具体的说，涉及一种视频播放方法、装置和计算机可读存储介质。

背景技术

目前各类视频节目层出不穷，存在海量的综艺节目和长篇电视剧可以观看，但是观众的时间毕竟有限，一般没有足够的时间完整观看完毕全部的视频内容。比如，在长视频应用场景中，观众难以浏览全部内容，并有可能错过真正感兴趣的视频内容。通常而言，长视频一般指超过半个小时的视频，以影视剧为主，区别于短视频。

目前，无论是长视频播放或短视频播放，观众的常见操作通常包括：

(1).跳跃播放：手工点击进度条，以固定步长跳过，选择感兴趣的内容。这种方式手工操作，影响流畅的观看体验。

(2).使用倍速播放：这种方式不需要手工操作，剧情观看完整，但依然播放用户不感兴趣的内容，浪费观众时间。而且，关键剧情仍然需要用户恢复正常播放以保证观看效果。

因此，现有技术中需要用户手工操作以避开不感兴趣的内容和观看感兴趣的内容，观看操作繁琐，影响观看体验。

发明内容

本发明提出一种视频播放方法、装置和计算机可读存储介质，以降低操作繁琐度。

本发明实施方式的技术方案如下：

一种视频播放方法，包括：

获取用户浏览第一视频时的用户行为，提取与所述用户行为的时间点相关的视频片段的特征；

基于所述视频片段的特征训练深度学习模型；

将第二视频分为各个视频分段，提取各个视频分段的特征，将各个视频分段的特征输入到所述训练后的深度学习模型；

基于所述训练后的深度学习模型对各个视频分段的分类结果，对各个视频分段执行区别播放操作。

在一个实施方式中，所述获取用户浏览第一视频时的用户行为，提取与用户行为的时间点相关的视频片段的特征包括：

获取用户浏览第一视频时的跳过指令；

提取所述跳过指令的时间点之前的、预定时间段的视频片段；

提取所述跳过指令的时间点之前的、预定时间段的视频片段的特征。

获取用户浏览第一视频时的回放指令；

提取所述回放指令的触发时间点与回放播放时间点之间的、自所述回放播放时间点延伸预定时间段的视频片段；

提取所述回放指令的触发时间点与回放播放时间点之间的、自所述回放播放时间点延伸预定时间段的视频片段的特征。

获取用户浏览第一视频时的正常观看操作；

提取所述正常观看操作的起始时间点与结束时间点之间的视频片段；

提取所述正常观看操作的起始时间点与结束时间点之间的视频片段的特征。

在一个实施方式中，所述视频片段的特征包括下列中的至少一个：

视频内容的类型特征；视频内容的场景特征；视频内容的人物特征；视频内容的物品特征。

在一个实施方式中，所述与所述用户行为的时间点相关的视频片段的特征包括：基于回放指令提取的视频片段的特征、基于正常观看操作提取的视频片段的特征和基于跳过指令提取的视频片段的特征；

所述基于视频片段的特征训练深度学习模型包括：

建立特征三元组，所述特征三元组包括基于回放指令提取的视频片段的特征、基于正常观看操作提取的视频片段的特征和基于跳过指令提取的视频片段的特征；

将所述特征三元组输入深度学习模型进行深度学习，以输出特征向量三元组，所述特征向量三元组包括喜欢该视频片段的特征向量、正常对待该视频片段的特征向量和不喜欢该视频片段的特征向量，其中所述深度学习模型的惩罚函数为喜欢该视频片段的特征向量与正常对待该视频片段的特征向量之间的余弦距离大于不喜欢该视频片段的特征向量与正常对待该视频片段的特征向量之间的余弦距离。

在一个实施方式中，还包括：

确定各个视频分段输入到所述训练后的深度学习模型后输出的各个特征向量与所述特征向量三元组中喜欢该视频片段的特征向量之间的余弦距离，将所述余弦距离小于第一预定门限值的视频分段分类为符合用户喜好的视频分段；或

确定各个视频分段输入到所述训练后的深度学习模型后输出的各个特征向量与所述特征向量三元组中不喜欢该视频片段的特征向量之间的余弦距离，将所述余弦距离小于第二预定门限值的视频分段分类为不符合用户喜好的视频分段。

在一个实施方式中，该方法还包括：

确定用户最近播放视频的特征，将用户最近播放视频的特征输入所述训练后的深度学习模型，以获取用户最近播放视频的特征向量；

确定各个视频分段输入到所述训练后的深度学习模型后输出的各个特征向量与所述用户最近播放视频的特征向量之间的余弦距离；

按照余弦距离从小到大的排序顺序，确定一或预定多个的视频分段为符合用户喜好的视频分段。

在一个实施方式中，所述基于深度学习模型对各个视频分段的分类结果，对各个视频分段执行区别播放操作包括下列中的至少一个：

针对分类结果为不符合用户喜好的视频分段，执行跳过播放操作；

针对分类结果为不符合用户喜好的视频分段，执行快进播放操作；

针对分类结果为符合用户喜好的视频分段，执行单次播放操作；

针对分类结果为符合用户喜好的视频分段，执行重复播放操作。

一种视频播放装置，包括：

特征提取模块，用于获取用户浏览第一视频时的用户行为，提取与所述用户行为的时间点相关的视频片段的特征；

训练模块，用于基于所述视频片段的特征训练深度学习模型；

分段模块，用于将第二视频分为各个视频分段，提取各个视频分段的特征，将各个视频分段的特征输入到所述训练后的深度学习模型；

播放模块，用于基于所述训练后的深度学习模型对各个视频分段的分类结果，对各个视频分段执行区别播放操作。

在一个实施方式中，所述特征提取模块，用于获取用户浏览第一视频时的跳过指令；提取所述跳过指令的时间点之前的、预定时间段的视频片段；提取所述跳过指令的时间点之前的、预定时间段的视频片段的特征。

在一个实施方式中，所述特征提取模块，用于获取用户浏览第一视频时的回放指令；提取所述回放指令的触发时间点与回放播放时间点之间的、自所述回放播放时间点延伸预定时间段的视频片段；提取所述回放指令的触发时间点与回放播放时间点之间的、自所述回放播放时间点延伸预定时间段的视频片段的特征。

在一个实施方式中，所述特征提取模块，用于获取用户浏览第一视频时的正常观看操作；提取所述正常观看操作的起始时间点与结束时间点之间的视频片段；提取所述正常观看操作的起始时间点与结束时间点之间的视频片段的特征。

在一个实施方式中，与所述用户行为的时间点相关的视频片段的特征包括：基于回放指令提取的视频片段的特征、基于正常观看操作提取的视频片段的特征和基于跳过指令提取的视频片段的特征；

所述训练模块，用于建立特征三元组，所述特征三元组包括基于回放指令提取的视频片段的特征、基于正常观看操作提取的视频片段的特征和基于跳过指令提取的视频片段的特征；将所述特征三元组输入深度学习模型进行深度学习，以输出特征向量三元组，所述特征向量三元组包括喜欢该视频片段的特征向量、正常对待该视频片段的特征向量和不喜欢该视频片段的特征向量，其中所述深度学习模型的惩罚函数为喜欢该视频片段的特征向量与正常对待该视频片段的特征向量之间的余弦距离大于不喜欢该视频片段的特征向量与正常对待该视频片段的特征向量之间的余弦距离。

在一个实施方式中，所述深度学习模型，用于接收各个视频分段的特征，并确定各个视频分段的各个特征向量与所述特征向量三元组中喜欢该视频片段的特征向量之间的余弦距离，将所述余弦距离小于第一预定门限值的视频分段分类为符合用户喜好的视频分段；或，接收各个视频分段的特征，并确定各个视频分段的各个特征向量与所述特征向量三元组中不喜欢该视频片段的特征向量之间的余弦距离，将所述余弦距离小于第二预定门限值的视频分段分类为不符合用户喜好的视频分段。

在一个实施方式中，分段模块，还用于确定用户最近播放视频的特征，将用户最近播放视频的特征输入所述训练后的深度学习模型，以获取用户最近播放视频的特征向量；

所述深度学习模型，用于接收各个视频分段的特征，并确定各个视频分段的各个特征向量与所述用户最近播放视频的特征向量之间的余弦距离；按照余弦距离从小到大的排序顺序，确定一或预定多个的视频分段为符合用户喜好的视频分段。

在一个实施方式中，所述播放模块，用于执行下列中的至少一个：

一种视频播放装置，包括处理器和存储器；

所述存储器中存储有可被所述处理器执行的应用程序，用于使得所述处理器执行如上任一项所述的视频播放方法。

一种计算机可读存储介质，其中存储有计算机可读指令，该计算机可读指令用于执行如上任一项所述的视频播放方法。

从上述技术方案可以看出，在本发明实施方式中，获取用户浏览第一视频时的用户行为，提取与用户行为的时间点相关的视频片段的特征；基于视频片段的特征训练深度学习模型；将第二视频分为各个视频分段，提取各个视频分段的特征，将各个视频分段的特征输入到训练后的深度学习模型；基于训练后的深度学习模型对各个视频分段的分类结果，对各个视频分段执行区别播放操作。由此可见，本发明实施方式对各个视频分段执行区别播放操作，可以节约用户观看时间，还不需要用户频繁操作，降低了操作繁琐度。

另外，本发明实施方式可以基于用户行为训练出视频分类模型，实现对应于用户喜好的区别播放操作，可以提高用户体验。

附图说明

图1为根据本发明的视频播放方法的流程图。

图2为根据本发明用户行为与视频喜好的关联示意图。

图3为根据本发明视频特征提取的示意图。

图4为根据本发明深度学习模型的训练示意图。

图5为根据本发明基于深度学习模型的视频分段分类示意图。

图6为根据本发明视频播放装置的结构图。

图7为根据本发明具有存储器-处理器架构的视频播放装置的结构图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面结合附图对本发明作进一步的详细描述。

为了描述上的简洁和直观，下文通过描述若干代表性的实施方式来对本发明的方案进行阐述。实施方式中大量的细节仅用于帮助理解本发明的方案。但是很明显，本发明的技术方案实现时可以不局限于这些细节。为了避免不必要地模糊了本发明的方案，一些实施方式没有进行细致地描述，而是仅给出了框架。下文中，“包括”是指“包括但不限于”，“根据……”是指“至少根据……，但不限于仅根据……”。由于汉语的语言习惯，下文中没有特别指出一个成分的数量时，意味着该成分可以是一个也可以是多个，或可理解为至少一个。

在本发明实施方式中，基于人工智能(AI)和视频分析技术，提供基于深度学习的视频播放方法，可以根据用户观看喜好的不同，通过深度学习训练出可以判断视频是否符合用户喜好的模型，以实现区别播放操作。而且，本发明实施方式可以实现自动智能快速播放，在节约时间的同时，不需要用户频繁操作，使观看体验更加轻松愉快。

图1为根据本发明的视频播放方法的流程图。

如图1所示，该方法包括：

步骤101：获取用户浏览第一视频时的用户行为，提取与用户行为的时间点相关的视频片段的特征。

在这里，第一视频为播放历史上曾播放过的视频或当前正在观看的视频。对用户浏览第一视频时的用户行为(比如，跳过、正常观看、回放，等等)进行分析，提取出与用户行为的时间点相关的视频片段的特征，其中该特征可以作为训练数据，在后续步骤中训练出能够判断视频是否符合用户喜好的模型。

在本发明实施方式中，考虑到：当用户观看的视频较长，或者观看多集连续剧时，遇到进展比较缓慢的情节或者自己比较不喜欢的内容时，往往会选择跳过一段内容，直接向后去寻找更加感兴趣的内容。因此，本发明实施方式基于用户观看视频时的这种反馈，进行分析，判断用户喜欢和不喜欢的视频片段特征。

下面举例描述用户行为与对用户视频喜好的关联分析过程。

图2为根据本发明用户行为与视频喜好的关联示意图。其中，用户跳过的片段表示用户不喜欢；回看的片段表示用户喜欢；正常观看的片段表示用户具有正常情绪。

在图2中，从左到右为视频播放的时间轴。时间轴上包含有A、B、C和D四个时间点。用户观看视频过程中的用户行为包括：

(1)、用户在时间点A发出跳过指令，以将视频播放进度由时间点A跳到时间点B，即省略播放了时间点A与时间点B之间的视频内容。由此确定，用户对时间点A之前的视频内容不满意，并发出跳过操作。因此，可以提取时间点A(邻接时间点A)之前的视频，并针对该视频关联标识出用户对该视频不喜欢(dislike)的标签。

(2)、用户在时间点B和时间点C之间，正常观看视频内容。由此确定，用户对时间点B和时间点C之间的视频内容具有普通情绪。因此，因此，可以提取时间点B和时间点C之间之间的视频，并针对该视频关联标识出用户对该视频具有正常(normal)情绪的标签。

(3)、用户在时间点D发出回看指令，以将视频播放进度由时间点D跳到时间点C，即从时间点C开始重新观看视频内容。由此确定，用户对时间点C之后的视频内容满意，并发出回看操作。因此，可以提取时间点C与时间点D之间的视频，并针对该视频关联标识出用户对该视频内容喜欢(like)的标签。

在提取出与用户行为的时间点相关的视频片段(包括：关联标识出用户对该视频不喜欢标签的视频片段、关联标识出用户对该视频正常情绪标签的视频片段和关联标识出用户对该视频喜欢标签的视频片段)后，将视频片段输入视频特征提取网络，以提取出视频片段的视频特征。

以上示范性描述了用户行为与视频喜好的关联示意过程。本领域技术人员可以意识到，这种描述仅是示范性的，并不用于限定本发明实施方式的保护范围。比如，户通过倍速播放观看的视频片段，亦可以判断为用户不喜欢的片段；用户通过视频缩略图逐个快进的片段，缩略图内容亦可以作为用户不喜欢的片段特征，等等。

图3为根据本发明视频特征提取的示意图。

如图3所示，对第一视频的各个视频片段(包括：关联标识出用户对该视频不喜欢标签的视频片段、关联标识出用户对该视频正常情绪标签的视频片段和关联标识出用户对该视频喜欢标签的视频片段)进行采样处理以获取关键图片，然后将关键图片输入特征提取神经网络。特征提取神经网络中对关键图片的图片内容进行分类并采集特征。其中，特征具体包括：视频内容的类型特征(比如，为喜剧、动作剧、科幻剧，等等)；视频内容的场景特征(比如，为足球比赛场景、篮球比赛场景、游戏场景，等等)；视频内容的人物特征(比如，为古装人物、现代人物，等等)；视频内容的物品特征(比如，为足球、篮球，等等)，等等。

具体地，特征提取神经网络可以查看视频片段的附加信息以确定是否包含分类的标签(比如通过视频名称搜索视频介绍，以从视频介绍中获取视频类型)，或特征提取神经网络对视频内容进行采样分析其风格，判断视频类型。

在图3中，示范性描述了基于特征提取神经网络提取第一视频的各个视频片段的特征的具体过程，本领域技术人员可以意识到，这种描述仅是示范性的，并不用于对本发明实施方式进行限定。

在一个实施方式中，步骤101中获取用户浏览第一视频时的用户行为，提取与用户行为的时间点相关的视频片段的特征包括：

获取用户浏览第一视频时的跳过指令；提取所述跳过指令的时间点之前的、预定时间段的视频片段；提取所述跳过指令的时间点之前的、预定时间段的视频片段的特征。

在一个实施方式中，步骤101获取用户浏览第一视频时的用户行为，提取与用户行为的时间点相关的视频片段的特征包括：获取用户浏览第一视频时的回放指令；提取所述回放指令的触发时间点与回放播放时间点之间的、自所述回放播放时间点延伸预定时间段的视频片段；提取所述回放指令的触发时间点与回放播放时间点之间的、自所述回放播放时间点延伸预定时间段的视频片段的特征。

在一个实施方式中，步骤101获取用户浏览第一视频时的用户行为，提取与用户行为的时间点相关的视频片段的特征包括：获取用户浏览第一视频时的正常观看操作；提取所述正常观看操作的起始时间点与结束时间点之间的视频片段；提取所述正常观看操作的起始时间点与结束时间点之间的视频片段的特征。

步骤102：基于所述视频片段的特征训练深度学习模型。

在一个实施方式中，与用户行为的时间点相关的视频片段的特征包括：基于回放指令提取的视频片段的特征、基于正常观看操作提取的视频片段的特征和基于跳过指令提取的视频片段的特征。因此，这些视频片段涵盖了用户喜欢、用户正常情绪与用户不喜欢的三种范例，可以作为训练数据输入到深度学习模型，以训练出能够判断视频是否符合用户喜好的模型。

在一个实施方式中，深度学习模型可以实施为适用于各种视频内容的类型的通用的深度学习模型，比如适用于喜剧、动作剧、科幻剧等全部类型。优选地，深度学习模型与视频内容的类型相对应。比如，为喜剧、动作剧、科幻剧等各种类型的视频，分别设置各自独立的深度学习模型，再基于故对应于各自类型的视频片段的特征训练各自的深度学习模型。比如，利用喜剧类型的视频片段的特征训练喜剧类型的深度学习模型；利用动作剧类型的视频片段的特征训练动作剧类型的深度学习模型。这样，后续可以用对应于各自类型的训练好的深度学习模型，对符合该类型的待识别视频进行分配，以判断待识别视频是否符合用户喜好。对应于各自类型的训练好的深度学习模型，可以更好地为该类型的视频进行识别。

在一个实施方式中，步骤102基于视频片段的特征训练深度学习模型包括：

建立特征三元组，所述特征三元组包括基于回放指令提取的视频片段的特征、基于正常观看操作提取的视频片段的特征和基于跳过指令提取的视频片段的特征；将所述特征三元组输入深度学习模型进行深度学习，以输出特征向量三元组，所述特征向量三元组包括喜欢该视频片段的特征向量、正常对待该视频片段的特征向量和不喜欢该视频片段的特征向量，其中所述深度学习模型的惩罚函数为喜欢该视频片段的特征向量与正常对待该视频片段的特征向量之间的余弦距离大于不喜欢该视频片段的特征向量与正常对待该视频片段的特征向量之间的余弦距离。

图4为根据本发明深度学习模型的训练示意图。

由图4可见，基于回放指令提取的视频片段的特征、基于正常观看操作提取的视频片段的特征和基于跳过指令提取的视频片段的特征共同构成第一视频提取的特征三元组(like,normal,dislike)，该特征三元组涵盖了用户喜欢、用户正常情绪与用户不喜欢的三种范例，并作为训练数据输入到深度学习模型中。其中：like是用户回放观看的第一视频的片段的特征；normal为用正常观看的第一视频的片段的特征；dislike为用户跳过的第一视频的片段的特征。

比如，深度学习模型实施为如图4所示，为一个包括三层线性整流单元(RectifiedLinear UniT，RELU)的卷积神经网络(Convolutional Neural Network，CNN)。将三元组的视频特征输入到深度学习模型进行学习，最终输出特征向量三元组f(video)，f(video)中包括喜欢该视频片段的特征向量f(like)、正常对待该视频片段的特征向量f(normal)和不喜欢该视频片段的特征向量f(dislike)。训练中的惩罚函数需要保证：f(like)比f(dislike)更接近f(normal)，即cos(f(like),f(normal))>cos(f(dislike),f(normal))。其中cos为求余弦距离的函数。训练完成后得到的深度学习模型尤其可以排除掉用户不喜欢的内容。

步骤103：将第二视频分为各个视频分段，提取各个视频分段的特征，将各个视频分段的特征输入到所述训练后的深度学习模型。

在这里，第二视频为需要基于用户是否喜欢观看执行区别播放操作的视频。可以将将第二视频分为多个视频分段，提取每个视频分段的特征，将每个视频分段的特征输入到训练后的深度学习模型，从而由训练后的深度学习模型对每个视频分段进行分类，以确定每个视频分段为用户喜欢或不喜欢。

图5为根据本发明基于深度学习模型的视频分段分类示意图。可见，训练后的深度学习模型相比图4的深度学习模型进一步增加了分类器，用于对f(dislike)进行分类，具体分类为用户喜欢或不喜欢。

具体地，训练后的深度学习模型可以以方式(1)或方式(2)确定每个第二视频的视频分段为用户喜欢或不喜欢。

方式(1)：训练后的深度学习模型确定各个视频分段输入到所述训练后的深度学习模型后输出的各个特征向量与所述特征向量三元组中喜欢该视频片段的特征向量之间的余弦距离，将所述余弦距离小于第一预定门限值的视频分段分类为符合用户喜好的视频分段。

方式(2)：训练后的深度学习模型确定各个视频分段输入到所述训练后的深度学习模型后输出的各个特征向量与所述特征向量三元组中不喜欢该视频片段的特征向量之间的余弦距离，将所述余弦距离小于第二预定门限值的视频分段分类为不符合用户喜好的视频分段。

在方式(1)和方式(2)中，可以直接利用训练后的深度学习模型确定每个第二视频的视频分段为用户喜欢或不喜欢。

可选地，还可以基于用户最近播放视频，利用训练后的深度学习模型确定出符合用户喜好的视频分段。

在一个实施方式中，该方法还包括：

确定用户最近播放视频的特征，将用户最近播放视频的特征输入所述训练后的深度学习模型，以获取用户最近播放视频的特征向量；确定各个视频分段输入到所述训练后的深度学习模型后输出的各个特征向量与所述用户最近播放视频的特征向量之间的余弦距离；按照余弦距离从小到大的排序顺序，确定一或预定多个的视频分段为符合用户喜好的视频分段。

举例，可以基于深度学习模型判断未播放的视频中用户比较喜爱的片段，根据用户选择的播放模式自动快速播放或者提示用户下一个精彩片段。该示范性播放过程包括：(1)、将待观看的视频片段的视频特征作为输入，通过深度学习模型得到特征向量f(video)。(2)、将用户最近观看的视频作为输入，通过深度学习模型得到特征向量f(recent)。(3)、采用求余弦距离的cosine函数计算特征向量f(video)与f(recent)的相似度，选择相似度最高的预定数目个的视频片段，作为用户喜爱的视频结果进行自动播放。

步骤104：基于训练后的深度学习模型对各个视频分段的分类结果，对各个视频分段执行区别播放操作。

在一个实施方式中，所述基于深度学习模型对各个视频分段的分类结果，对各个视频分段执行区别播放操作包括下列中的至少一个：针对分类结果为不符合用户喜好的视频分段，执行跳过播放操作；针对分类结果为不符合用户喜好的视频分段，执行快进播放操作；针对分类结果为符合用户喜好的视频分段，执行单次播放操作；针对分类结果为符合用户喜好的视频分段，执行重复播放操作，等等。

在本发明实施方式中，披露一种基于AI的视频播放方法，尤其适用于长视频播放。首先，采集用户观看视频时的观看、跳过、回看等操作，分析操作点前后的视频片段特征，基于这些视频特征训练深度学习神经网络得到用户喜爱观看的视频模型。再基于此神经网络训练结果，判断将要观看的视频片段是否符合用户喜好，将筛选出来的用户喜爱的片段进行自动或者半自动的播放，或者生成精彩片段集锦，剔除用户不喜欢观看的片段。

基于图1所示的方法，可以在多种应用环境中实施本发明实施方式。

举例(1)：可以实现用户观看电视连续剧时全自动智能快速播放。首先，由用户选择一个多集电视连续剧，开始播放。然后，收集用户观看、跳转、回看等操作，分析用户操作点前后的视频特征，并根据视频特征训练深度学习模型。而且，在模型训练完成后，提示用户可以智能快速播放，待用户确认后启动智能快速播放。

举例(2)：可以实现多集连续剧播放时自动跳跃到下一个精彩片段(快速整段跳过不喜欢内容)。首先，由用户选择一个多集电视连续剧，开始播放。然后，收集用户观看、跳转、回看等操作，分析用户操作点前后的视频特征，并根据视频特征训练深度学习模型。另外，在模型训练完成后，提示用户下一个精彩片段位置，当用户点击跳转按钮后，自动跳到下一个精彩片段开始播放，跳过与当前内容相似的无聊内容。

举例(3)：可以基于训练好的模型生成特定类型视频的快速播放结果。首先，用户观看多个视频，收集用户观看、跳转、回看等操作，分析用户操作点前后的视频特征。再根据视频特征中的视频画面特征训练深度学习模型，例如对于战争类视频训练专有的深度学习神经网络。而且，针对战争类视频模型训练完成后，存储此模型。当用户选中一个新的战争类视频时，自动为用户生成精彩片段集锦，使用户可以快速预览本视频中用户最感兴趣的精彩片段。

以上示范性描述了实施本发明的具体实施方式，本领域技术人员可以意识到，这种描述仅是示范性的，并不用于限定本发明实施方式的保护范围。

基于上述描述，本发明实施方式还提出了一种视频播放装置、图6为根据本发明视频播放装置的结构图。

如图6所示，视频播放装置包括：

特征提取模块601，用于获取用户浏览第一视频时的用户行为，提取与所述用户行为的时间点相关的视频片段的特征；

训练模块602，用于基于所述视频片段的特征训练深度学习模型603；

分段模块604，用于将第二视频分为各个视频分段，提取各个视频分段的特征，将各个视频分段的特征输入到所述训练后的深度学习模型603；

播放模块605，用于基于所述训练后的深度学习模型603对各个视频分段的分类结果，对各个视频分段执行区别播放操作。

在一个实施方式中，特征提取模块601，用于获取用户浏览第一视频时的跳过指令；提取所述跳过指令的时间点之前的、预定时间段的视频片段；提取所述跳过指令的时间点之前的、预定时间段的视频片段的特征。

在一个实施方式中，特征提取模块601，用于获取用户浏览第一视频时的回放指令；提取所述回放指令的触发时间点与回放播放时间点之间的、自所述回放播放时间点延伸预定时间段的视频片段；提取所述回放指令的触发时间点与回放播放时间点之间的、自所述回放播放时间点延伸预定时间段的视频片段的特征。

在一个实施方式中，特征提取模块601，用于获取用户浏览第一视频时的正常观看操作；提取所述正常观看操作的起始时间点与结束时间点之间的视频片段；提取所述正常观看操作的起始时间点与结束时间点之间的视频片段的特征。

在一个实施方式中，所述视频片段的特征包括下列中的至少一个：视频内容的类型特征；视频内容的场景特征；视频内容的人物特征；视频内容的物品特征。

在一个实施方式中，与所述用户行为的时间点相关的视频片段的特征包括：基于回放指令提取的视频片段的特征、基于正常观看操作提取的视频片段的特征和基于跳过指令提取的视频片段的特征；所述训练模块602，用于建立特征三元组，所述特征三元组包括基于回放指令提取的视频片段的特征、基于正常观看操作提取的视频片段的特征和基于跳过指令提取的视频片段的特征；将所述特征三元组输入深度学习模型603进行深度学习，以输出特征向量三元组，所述特征向量三元组包括喜欢该视频片段的特征向量、正常对待该视频片段的特征向量和不喜欢该视频片段的特征向量，其中所述深度学习模型的惩罚函数为喜欢该视频片段的特征向量与正常对待该视频片段的特征向量之间的余弦距离大于不喜欢该视频片段的特征向量与正常对待该视频片段的特征向量之间的余弦距离。

在一个实施方式中，所述深度学习模型603，用于接收各个视频分段的特征，并确定各个视频分段的各个特征向量与所述特征向量三元组中喜欢该视频片段的特征向量之间的余弦距离，将所述余弦距离小于第一预定门限值的视频分段分类为符合用户喜好的视频分段；或，接收各个视频分段的特征，并确定各个视频分段的各个特征向量与所述特征向量三元组中不喜欢该视频片段的特征向量之间的余弦距离，将所述余弦距离小于第二预定门限值的视频分段分类为不符合用户喜好的视频分段。

在一个实施方式中，分段模块604，还用于确定用户最近播放视频的特征，将用户最近播放视频的特征输入所述训练后的深度学习模型，以获取用户最近播放视频的特征向量；所述深度学习模型603，用于接收各个视频分段的特征，并确定各个视频分段的各个特征向量与所述用户最近播放视频的特征向量之间的余弦距离；按照余弦距离从小到大的排序顺序，确定一或预定多个的视频分段为符合用户喜好的视频分段。

在一个实施方式中，播放模块605，用于执行下列中的至少一个：针对分类结果为不符合用户喜好的视频分段，执行跳过播放操作；针对分类结果为不符合用户喜好的视频分段，执行快进播放操作；针对分类结果为符合用户喜好的视频分段，执行单次播放操作；针对分类结果为符合用户喜好的视频分段，执行重复播放操作，等等。

本发明实施方式还提出了具有存储器-处理器架构的视频播放装置。

如图7所示，具有存储器-处理器架构的视频播放装置包括：处理器701和存储器702；其中存储器702中存储有可被处理器701执行的应用程序，用于使得处理器701执行如上任一项所述的视频播放方法。

其中，存储器702具体可以实施为电可擦可编程只读存储器(EEPROM)、快闪存储器(Flash memory)、可编程程序只读存储器(PROM)等多种存储介质。处理器701可以实施为包括一或多个中央处理器或一或多个现场可编程门阵列，其中现场可编程门阵列集成一或多个中央处理器核。具体地，中央处理器或中央处理器核可以实施为CPU或MCU。

需要说明的是，上述各流程和各结构图中不是所有的步骤和模块都是必须的，可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的，可以根据需要进行调整。各模块的划分仅仅是为了便于描述采用的功能上的划分，实际实现时，一个模块可以分由多个模块实现，多个模块的功能也可以由同一个模块实现，这些模块可以位于同一个设备中，也可以位于不同的设备中。

各实施方式中的硬件模块可以以机械方式或电子方式实现。例如，一个硬件模块可以包括专门设计的永久性电路或逻辑器件(如专用处理器，如FPGA或ASIC)用于完成特定的操作。硬件模块也可以包括由软件临时配置的可编程逻辑器件或电路(如包括通用处理器或其它可编程处理器)用于执行特定操作。至于具体采用机械方式，或是采用专用的永久性电路，或是采用临时配置的电路(如由软件进行配置)来实现硬件模块，可以根据成本和时间上的考虑来决定。

本发明还提供了一种机器可读的存储介质，存储用于使一机器执行如本申请所述方法的指令。具体地，可以提供配有存储介质的系统或者装置，在该存储介质上存储着实现上述实施例中任一实施方式的功能的软件程序代码，且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。此外，还可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作。还可以将从存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中，随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作，从而实现上述实施方式中任一实施方式的功能。

用于提供程序代码的存储介质实施方式包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地，可以由通信网络从服务器计算机或云上下载程序代码。

在本文中，“示意性”表示“充当实例、例子或说明”，不应将在本文中被描述为“示意性”的任何图示、实施方式解释为一种更优选的或更具优点的技术方案。为使图面简洁，各图中的只示意性地表示出了与本发明相关部分，而并不代表其作为产品的实际结构。另外，以使图面简洁便于理解，在有些图中具有相同结构或功能的部件，仅示意性地绘示了其中的一个，或仅标出了其中的一个。在本文中，“一个”并不表示将本发明相关部分的数量限制为“仅此一个”，并且“一个”不表示排除本发明相关部分的数量“多于一个”的情形。在本文中，“上”、“下”、“前”、“后”、“左”、“右”、“内”、“外”等仅用于表示相关部分之间的相对位置关系，而非限定这些相关部分的绝对位置。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种视频播放方法，其特征在于，包括：

基于所述视频片段的特征训练深度学习模型；

基于所述训练后的深度学习模型对各个视频分段的分类结果，对各个视频分段执行区别播放操作；该方法还包括：

按照余弦距离从小到大的排序顺序，确定一或预定多个的视频分段为符合用户喜好的视频分段以作为用户喜爱的视频结果进行自动播放。

2.根据权利要求1所述的视频播放方法，其特征在于，所述获取用户浏览第一视频时的用户行为，提取与用户行为的时间点相关的视频片段的特征包括：

获取用户浏览第一视频时的跳过指令；

3.根据权利要求1所述的视频播放方法，其特征在于，所述获取用户浏览第一视频时的用户行为，提取与用户行为的时间点相关的视频片段的特征包括：

获取用户浏览第一视频时的回放指令；

4.根据权利要求1所述的视频播放方法，其特征在于，所述获取用户浏览第一视频时的用户行为，提取与用户行为的时间点相关的视频片段的特征包括：

获取用户浏览第一视频时的正常观看操作；

5.根据权利要求1所述的视频播放方法，其特征在于，所述视频片段的特征包括下列中的至少一个：

6.根据权利要求1所述的视频播放方法，其特征在于，所述与所述用户行为的时间点相关的视频片段的特征包括：基于回放指令提取的视频片段的特征、基于正常观看操作提取的视频片段的特征和基于跳过指令提取的视频片段的特征；

所述基于视频片段的特征训练深度学习模型包括：

7.根据权利要求6所述的视频播放方法，其特征在于，还包括：

8.根据权利要求1-7中任一项所述的视频播放方法，其特征在于，

所述基于深度学习模型对各个视频分段的分类结果，对各个视频分段执行区别播放操作包括下列中的至少一个：

9.一种视频播放装置，其特征在于，包括：

播放模块，用于基于所述训练后的深度学习模型对各个视频分段的分类结果，对各个视频分段执行区别播放操作；

其中所述分段模块，还用于确定用户最近播放视频的特征，将用户最近播放视频的特征输入所述训练后的深度学习模型，以获取用户最近播放视频的特征向量；所述深度学习模型，用于接收各个视频分段的特征，并确定各个视频分段的各个特征向量与所述用户最近播放视频的特征向量之间的余弦距离；按照余弦距离从小到大的排序顺序，确定一或预定多个的视频分段为符合用户喜好的视频分段以作为用户喜爱的视频结果进行自动播放。

10.根据权利要求9所述的视频播放装置，其特征在于，

所述特征提取模块，用于获取用户浏览第一视频时的跳过指令；提取所述跳过指令的时间点之前的、预定时间段的视频片段；提取所述跳过指令的时间点之前的、预定时间段的视频片段的特征。

11.根据权利要求9所述的视频播放装置，其特征在于，

所述特征提取模块，用于获取用户浏览第一视频时的回放指令；提取所述回放指令的触发时间点与回放播放时间点之间的、自所述回放播放时间点延伸预定时间段的视频片段；提取所述回放指令的触发时间点与回放播放时间点之间的、自所述回放播放时间点延伸预定时间段的视频片段的特征。

12.根据权利要求9所述的视频播放装置，其特征在于，

所述特征提取模块，用于获取用户浏览第一视频时的正常观看操作；提取所述正常观看操作的起始时间点与结束时间点之间的视频片段；提取所述正常观看操作的起始时间点与结束时间点之间的视频片段的特征。

13.根据权利要求9所述的视频播放装置，其特征在于，所述视频片段的特征包括下列中的至少一个：

14.根据权利要求9所述的视频播放装置，其特征在于，与所述用户行为的时间点相关的视频片段的特征包括：基于回放指令提取的视频片段的特征、基于正常观看操作提取的视频片段的特征和基于跳过指令提取的视频片段的特征；

15.根据权利要求14所述的视频播放装置，其特征在于，

所述深度学习模型，用于接收各个视频分段的特征，并确定各个视频分段的各个特征向量与所述特征向量三元组中喜欢该视频片段的特征向量之间的余弦距离，将所述余弦距离小于第一预定门限值的视频分段分类为符合用户喜好的视频分段；或，接收各个视频分段的特征，并确定各个视频分段的各个特征向量与所述特征向量三元组中不喜欢该视频片段的特征向量之间的余弦距离，将所述余弦距离小于第二预定门限值的视频分段分类为不符合用户喜好的视频分段。

16.根据权利要求9-15中任一项所述的视频播放装置，其特征在于，

所述播放模块，用于执行下列中的至少一个：

17.一种视频播放装置，其特征在于，包括处理器和存储器；

所述存储器中存储有可被所述处理器执行的应用程序，用于使得所述处理器执行如权利要求1至8中任一项所述的视频播放方法。

18.一种计算机可读存储介质，其特征在于，其中存储有计算机可读指令，该计算机可读指令用于执行如权利要求1至8中任一项所述的视频播放方法。