WO2017071227A1

WO2017071227A1 - 视频处理方法及系统、视频播放器与云服务器

Info

Publication number: WO2017071227A1
Application number: PCT/CN2016/085011
Authority: WO
Inventors: 马进; 唐熊
Original assignee: 乐视控股（北京）有限公司; 乐视移动智能信息技术（北京）有限公司
Priority date: 2015-10-26
Filing date: 2016-06-06
Publication date: 2017-05-04
Also published as: CN105872717A

Abstract

一种视频处理方法及系统、视频播放器与云服务器，视频处理方法包括：接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求；获取视频定位请求中的被选中人脸图片在视频中对应的视频信息，该视频信息中包括被选中人脸图片的标识和被选中人脸图片的至少一段视频段信息；显示被选中人脸图片对应的视频信息。采用本方法及系统，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度提高。

Description

视频处理方法及系统、视频播放器与云服务器

交叉引用

本申请引用于2015年10月26日递交的名称为“视频处理方法及系统、视频播放器与云服务器”的第2015107020937号中国专利申请，其通过引用被全部并入本申请。

技术领域

本发明涉及视频处理技术领域，尤其涉及一种视频处理方法及系统、视频播放器与云服务器。

背景技术

近年来，随着科技的发展，为了给用户提供更加丰富的精神文化生活服务，涌现出来各种各样的视频。为了便于用户观看，用户可以通过电脑或者手机等终端，通过下载或者在线观看的方式，观看用户感兴趣的视频节目。

现有技术中，随着视频节目越来越多，为了便于用户快速查找视频中各个时间段的大致画面。有些客户端可以为用户提供视频缩略图，用户可以通过视频缩略图提前了解视频各个时间段的画面情况，但当视频过长时，缩略图会较多，导致用户难以快速的在视频中定位到自己感兴趣的视频段，从而可能给观看者带来较差的用户体验。为了便于用户从视频中快速定位到自己感兴趣的视频段，有些客户端还提供有部分时间段的剧情提示，这样，用户结合视频缩略图和剧情提示，可以快速定位到用户感兴趣的视频段。

但是，在实现本发明的过程中，发明人发现现有技术中用户需要结合视频缩略图和剧情提示，进行手动操作实现定位用户感兴趣的视频段，导致视频定位的效率较低。

发明内容

本发明实施例提供一种视频处理方法及系统、视频播放器与云服务器，以克服现有技术中视频定位效率较低的缺陷，以实现对视频中某个确定的人脸的所有视频段进行定位，提高视频的定位处理效率。

本发明实施例提供一种视频处理方法，所述方法包括：

接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求；

获取所述视频定位请求中的所述被选中人脸图片在视频中对应的视频信息，所述视频信息中包括所述被选中人脸图片的标识和所述被选中人脸图片的至少一段视频段信息；

显示所述被选中人脸图片对应的所述视频信息。

本发明实施例还提供一种视频处理方法，所述方法包括：

接收视频播放器发送的携带被选中人脸图片的视频定位请求；所述视频定位请求为所述视频播放器接收用户通过人机接口模块发送的；

从预存储的人脸分类数据库中获取所述被选中人脸图片对应的所述视频信息；所述视频信息中包括所述被选中人脸图片的标识和所述被选中人脸图片的至少一段视频段信息；

向所述视频播放器发送所述被选中人脸图片对应的所述视频信息，以供所述视频播放器向用户显示所述被选中人脸图片对应的所述视频信息。

本发明实施例还提供一种视频播放器，包括：

接收模块，用于接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求；

获取模块，用于获取所述视频定位请求中的所述被选中人脸图片在视频中对应的视频信息，所述视频信息中包括所述被选中人脸图片的标识和所述被选中人脸图片的至少一段视频段信息；

显示模块，用于显示所述被选中人脸图片对应的所述视频信息。

本发明实施例还提供一种云服务器，所述云服务器包括：

接收模块，用于接收视频播放器发送的携带被选中人脸图片的视频定位请求；所述视频定位请求为所述视频播放器接收用户通过人机接口模块发送的；

获取模块，用于从预存储的人脸分类数据库中获取所述被选中人脸图片对应的所述视频信息；所述视频信息中包括所述被选中人脸图片的标识和所述被选中人脸图片的至少一段视频段信息；

发送模块，用于向所述视频播放器发送所述被选中人脸图片对应的所述视频信息，以供所述视频播放器向用户显示所述被选中人脸图片对应的所述视频信息。本发明实施例还提供一种视频播放系统，所述视频播放系统包括视频播放器和云服务器，所述视频播放器和所述云服务器通信连接，所述视频播放器采用如上所述的视频播放器，所述云服务器采用如上所述的云服务器。

本发明实施例的视频处理方法及系统、视频播放器与云服务器，通过接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求，获取视频定位请求中的被选中人脸图片在视频中对应的视频信息，并显示被选中人脸图片对应的视频信息。采用本发明实施例的技术方案，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本发明实施例的技术方案，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度非常好。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例的视频处理方法一实施例的流程图；

图2为本发明实施例中的某一人脸标识对应的人脸的PTS分布图；

图3为本发明实施例的视频处理方法另一实施例的流程图；

图4为本发明实施例的视频处理方法再一实施例的流程图；

图5为本发明实施例的视频处理方法又一实施例的流程图；

图6为本发明实施例的视频处理方法再另一实施例的流程图；

图7为本发明实施例的视频播放器一实施例的结构示意图；

图8为本发明实施例的视频播放器另一实施例的结构示意图；

图9为本发明实施例的视频播放器再一实施例的结构示意图；

图10为本发明实施例的视频播放器又一实施例的结构示意图；

图11为本发明实施例的云服务器一实施例的结构示意图；

图12为本发明实施例的云服务器另一实施例的结构示意图；

图13为本发明实施例的视频播放系统实施例的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明的视频处理方法一实施例的流程图。如图1所示，本实施例的视频处理方法，具体可以包括如下步骤：

100、接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求；

本实施例在视频播放器一侧描述本发明的技术方案，该视频播放器即为视频处理系统的客户端。该视频播放器可以安装在例如手机、平板电脑等移动终端上；也可以安装在电脑等非移动终端即普通终端上。具体地，该客户端与用户交互，该视频播放器接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求，其中，该人机接口模块可以为键盘、触控笔或者触摸屏的信息检测与接收模块等等。例如当用户通过手指或者触控笔在触摸屏上、选择被选中人脸，并点击发送视频定位请求对应的按钮时，触摸屏的信息检测与接收模块可以检测到用户发出的该视频定位请求，并获取到该视频定位请求中携带的被选中人脸图片。例如本实施例中用户选择的被选中人脸图片可以为用户所选择的视频中的某一个演员的清晰的人脸照片，或者演员在视频截屏中的人脸。总之，该被选中的人脸图片要求所包括的人脸必须足够清晰，能够便于识别。

101、获取视频定位请求中的被选中人脸图片在视频中对应的视频信息；

本实施例的视频信息中包括被选中人脸图片的标识和该视频中被选中人脸图片对应的至少一段视频段信息，或者进一步还可以包括该被选中人脸图片。由于视频是由一个个演员通过一段段视频段串接而成，本实施例中，可以获取视频定位请求中该被选中人脸图片对应的所有视频信息，其中每一个视频信息可以包括该被选中人脸图片的标识和至少一段视频段信息，其中被选中人脸图片的标识用于唯一标识视频中该被选中人脸图片，可以为该被选中人脸图片的对应的演员的姓名或者艺名，或者当该被选中人脸图片对应演员的姓名或者艺名在该视频中不唯一时，可以使用其他标识(Identification；ID)来唯一标识该被选中人脸图片。视频段为该被选中人脸图片在该视频中出现的视频的片段；该被选中人脸图片在该视频中出现的一个视频片段即为一段视频段；至少一段视频段信息为该被选中人脸图片在该视频中出现的所有视频的片段。例如本实施例的至少一段视频段信息可以包括每一段视频段的起止时间，即该视频段的开始时间和结束时间。

102、显示被选中人脸图片对应的视频信息。

例如，具体可以在视频播放器的界面上显示被选中人脸图片对应的视频信息，这样，即完成了对该被选中人脸图片的视频的定位。用户可以根据所显示的被选中人脸图片的视频信息，选择在该视频播放器上观看定位的该被选中人脸图片的视频。例如本实施例的视频处理方法，可以适用于对一个视频节目中任意一个演员的所有视频信息的定位，方便用户观看该视频中该演员的所有表演。

本实施例的视频处理方法，通过接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求，获取视频定位请求中的被选中人脸图片在视频中对应的视频信息，并显示被选中人脸图片对应的视频信息。采用本实施例的视频处理方法，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本实施例的视频处理方法，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度也非常好。

进一步可选地，在上述实施例的技术方案的基础上，步骤101“获取视频定位请求中的被选中人脸图片在视频中对应的视频信息”，具体可以包括：从预存储的人脸分类数据库中获取被选中人脸图片对应的视频信息。

具体地，本实施例中，在视频播放器即视频播放系统的客户端一侧预存储有人脸分类数据库。这样，当视频播放器与云服务器之间没有网络连接的时候，视频播放器一端也可以自行进行本实施例的视频处理。

进一步可选地，在上述实施例中的“从预存储的人脸分类数据库中获取被选中人脸图片对应的视频信息”之前，本实施例的视频处理方法，还可以包括：建立人脸分类数据库。例如该人脸分类数据库中可以包括多个人脸标识，以及每个人脸标识对应的人脸在视频中对应的视频信息，例如该视频信息可以包括该人脸在视频中的每一段视频段的起止时间。

进一步可选地，上述实施例中的“建立人脸分类数据库”，具体可以包括如下步骤：

(1)对视频中的每一帧视频进行解码，得到一组图像；

视频是由一帧一帧的图像串接而成，对每一帧图像进行解码，可以得到对应的图像，本实施例中，以解码所得图像为RGB图像为例。对该视频的所有帧视频进行解码，可以得到一组RGB图像。

(2)对该组图像中各图像进行人脸检测，获取各图像中的人脸以及人脸的视频播放时间(Presentation Time Stamp；PTS)；

对步骤(1)所得的一组RGB图像中的每一个RGB图像使用人脸检测算法检测人脸。当检测到该RGB图像中包括有人脸的时候，获取该RGB图像中的人脸，以及该RGB图像的在视频播出中的PTS。

(3)根据人脸以及人脸的PTS，生成人脸时间戳数据库；

根据步骤(2)人脸检测得到的人脸以及各人脸的PTS，生成人脸时间戳数据库。即该人脸时间戳数据库中包括人脸以及每一个人脸在视频中的PTS。该人脸时间戳数据库以时间为基准，保存了包括有人脸的图像中每个时刻对应的检测出的人脸，由于一部视频较长，解码出来的图像会过多，以时长90分钟，帧率为30来计算，共需检测90×60×30＝162000张图像。这样的计算量会带来较大的计算负担以及人脸时间戳数据库的存储负担。因此，实际应用中，考虑到视频在短时间内画面变化并不大，在步骤(2)进行人脸检测时，可以考虑改变采样频率，例如每10帧扫描一张图像的人脸，则每秒只需要扫描3张，总计需要90×60×3＝16200张图像即可。

(4)将人脸时间戳数据库中的所有人脸按照各人脸标识进行归类，以使得属于同一人的人脸对应同一个人脸标识；

具体地，步骤(3)所得的人脸时间戳数据库中的所有人脸可能包括好多个演员的人脸，其中有些人脸是某一演员的在不同PTS的人脸，该步骤中，可以按照人脸标识对人脸进行归类，例如可以按照PTS由前向后的顺序，对人脸时间戳数据库中每一个人脸进行识别，例如第一个人脸可以对其设置人脸标识，该人脸标识可以由用户通过人机接口模块输入，例如可以为该人脸对应的演员的姓名或者艺名，或者其他人脸ID，并存储该人脸标识、该人脸以及该人脸的PTS。然后接着按照PTS的顺序，识别人脸时间戳数据库中的第二个人脸，通过特征值匹配算法，判断该人脸与已存储的人脸是否为同一人，如果是，将该人脸的标识设置为已存储的人脸标识，以将属于同一人的人脸对应同一个人脸标识。如果不是同一人，则设置新的人脸标识，依此类推，可以将人脸时间戳数据库中的所有人脸按照各人脸标识进行归类，以使得属于同一人的人脸对应同一个人脸标识。

(5)根据各人脸标识对应的人脸的PTS，估算人脸标识对应的人脸的各段视频段信息；该视频段信息包括视频段的起止时间；

根据步骤(4)的处理，可以对人脸时间戳数据库中的所有人脸按照各人脸标识进行归类，紧接着，本实施例中，可以根据各人脸标识对应的人脸的PTS，确定该人脸标识对应的连续的PTS。因为人脸的视频段需要该人脸在连续的PTS中出现，因此根据该人脸标识对应的连续的PTS可以确定该人脸的连续的视频段，从而可以估算出该人脸标识对应的人脸的各段视频段信息，即视频段的起止时间。例如图2为本发明实施例中的某一人脸标识对应的人脸的PTS分布图。其中横坐标为PTS，纵坐标为该人脸标识对应的人脸出现的概率，0表示没有出现，1表示出现。从图2中可以看出，纵轴值为1且最为密集的那些点对应的PTS组成的一段时间，如时间段3到5可以认为满足出现该人脸的条件。通过分段算法，可以将图2中纵轴值为1对应的点分为若干段，每一段都代表了该人脸对应的演员集中出现的一个视频片段。另外，对于某一段中PTS点的数量少，即视频片段极短的段可以丢弃。例如图2中的人脸分布图可以得到如下的表1所示的视频段信息。

表1

段别	起止时间
1	3s-5s
2	8s-9s

(6)根据各人脸标识对应的各段视频段信息，建立人脸分类数据库。

根据上述得到的每一个人脸标识，以及每一个人脸标识对应的各段视频段信息，建立人脸分类数据库，以及该人脸分类数据库中包括每一个人脸标识，每一个人脸标识对应的人脸在视频中的每一段视频段中的起止时间。这样非常方便根据该人脸分类数据库中该视频中每一个人脸进行视频定位。

例如，本实施例的人脸分类数据库的核心结构体可以采用如下方式表示：

typedefstruct_humanFaceData

{

int face_id；//人脸的ID

char*face_name；//人脸对应人物之名字

double**face_timestamp；//视频片段起止时间

int number_appear；//视频片段的个数

float penrcent_appear；//人脸出现概率

}humanFaceData；

typedef struct_humanFaceDataSet

{

int number_face；//有效的人脸数量<＝N

humanFaceData*human_face_data；//所有人脸对应的分段数据

int SOURCE_ID；//数据生成来源：云服务器端或视频播放器端即客户端

}humanFaceDataSet；

本实施例以在视频播放器一侧即视频播放系统的客户端描述本发明的技术方案，实际应用中，该人脸分类数据库也可以在云服务器端，参见后续实施例的记载。

进一步可选地，在上述实施例的技术方案的基础上，步骤“根据各人脸标识对应的各段视频段信息，建立人脸分类数据库”之后，还可以包括：将人脸分类数据库中的各人脸标识按照在视频中出现的概率由大到小的顺序排列。

具体地，将人脸分类数据库中的各人脸标识按照在视频中出现的概率由大到小的顺序排列，得到各个人脸标识对应的人脸的概率分布表，根据该概率分布表可以直接确定出该视频中的主角配角。可选地，还可以根据各人脸标识对应的人脸出现的概率丢弃出现数量少的人脸，例如，这些概率很小的人脸可能为群众演员，该人脸被用户去定位的概率很小，所以此时可以丢弃概率很小的人脸，以节省人脸分类数据库中的存储空间。

进一步可选地，此时对应的上述实施例的步骤“将人脸分类数据库中的各人脸标识按照在视频中出现的概率由大到小的顺序排列”之后，步骤100“接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求”之前，还可以包括：显示人脸分类数据库中前N个人脸标识对应的人脸图片，N为大于或者等于1的整数；

本实施例中的前N个即指的是各人脸标识按照在视频中出现的概率较大的N个人脸标识，这N个人脸标识即为该视频中的较为重要的角色，重要角色的演员被用户定位的概率较高。因此，视频播放器可以显示人脸分类数据库中出现概率较高的前N个人脸标识中每一个人脸标识对应的人脸图片，这样用户可以从N个人脸中选择一个人脸作为被选中人脸图片，来定位该被选中人脸图片的视频。因此，上述实施例中的步骤100中的“接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求”中的被选中人脸图片可以为用户从N个人脸标识对应的人脸图片中选择的。具体地，用户可以通过人机接口模块从N个人脸中选择一个来发起视频定位请求。另外，上述实施例中的步骤100中的“接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求”中的被选中人脸图片也可以为用户通过人机接口模块输入的，例如，用户知道某一个演员参演了该视频，想要在该视频中定位该演员的所有视频段，可以从网络下载一个包括该演员的被选中人脸图片的图片发起视频定位请求。或者用户也可以通过拍摄照片的形式拍得包括该演员的被选中人脸图片的照片，并发起视频定位请求。

上述实施例的所有方案均以在视频播放系统的客户端一侧即视频播放器一侧建立人脸分类数据库，并进行视频处理。这种方案需要客户端无法连接至云服务器时，执行上述人脸分类数据库建立的功能模块可以部署于视频播放器的引擎中，并在native层及Java层提供相应接口，供视频播放器本地执行相应功能时调用。

需要说明的是，如果在视频播放器一端放置人脸分类数据库，并执行相应功能执行时，需要消耗大量的资源，因此，可选地，上述实施例的步骤“建立人脸分类数据库”之后，当视频播放器与云服务器之间建立通信连接之后，还可以向云服务器发送人脸分类数据库，以供云服务器存储该人脸分类数据库，并在后续视频定位请求中在云服务器一侧定位某一被选中人脸图片的视频信息。

例如，进一步可选地，上述实施例中的步骤101“获取视频定位请求中的被选中人脸图片在视频中对应的视频信息”，具体可以包括如下步骤：

(A)向云服务器发送携带被选中人脸图片的视频定位请求；

(B)接收云服务器发送的视频信息，视频信息为云服务器根据被选中人脸图片从云服务器中预存储的人脸分类数据库中获取的。

本实施例中以在云服务器一侧进行视频定位请求为例。视频播放器接收到用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求之后，视频播放器向云服务器发送携带被选中人脸图片的该视频定位请求。然后云服务器在云服务器一侧预存储的人脸分类数据库中获取该被选中人脸图片对应的视频信息，并发送给视频播放器。对应地，视频播放器接收云服务器发送的视频信息。

在上述实施例的技术方案的基础上，可选地，步骤102“显示被选中人脸图片对应的视频信息”之后，具体还可以包括：根据被选中人脸图片的至少一段视频段信息，将至少一段视频段合并为被选中人脸图片对应的定位视频。

例如，具体地，根据至少一个视频段信息中各视频段的开始时间和终止时间，从视频中获取对应的各段视频段，将各视频段合并在一起，形成该被选中人脸图片对应的定位视频。

上述实施例中的各种可选方案可以采用可结合的方式任意组合，形成本发明的可选实施例，在此不再一一赘述。

上述实施例的视频处理方法，通过建立人脸分类数据库，并在接收用户发送的携带被选中人脸图片的视频定位请求之后，根据人脸分类数据库实现对被选中人脸图片的视频的定位，视频定位效率非常高，且采用上述实施例的技术方案，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度非常好。

图3为本发明实施例的视频处理方法另一实施例的流程图。如图3所示，本实施例的视频处理方法，在上述实施例的技术方案的基础上，描述本发明的一种使用场景。如图3所示，本实施例的视频处理方法，具体可以包括：

200、视频播放器对视频中的每一帧视频进行解码，得到一组图像；

本实施例的使用场景为当用户通过人机接口模块在视频播放器一侧使用视频定位处理功能时，视频播放器与云服务器之间无通信连接，人脸分类数据库的建立以及根据人脸分类数据库进行视频定位请求，均在视频播放器即视频播放系统的客户端一侧进行视频处理为例描述本发明的技术方案。

201、视频播放器对一组图像中各图像进行人脸检测，获取各图像中的人脸以及人脸的PTS；

202、视频播放器根据人脸以及人脸的PTS，生成人脸时间戳数据库；

203、视频播放器将人脸时间戳数据库中的所有人脸按照各人脸标识进行归类，以使得属于同一人的人脸对应同一个人脸标识；

204、视频播放器根据各人脸标识对应的人脸的PTS，估算人脸标识对应的人脸的各段视频段信息；

例如该视频段信息包括视频段的开始时间和终止时间。

205、视频播放器根据各人脸标识对应的各段视频段信息，建立人脸分类数据库；

其中该人脸分类数据库中可以包括人脸标识以及该人脸标识在该视频中对应的各段视频段信息。

206、视频播放器将人脸分类数据库中的各人脸标识按照在视频中出现的概率由大到小的顺序排列；

207、视频播放器在界面上显示人脸分类数据库中前N个人脸标识对应的人脸图片；

其中N为大于或者等于1的整数；本实施例向显示人脸分类数据库中的前N个人脸标识，是为了告知用户该视频中这N个人脸是出现概率较高的重要演员，用户可以知道该视频中的各个主配角。

208、用户通过人机接口模块从N个人脸标识对应的人脸图片中选择一个被选中人脸图片，并发起视频定位请求；

本实施例中是以从视频播放器界面上显示的人脸分类数据库中的前N个人脸标识对应的人脸图片中选择一个人脸图片，作为被选中人脸图片为例。实际应用中，也可以通过拍照的方式或者从网上下载的方式来获取被选中人脸图片，在此不再一一举例。

209、视频播放器接收用户发送的携带被选中人脸图片的视频定位请求；

210、视频播放器从预存储的人脸分类数据库中获取被选中人脸图片对应的视频信息；

视频信息中包括被选中人脸图片的标识和被选中人脸图片的至少一段视频段信息。人脸分类数据库中预存储的被选中人脸图片对应的视频信息中还可以包括各个被选中人脸图片。

具体地，视频播放器可以将被选中人脸图片与人脸分类数据库中每一个人脸图片进行人脸识别，例如可以通过特征值匹配算法进行人脸识别，从而从人脸分类数据库中获取被选中人脸图片对应的视频信息。

211、视频播放器在界面上显示被选中人脸图片对应的视频信息；

用户可以根据视频播放器界面上显示的被选中人脸图片的开始时间和结束时间，点击观看视频信息对应的各段视频段，观看该被选中人脸图片在该视频中对应的所有视频段，了解该被选中人脸图片对应的演员在该视频中的演技。

212、视频播放器根据被选中人脸图片对应的视频信息中的至少一段视频段信息，将至少一段视频段合并为被选中人脸图片对应的定位视频。

本实施例中各步骤的实施，详细可以参考上述相关实施例的记载，在此不再赘述。

本实施例的视频处理方法，通过在视频播放器一侧建立人脸分类数据库，并在接收用户发送的携带被选中人脸图片的视频定位请求之后，根据人脸分类数据库实现对被选中人脸图片的视频的定位，视频定位效率非常高。采用本实施例的视频处理方法，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本实施例的视频处理方法，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度也非常好。

图4为本发明实施例的视频处理方法再一实施例的流程图。如图4所示，本实施例的视频处理方法，具体可以包括如下步骤：

300、接收视频播放器发送的携带被选中人脸图片的视频定位请求；

本实施例中的视频定位请求为视频播放器接收用户通过人机接口模块发送的；本实施例的视频处理方法在云服务器一侧描述本发明的技术上方案。

301、从预存储的人脸分类数据库中获取被选中人脸图片对应的视频信息；

其中本实施例的视频信息中包括被选中人脸图片的标识和被选中人脸图片的至少一段视频段信息；例如该视频信息中还可以包括该被选中人脸图片。详细可以参考上述实施例的记载，在此不再赘述。

302、向视频播放器发送被选中人脸图片对应的视频信息，以供视频播放器向用户显示被选中人脸图片对应的视频信息。

最后云服务器获取到被选中人脸图片对应的视频信息之后，向视频播放器发送该被选中人脸图片对应的视频信息，视频播放器可以在界面上向用户显示被选中人脸图片对应的视频信息，用户根据显示的被选中人脸图片的视频信息，可以观看该被选中人脸图片在该视频中对应的所有视频段，并可以进一步根据这些视频段确定该被选中人脸图片对应的演员在视频中的演技。

本实施例与上述图1所示实施例的区别在，上述图1所示实施例，是以视频播放器即客户端与云服务器之间无通信连接，所有视频处理方案均在视频播放器一侧来实现为例，描述本发明的视频处理方案。

而本实施例在云服务器与视频播放器之间具有通信连接，在视频播放器接收到用户通过人机接口模块发送的视频定位请求之后，可以从预存储的人脸分类数据库中获取被选中人脸图片对应的视频信息；最后再向视频播放器发送被选中人脸图片对应的视频信息，以供视频播放器向用户显示被选中人脸图片对应的视频信息。即具体地通过视频播放器与云服务器之间具有通信连接为例，来描述本发明的技术方案，其各步骤的实现原理类似，详细亦可以参考上述图1所示实施例的记载，在此不再赘述。

本实施例的视频处理方法，通过接收视频播放器发送的携带被选中人脸图片的视频定位请求，并从预存储的人脸分类数据库中获取被选中人脸图片对应的视频信息，向视频播放器发送被选中人脸图片对应的视频信息，以供视频播放器向用户显示被选中人脸图片对应的视频信息，实现根据人脸分类数据库实现对被选中人脸图片的视频的定位，视频定位效率非常高。采用本实施例的视频处理方法，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本实施例的视频处理方法，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度也非常好。

进一步可选地，在上述实施例的技术方案的基础上，在步骤301“从预存储的人脸分类数据库中获取被选中人脸图片对应的视频信息”之前，还可以包括：建立人脸分类数据库。即本实施例中，在云服务器一侧建立人脸分类数据库，该人脸分类数据库的结构以及所包括的信息与上述实施例中在视频播放器一侧建立的人脸分类数据库相同，详细可以参考上述实施例的记载，在此不再赘述。

(a)对视频中的每一帧视频进行解码，得到一组图像；

(b)对一组图像中各图像进行人脸检测，获取各图像中的人脸以及人脸的PTS；

(c)根据人脸以及人脸的PTS，生成人脸时间戳数据库；

(d)将人脸时间戳数据库中的所有人脸按照各人脸标识进行归类，以使得属于同一人的人脸对应同一个人脸标识；

(e)根据各人脸标识对应的人脸的PTS，估算人脸标识对应的人脸的各段视频段信息；该视频段信息包括视频段的起止时间；

(f)根据各人脸标识对应的各段视频段信息，建立人脸分类数据库。

本实施例的上述步骤(a)-(f)与上述图1所示实施例的后续可选技术方案中的步骤(1)-(6)实现建立人脸分类数据库的实现相同，详细可以参考上述实施例的记载，在此不再赘述。

进一步可选地，在上述实施例中的步骤(f)“根据各人脸标识对应的各段视频段信息，建立人脸分类数据库”之后，还可以包括：将人脸分类数据库中的各人脸标识按照在视频中出现的概率由大到小的顺序排列。

或者进一步可选地，在上述实施例中的步骤“将所述人脸分类数据库中的各所述人脸标识按照在所述视频中出现的概率由大到小的顺序排列”之后，步骤300“接收视频播放器发送的携带被选中人脸图片的视频定位请求”之前，还可以包括：向视频播放器发送人脸分类数据库中前N个人脸标识，以供视频播放器向用户显示前N个人脸标识对应的人脸图片，N为大于或者等于1的整数；

此时对应的被选中人脸图片为用户从N个人脸标识对应的人脸图片中选择的；或者被选中人脸图片也可以为用户通过人机接口模块输入的。

或者进一步可选地，云服务器一侧的预存储的人脸分类数据库可以是在视频播放器一侧建立的，并在云服务器一侧与视频播放器一侧有通信连接之后，发送给云服务器的。例如在上述实施例的步骤301“从预存储的人脸分类数据库中获取被选中人脸图片对应的视频信息”之前，还可以包括：接收视频播放器发送的人脸分类数据库。

上述实施例中的各种可选方案，均在云服务器一侧描述本发明的技术方案，具体实现方式亦可以参考视频播放器一侧的实施，在此不再赘述。上述实施例中的各种可选方案可以采用可结合的方式任意组合，形成本发明的可选实施例，在此不再一一赘述。

上述实施例的视频处理方法，通过在云服务器一侧建立人脸分类数据库，并在接收视频播放器发送的携带被选中人脸图片的视频定位请求之后，根据人脸分类数据库实现对被选中人脸图片的视频的定位，并将定位的结构返回给视频播放器，由视频播放器向用户显示，视频定位效率非常高，且采用上述实施例的技术方案，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度非常好。

图5为本发明实施例的视频处理方法又一实施例的流程图。如图5所示，本实施例的视频处理方法，描述本发明的再一种使用场景。如图5所示，本实施例的视频处理方法，具体可以包括：

400、视频播放器对视频中的每一帧视频进行解码，得到一组图像；

本实施例的使用场景为当用户通过人机接口模块在视频播放器一侧使用视频定位处理功能时,视频播放器与云服务器之间无通信连接，人脸分类数据库的建立在视频播放器即视频播放系统的客户端一侧进行，但后续视频播放器与云服务器之间又恢复通信连接，视频播放器将建立的人脸分类数据库又发送给云服务器，由云服务器后续根据人脸分类数据库进行视频定位请求进行视频处理为例描述本发明的技术方案。

401、视频播放器对一组图像中各图像进行人脸检测，获取各图像中的人脸以及人脸的PTS；

402、视频播放器根据人脸以及人脸的PTS，生成人脸时间戳数据库；

403、视频播放器将人脸时间戳数据库中的所有人脸按照各人脸标识进行归类，以使得属于同一人的人脸对应同一个人脸标识；

404、视频播放器根据各人脸标识对应的人脸的PTS，估算人脸标识对应的人脸的各段视频段信息；

例如该视频段信息包括视频段的开始时间和终止时间。

405、视频播放器根据各人脸标识对应的各段视频段信息，建立人脸分类数据库；

406、视频播放器将人脸分类数据库中的各人脸标识按照在视频中出现的概率由大到小的顺序排列；

407、当视频播放器与云服务器建立网络链接，视频播放器可以向云服务器发送该人脸分类数据库；

这样后续可以在云服务器侧进行视频处理，减少视频播放器客户端的资源损耗，提高视频处理效率。

408、云服务器向视频播放器发送人脸分类数据库中前N个人脸标识对应的人脸图片；其中N为大于或者等于1的整数；

409、视频播放器在界面上向用户显示人脸分类数据库中前N个人脸标识对应的人脸图片；

这样用户可以根据显示的人脸确定该视频中的主配角。并进一步可以从中选择一个人脸作为被选中人脸图片发起视频定位请求，以请求查看该被选中人脸图片在该视频中的所有视频段。

410、用户通过人机接口模块从N个人脸标识对应的人脸图片中选择一个被选中人脸图片，并发起视频定位请求；

411、视频播放器接收用户发送的携带被选中人脸图片的视频定位请求，并转发给云服务器；

412、云服务器接收视频定位请求，并从预存储的人脸分类数据库中获取被选中人脸图片对应的视频信息；

具体地，云服务器可以将被选中人脸图片与人脸分类数据库中每一个人脸图片进行人脸识别，例如可以通过特征值匹配算法进行人脸识别，从而从人脸分类数据库中获取被选中人脸图片对应的视频信息。

此时云服务器可以向视频播放器发送被选中人脸图片对应的视频信息；由视频播放器在界面上显示被选中人脸图片对应的视频信息。

或者进一步地，还可以包括如下步骤：

413、云服务器根据被选中人脸图片的对应的视频信息中的至少一段视频段信息，将至少一段视频段合并为被选中人脸图片对应的定位视频；

或者本实施例中，云服务器也可以直接向视频播放服务器发送该被选中人脸图片对应的视频信息，由视频播放器根据被选中人脸图片的对应的视频信息中的至少一段视频段信息，将至少一段视频段合并为被选中人脸图片对应的定位视频。

414、云服务器向视频播放器发送定位视频；

415、视频播放器在界面上向用户显示该被选中人脸图片对应的定位视频。

本实施例中，定位视频为该被选中人脸图片在视频中的所有视频段的集合，当视频播放器在界面上向用户显示该被选中人脸图片对应的定位视频，用户便可以观看该被选中人脸图片在该视频中对应的所有视频段，了解该被选中人脸图片对应的演员在该视频中的演技。

本实施例的视频处理方法，通过在视频播放器一侧建立人脸分类数据库，并当云服务器与视频播放器之间具有通信连接时，由视频播放器向云服务器发送该人脸分类数据库，而后续的视频定位请求处理在云服务器一侧进行，即由云服务器接收视频播放器发送的携带被选中人脸图片的视频定位请求之后，根据人脸分类数据库实现对被选中人脸图片的视频的定位，视频定位效率非常高。采用本实施例的视频处理方法，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本实施例的视频处理方法，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度也非常好。

图6为本发明实施例的视频处理方法再另一实施例的流程图。如图6所示，本实施例的视频处理方法，在上述实施例的技术方案的基础上，描述本发明的再一种使用场景。如图6所示，本实施例的视频处理方法，具体可以包括：

500、云服务器对视频中的每一帧视频进行解码，得到一组图像；

本实施例的使用场景为当用户通过人机接口模块在视频播放器一侧使用视频定位处理功能时,视频播放器与云服务器之间有通信连接，人脸分类数据库的建立在云服务器一侧进行，后续也由云服务器后续根据人脸分类数据库进行视频定位请求进行视频处理为例描述本发明的技术方案。

501、云服务器对一组图像中各图像进行人脸检测，获取各图像中的人脸以及人脸的PTS；

502、云服务器根据人脸以及人脸的PTS，生成人脸时间戳数据库；

503、云服务器将人脸时间戳数据库中的所有人脸按照各人脸标识进行归类，以使得属于同一人的人脸对应同一个人脸标识；

504、云服务器根据各人脸标识对应的人脸的PTS，估算人脸标识对应的人脸的各段视频段信息；

例如该视频段信息包括视频段的开始时间和终止时间。

505、云服务器根据各人脸标识对应的各段视频段信息，建立人脸分类数据库；

506、云服务器将人脸分类数据库中的各人脸标识按照在视频中出现的概率由大到小的顺序排列；

507、云服务器向视频播放器发送人脸分类数据库中前N个人脸标识对应的人脸图片；其中N为大于或者等于1的整数；

508、视频播放器在界面上向用户显示人脸分类数据库中前N个人脸标识对应的人脸图片；

509、用户通过人机接口模块从N个人脸标识对应的人脸图片中选择一个被选中人脸图片，并发起视频定位请求；

或者用户也可以自己通过拍照或者下载图片的方式，通过人机接口模块输入被选中人脸图片，并发起视频定位请求。

510、视频播放器接收用户发送的携带被选中人脸图片的视频定位请求，并转发给云服务器；

511、云服务器接收视频定位请求，并从预存储的人脸分类数据库中获取被选中人脸图片对应的视频信息；

或者进一步地，还可以包括如下步骤：

512、云服务器根据被选中人脸图片的对应的视频信息中的至少一段视频段信息，将至少一段视频段合并为被选中人脸图片对应的定位视频；

513、云服务器向视频播放器发送定位视频；

514、视频播放器在界面上向用户显示该被选中人脸图片对应的定位视频。

本实施例的视频处理方法，通过在云服务器一侧建立人脸分类数据库，而后续的视频定位请求处理在云服务器一侧进行，即由云服务器接收视频播放器发送的携带被选中人脸图片的视频定位请求之后，根据人脸分类数据库实现对被选中人脸图片的视频的定位，视频定位效率非常高。采用本实施例的视频处理方法，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本实施例的视频处理方法，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度也非常好。

图7为本发明实施例的视频播放器一实施例的结构示意图。如图7所示，本实施例的视频播放器，具体可以包括：接收模块10、获取模块11和显示模块12。

其中接收模块10用于接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求；获取模块11与接收模块10连接，获取模块11用于获取接收模块10接收的视频定位请求中的被选中人脸图片在视频中对应的视频信息，视频信息中包括被选中人脸图片的标识和被选中人脸图片的至少一段视频段信息；显示模块12与获取模块11连接，显示模块12用于显示获取模块11获取的被选中人脸图片对应的视频信息。

本实施例的视频播放器，通过采用上述模块实现视频处理的实现机制与上述图1所示方法实施例的实现机制相同，详细可以参考上述图1所示实施例的记载，在此不再赘述。

本实施例的视频播放器，通过采用上述模块实现接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求，获取视频定位请求中的被选中人脸图片在视频中对应的视频信息，并显示被选中人脸图片对应的视频信息。采用本实施例的技术方案，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本实施例的技术方案，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度也非常好。

图8为本发明实施例的视频播放器另一实施例的结构示意图。如图8所示，本实施例的视频播放器，在上述图7所示实施例的技术方案的基础上进一步更加详细地描述本发明的技术方案。

进一步可选地，本实施例的视频播放器中的获取模块11具体用于从预存储的人脸分类数据库中获取被选中人脸图片对应的视频信息。

如图8所示，进一步可选地，本实施例的视频播放器还包括：建立模块13，用于建立人脸分类数据库。此时对应地，获取模块11与建立模块13连接，获取模块11具体用于从建立模块13建立的人脸分类数据库中获取被选中人脸图片对应的视频信息。

如图8所示，进一步可选地，本实施例的视频播放器中，建立模块13，具体包括：解码单元131、人脸检测单元132、人脸时间戳数据库生成单元133、归类单元134、估算单元135和人脸分类数据库生成单元136。

其中解码单元131用于对视频中的每一帧视频进行解码，得到一组图像；人脸检测单元132与解码单元131连接，人脸检测单元132用于对解码单元131得到的一组图像中各图像进行人脸检测，获取各图像中的人脸以及人脸的PTS；人脸时间戳数据库生成单元133与人脸检测单元132连接，人脸时间戳数据库生成单元133用于根据人脸检测单元132检测得到的人脸以及人脸的PTS，生成人脸时间戳数据库；归类单元134与人脸时间戳数据库生成单元133连接，归类单元134用于将人脸时间戳数据库生成单元133生成的人脸时间戳数据库中的所有人脸按照各人脸标识进行归类，以使得属于同一人的人脸对应同一个人脸标识；估算单元135与归类单元134连接，估算单元135用于根据归类单元134归类之后的各人脸标识对应的人脸的PTS，估算人脸标识对应的人脸的各段视频段信息；该视频段信息包括视频段的起止时间；人脸分类数据库生成单元136与估算单元135连接，人脸分类数据库生成单元136用于根据估算单元135得到的各人脸标识对应的各段视频段信息，建立人脸分类数据库。

进一步可选地，如图8所示，本实施例的视频播放器中的建立模块13，还包括：排序单元137，该排序单元137与人脸分类数据库生成单元136连接，排序单元137用于将人脸分类数据库生成单元136生成的人脸分类数据库中的各人脸标识按照在视频中出现的概率由大到小的顺序排列。

此时对应的，获取模块11与人脸分类数据库生成单元136连接，获取模块11具体用于从人脸分类数据库生成单元136建立的人脸分类数据库中获取被选中人脸图片对应的视频信息。

进一步可选地，本实施例的视频播放器中显示模块12还与人脸分类数据库生成单元136连接，显示模块12用于显示经排序后的人脸分类数据库中前N个人脸标识对应的人脸图片，N为大于或者等于1的整数；进一步地，此时被选中人脸图片为用户从N个人脸标识对应的人脸图片中选择的；或者被选中人脸图片为用户通过人机接口模块输入的。

进一步可选地，本实施例的视频播放器中还包括：合并模块14。该合并模块14与人脸分类数据库生成单元136连接，该合并模块14用于根据人脸分类数据库生成单元136生成的人脸分类数据库中的被选中人脸图片的至少一段视频段信息，将至少一段视频段合并为被选中人脸图片对应的定位视频。

本实施例的视频播放器，上述技术方案是以在视频播放器一侧建立人脸分类数据库，并根据用户发送的携带被选中人脸图片的视频定位请求，进行视频处理。

本实施例的视频播放器，通过采用上述模块实现视频处理的实现机制与上述图3所示方法实施例的实现机制相同，详细可以参考上述图3所示实施例的记载，在此不再赘述。

本实施例的视频播放器，通过采用上述模块实现建立人脸分类数据库，并在接收用户发送的携带被选中人脸图片的视频定位请求之后，根据人脸分类数据库实现对被选中人脸图片的视频的定位，视频定位效率非常高。采用本实施例的技术方案，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本实施例的技术方案，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度也非常好。

图9为本发明实施例的视频播放器再一实施例的结构示意图。如图9所示，本实施例的视频播放器，在上述图8所示实施例的技术方案的基础上进一步更加详细地描述本发明的技术方案。

如图9所示，进一步可选地，本实施例的视频播放器中还包括发送模块15。该发送模块15与人脸分类数据库生成单元136连接，用于向云服务器发送人脸分类数据库生成单元136生成的人脸分类数据库。

进一步可选地，本实施例的视频播放器中发送模块15还与接收模块10连接，发送模块15具体还用于向云服务器发送接收模块10接收的携带被选中人脸图片的视频定位请求；接收模块10具体还用于接收云服务器发送的视频信息，视频信息为云服务器根据被选中人脸图片从云服务器中预存储的人脸分类数据库中获取的。

此时对应地，进一步可选地，合并模块14与接收模块10连接，合并模块14用于根据接收模块10接收的视频信息中的被选中人脸图片的至少一段视频段信息，将至少一段视频段合并为被选中人脸图片对应的定位视频。

本实施例的视频播放器，是以在视频播放器一侧建立人脸分类数据库，并将人脸分类数据库发送给云服务器；并当视频播放器接收携带被选中人脸图片的视频定位请求之后，视频播放器向云服务器发送该视频定位请求，并由云服务器根据携带被选中人脸图片的视频定位请求，进行视频处理。

本实施例的视频播放器，通过采用上述模块实现视频处理的实现机制与上述图5所示方法实施例的实现机制相同，详细可以参考上述图5所示实施例的记载，在此不再赘述。

本实施例的视频播放器，通过采用上述模块实现在视频播放器一侧建立人脸分类数据库，并当云服务器与视频播放器之间具有通信连接时，由视频播放器向云服务器发送该人脸分类数据库，而后续的视频定位请求处理在云服务器一侧进行，即由云服务器接收视频播放器发送的携带被选中人脸图片的视频定位请求之后，根据人脸分类数据库实现对被选中人脸图片的视频的定位，视频定位效率非常高。采用本实施例的技术方案，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本实施例的技术方案，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度也非常好。

图10为本发明实施例的视频播放器又一实施例的结构示意图。如图10所示，本实施例的视频播放器，在图7所示实施例的技术方案的基础上，进一步包括如下技术方案。

本实施例的视频播放器中也包括发送模块15。发送模块15与接收模块10连接，发送模块15具体还用于向云服务器发送接收模块10接收的携带被选中人脸图片的视频定位请求；接收模块10具体还用于接收云服务器发送的视频信息，视频信息为云服务器根据被选中人脸图片从云服务器中预存储的人脸分类数据库中获取的。

此时对应地，合并模块14与获取模块11连接，合并模块14用于根据获取模块11获取的视频信息中的被选中人脸图片的至少一段视频段信息，将至少一段视频段合并为被选中人脸图片对应的定位视频。可选地，合并模块14也可以设置在云服务器一侧，此时对应的获取模块11还可以用于直接接收视频服务器发送的该被选中人脸图片对应的定位视频。

本实施例的视频播放器与上述图9所示实施例相比，省去建立模块13。本实施例的视频播放器，是以在云服务器一侧建立人脸分类数据库，并当视频播放器接收携带被选中人脸图片的视频定位请求之后，视频播放器向云服务器发送该视频定位请求，并由云服务器根据携带被选中人脸图片的视频定位请求，进行视频处理。本实施例的视频播放器，采用上述模块实现视频处理的实现机制，详细亦可以参考上述相关方法实施例的记载，在此不再赘述。

本实施例的视频播放器，通过采用上述模块实现接收携带被选中人脸图片的视频定位请求之后，视频播放器向云服务器发送该视频定位请求，并由云服务器根据携带被选中人脸图片的视频定位请求，进行视频处理，视频定位效率非常高。采用本实施例的技术方案，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本实施例的技术方案，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度也非常好。

图11为本发明实施例的云服务器一实施例的结构示意图。如图11所示，本实施例的云服务器包括：接收模块20、获取模块21和发送模块22。其中接收模块20用于接收视频播放器发送的携带被选中人脸图片的视频定位请求；视频定位请求为视频播放器接收用户通过人机接口模块发送的；获取模块21与接收模块20连接，获取模块21用于从预存储的人脸分类数据库中获取接收模块20接收的被选中人脸图片对应的视频信息；视频信息中包括被选中人脸图片的标识和被选中人脸图片的至少一段视频段信息；发送模块22与获取模块21连接，发送模块22用于向视频播放器发送获取模块21获取的被选中人脸图片对应的视频信息，以供视频播放器向用户显示被选中人脸图片对应的视频信息。

本实施例的云服务器，通过采用上述模块实现视频处理的实现机制与上述图4所示方法实施例的实现机制相同，详细可以参考上述图4所示实施例的记载，在此不再赘述。

本实施例的云服务器，通过采用上述模块实现接收视频播放器发送的携带被选中人脸图片的视频定位请求，并从预存储的人脸分类数据库中获取被选中人脸图片对应的视频信息，向视频播放器发送被选中人脸图片对应的视频信息，以供视频播放器向用户显示被选中人脸图片对应的视频信息，实现根据人脸分类数据库实现对被选中人脸图片的视频的定位，视频定位效率非常高。采用本实施例的视频处理方法，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本实施例的视频处理方法，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度也非常好。

图12为本发明实施例的云服务器另一实施例的结构示意图。如图12所示，本实施例的云服务器，在上述图11所示实施例的技术方案的基础上进一步更加详细地描述本发明的技术方案。

如图12所示，本实施例的云服务器还包括：建立模块23，该建立模块23用于建立人脸分类数据库。此时对应地，获取模块21还与建立模块23连接，获取模块21用于从建立模块23建立的人脸分类数据库中获取接收模块20接收的被选中人脸图片对应的视频信息。

如图12所示，进一步可选地，本实施例的云服务器中，建立模块23，具体包括：解码单元231、人脸检测单元232、人脸时间戳数据库生成单元233、归类单元234、估算单元235和人脸分类数据库生成单元236。

其中解码单元231用于对视频中的每一帧视频进行解码，得到一组图像；人脸检测单元232与解码单元231连接，人脸检测单元232用于对解码单元231得到的一组图像中各图像进行人脸检测，获取各图像中的人脸以及人脸的PTS；人脸时间戳数据库生成单元233与人脸检测单元232连接，人脸时间戳数据库生成单元233用于根据人脸检测单元232检测得到的人脸以及人脸的PTS，生成人脸时间戳数据库；归类单元234与人脸时间戳数据库生成单元233连接，归类单元234用于将人脸时间戳数据库生成单元233生成的人脸时间戳数据库中的所有人脸按照各人脸标识进行归类，以使得属于同一人的人脸对应同一个人脸标识；估算单元235与归类单元234连接，估算单元235用于根据归类单元234归类之后的各人脸标识对应的人脸的PTS，估算人脸标识对应的人脸的各段视频段信息；该视频段信息包括视频段的起止时间；人脸分类数据库生成单元236与估算单元235，人脸分类数据库生成单元236用于根据估算单元235得到的各人脸标识对应的各类视频段信息，建立人脸分类数据库。

进一步可选地，如图12所示，本实施例的云服务器中的建立模块23还包括排序单元237，该排序单元237与人脸分类数据库生成单元236连接，排序单元237用于将人脸分类数据库生成单元236生成的人脸分类数据库中的各人脸标识按照在视频中出现的概率由大到小的顺序排列。

此时对应地，获取模块21还与人脸分类数据库生成单元236连接，获取模块21用于从人脸分类数据库生成单元236建立的人脸分类数据库中获取接收模块20接收的被选中人脸图片对应的视频信息。

进一步可选地，本实施例的云服务器中的发送模块22还用于向视频播放器发送人脸分类数据库中前N个人脸标识，以供视频播放器向用户显示前N 个人脸标识，N为大于或者等于1的整数。对应地接收模块20接收的视频定位请求中的被选中人脸图片可以为用户从N个人脸标识对应的人脸图片中选择的；或者该被选中人脸图片可以为用户通过人机接口模块输入的。

本实施例的云服务器，是以在云服务器一侧建立人脸分类数据库，并当接收视频播放器发送的携带被选中人脸图片的视频定位请求之后，由云服务器根据携带被选中人脸图片的视频定位请求，进行视频处理。

本实施例的云服务器，通过采用上述模块实现视频处理的实现机制与上述图6所示方法实施例的实现机制相同，详细可以参考上述图6所示实施例的记载，在此不再赘述。

或者可选地，当人脸分类数据库是在视频播放器一侧建立，并由视频播放器发送给云服务器，由云服务器根据携带被选中人脸图片的视频定位请求，进行视频处理时，此时本实施例的云服务器中的接收模块20还用于接收视频播放器发送的人脸分类数据库。

本实施例的云服务器，通过采用上述模块实现通过在云服务器一侧建立人脸分类数据库，而后续的视频定位请求处理在云服务器一侧进行，即由云服务器接收视频播放器发送的携带被选中人脸图片的视频定位请求之后，根据人脸分类数据库实现对被选中人脸图片的视频的定位，视频定位效率非常高。采用本实施例的技术方案，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本实施例的技术方案，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度也非常好。

图13为本发明实施例的视频播放系统实施例的结构示意图。如图13所示，本实施例的视频播放系统包括视频播放器30和云服务器40，视频播放器30和云服务器40通信连接，例如本实施例的视频播放器30采用如上图9所示实施例的视频播放器，对应地云服务器40采用如上图11所示的云服务器，并且具体可以采用图5所示实施例的视频处理方法来实现视频处理。或者本实施例的视频播放器30采用如上图10所示实施例的视频播放器，对应地云服务器40采用如上图12所示的云服务器，并且具体可以采用图6所示实施例的视频处理方法来实现视频处理。详细可以参考上述相关实施例的记载，在此不再赘述。

本实施例的视频播放系统，通过采用上述视频播放器30和云服务器40可以根据人脸分类数据库实现对被选中人脸图片的视频的定位，视频定位效率非常高。采用本实施例的技术方案，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本实施例的技术方案，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度也非常好。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到至少两个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

工业实用性

本发明的视频处理方法及系统、视频播放器与云服务器，通过接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求，获取视频定位请求中的被选中人脸图片在视频中对应的视频信息，并显示被选中人脸图片对应的视频信息。采用本发明的技术方案，可以弥补现有技术中无法对视频中某个确定的人脸的所有视频段进行定位，导致视频定位的效率较低的缺陷，实现对视频中一个被选中人脸图片的所有视频信息的定位，视频定位效率非常高，且采用本发明的技术方案，方便用户观看该视频中该被选中人脸图片对应的演员的所有表演，用户体验度非常好。

Claims

一种视频处理方法，其特征在于，所述方法包括：

接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求；

获取所述视频定位请求中的所述被选中人脸图片在视频中对应的视频信息，所述视频信息中包括所述被选中人脸图片的标识和所述被选中人脸图片的至少一段视频段信息；

显示所述被选中人脸图片对应的所述视频信息。
根据权利要求1所述的方法，其特征在于，获取所述视频定位请求中的所述被选中人脸图片在视频中对应的视频信息，包括：

从预存储的人脸分类数据库中获取所述被选中人脸图片对应的所述视频信息。
根据权利要求2所述的方法，其特征在于，从预存储的人脸分类数据库中获取所述被选中人脸图片对应的所述视频信息之前，所述方法还包括：

建立所述人脸分类数据库。
根据权利要求3所述的方法，其特征在于，建立所述人脸分类数据库，包括：

对所述视频中的每一帧视频进行解码，得到一组图像；

对所述一组图像中各所述图像进行人脸检测，获取各所述图像中的人脸以及所述人脸的视频播放时间；

根据所述人脸以及所述人脸的视频播放时间，生成人脸时间戳数据库；

将所述人脸时间戳数据库中的所有所述人脸按照各人脸标识进行归类，以使得属于同一人的所述人脸对应同一个所述人脸标识；

根据各所述人脸标识对应的所述人脸的所述视频播放时间，估算所述人脸标识对应的所述人脸的各类所述视频段信息；

根据各所述人脸标识对应的各类所述视频段信息，建立所述人脸分类数据库。
根据权利要求4所述的方法，其特征在于，根据各所述人脸标识对应的各类所述视频段信息，建立所述人脸分类数据库之后，所述方法还包括：

将所述人脸分类数据库中的各所述人脸标识按照在所述视频中出现的概率由大到小的顺序排列。
根据权利要求5所述的方法，其特征在于，将人脸分类数据库中的各人脸标识按照在视频中出现的概率由大到小的顺序排列之后，接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求之前，所述方法还包括：

显示所述人脸分类数据库中前N个所述人脸标识，所述N为大于或者等于1的整数；

进一步地，所述被选中人脸图片为所述用户从所述N个所述人脸标识对应的人脸图片中选择的；或者所述被选中人脸图片为所述用户通过所述人机接口模块输入的。
根据权利要求3所述的方法，其特征在于，建立所述人脸分类数据库之后，所述方法还包括：

向云服务器发送所述人脸分类数据库。
根据权利要求1所述的方法，其特征在于，获取所述视频定位请求中的所述被选中人脸图片在视频中对应的视频信息，包括：

向云服务器发送携带所述被选中人脸图片的所述视频定位请求；

接收所述云服务器发送的所述视频信息，所述视频信息为所述云服务器根据所述被选中人脸图片从所述云服务器中预存储的人脸分类数据库中获取的。
根据权利要求1-8任一所述的方法，其特征在于，显示所述被选中人脸图片对应的所述视频信息之后，所述方法还包括：

根据所述被选中人脸图片的所述至少一段视频段信息，将所述至少一段视频段合并为所述被选中人脸图片对应的定位视频。
一种视频处理方法，其特征在于，所述方法包括：

接收视频播放器发送的携带被选中人脸图片的视频定位请求；所述视频定位请求为所述视频播放器接收用户通过人机接口模块发送的；

从预存储的人脸分类数据库中获取所述被选中人脸图片对应的所述视频信息；所述视频信息中包括所述被选中人脸图片的标识和所述被选中人脸图片的至少一段视频段信息；

向所述视频播放器发送所述被选中人脸图片对应的所述视频信息，以供所述视频播放器向用户显示所述被选中人脸图片对应的所述视频信息。
根据权利要求10所述的方法，其特征在于，所述从预存储的人脸分类数据库中获取所述被选中人脸图片对应的所述视频信息之前，所述方法还包括：

建立所述人脸分类数据库。
根据权利要求11所述的方法，其特征在于，建立所述人脸分类数据库，具体包括：

对所述视频中的每一帧视频进行解码，得到一组图像；

对所述一组图像中各所述图像进行人脸检测，获取各所述图像中的人脸以及所述人脸的视频播放时间；

根据所述人脸以及所述人脸的视频播放时间，生成人脸时间戳数据库；

将所述人脸时间戳数据库中的所有所述人脸按照各人脸标识进行归类，以使得属于同一人的所述人脸对应同一个所述人脸标识；

根据各所述人脸标识对应的所述人脸的所述视频播放时间，估算所述人脸标识对应的所述人脸的各段所述视频段信息；根据各所述人脸标识对应的各段所述视频段信息，建立所述人脸分类数据库。
根据权利要求12所述的方法，其特征在于，根据各所述人脸标识对应的各段所述视频段信息，建立所述人脸分类数据库之后，所述方法还包括：

将所述人脸分类数据库中的各所述人脸标识按照在所述视频中出现的概率由大到小的顺序排列。
根据权利要求13所述的方法，其特征在于，将所述人脸分类数据库中的各所述人脸标识按照在所述视频中出现的概率由大到小的顺序排列之后，接收视频播放器发送的携带被选中人脸图片的视频定位请求之前，所述方法还包括：

向所述视频播放器发送所述人脸分类数据库中前N个所述人脸标识，以供所述视频播放器向所述用户显示所述前N个所述人脸标识，所述N为大于或者等于1的整数；

进一步地，所述被选中人脸图片为所述用户从所述N个所述人脸标识对应的人脸图片中选择的；或者所述被选中人脸图片为所述用户通过所述人机接口模块输入的。
根据权利要求10所述的方法，其特征在于，所述从预存储的人脸分类数据库中获取所述被选中人脸图片对应的所述视频信息之前，所述方法还包括：

接收所述视频播放器发送的所述人脸分类数据库。
一种视频播放器，其特征在于，包括：

接收模块，用于接收用户通过人机接口模块发送的携带被选中人脸图片的视频定位请求；

获取模块，用于获取所述视频定位请求中的所述被选中人脸图片在视频中对应的视频信息，所述视频信息中包括所述被选中人脸图片的标识和所述被选中人脸图片的至少一段视频段信息；

显示模块，用于显示所述被选中人脸图片对应的所述视频信息。
根据权利要求16所述的视频播放器，其特征在于，所述获取模块，具体用于从预存储的人脸分类数据库中获取所述被选中人脸图片对应的所述视频信息。
根据权利要求17所述的视频播放器，其特征在于，所述视频播放器，还包括：

建立模块，用于建立所述人脸分类数据库。
根据权利要求18所述的视频播放器，其特征在于，所述建立模块，具体包括：

解码单元，用于对所述视频中的每一帧视频进行解码，得到一组图像；

人脸检测单元，用于对所述一组图像中各所述图像进行人脸检测，获取各所述图像中的人脸以及所述人脸的视频播放时间；

人脸时间戳数据库生成单元，用于根据所述人脸以及所述人脸的视频播放时间，生成人脸时间戳数据库；

归类单元，用于将所述人脸时间戳数据库中的所有所述人脸按照各人脸标识进行归类，以使得属于同一人的所述人脸对应同一个所述人脸标识；

估算单元，用于根据各所述人脸标识对应的所述人脸的所述视频播放时间，估算所述人脸标识对应的所述人脸的各段所述视频段信息；人脸分类数据库生成单元，用于根据各所述人脸标识对应的各段所述视频段信息，建立所述人脸分类数据库。
根据权利要求19所述的视频播放器，其特征在于，所述建立模块，还包括：

排序单元，用于将所述人脸分类数据库中的各所述人脸标识按照在所述视频中出现的概率由大到小的顺序排列。
根据权利要求20所述的视频播放器，其特征在于，所述显示模块，还用于显示所述人脸分类数据库中前N个所述人脸标识，所述N为大于或者等于1的整数；

进一步地，所述被选中人脸图片为所述用户从所述N个所述人脸标识对应的人脸图片中选择的；或者所述被选中人脸图片为所述用户通过所述人机接口模块输入的。
根据权利要求18所述的视频播放器，其特征在于，所述视频播放器还包括：

发送模块，用于向云服务器发送所述人脸分类数据库。
根据权利要求22所述的视频播放器，其特征在于，所述发送模块，具体还用于向所述云服务器发送携带所述被选中人脸图片的所述视频定位请求；

所述接收模块，具体还用于接收所述云服务器发送的所述视频信息，所述视频信息为所述云服务器根据所述被选中人脸图片从所述云服务器中预存储的人脸分类数据库中获取的。
根据权利要求16-23任一所述的视频播放器，其特征在于，所述视频播放器还包括：

合并模块，用于根据所述被选中人脸图片的所述至少一段视频段信息，将所述至少一段视频段合并为所述被选中人脸图片对应的定位视频。
一种云服务器，其特征在于，所述云服务器包括：

接收模块，用于接收视频播放器发送的携带被选中人脸图片的视频定位请求；所述视频定位请求为所述视频播放器接收用户通过人机接口模块发送的；

获取模块，用于从预存储的人脸分类数据库中获取所述被选中人脸图片对应的所述视频信息；所述视频信息中包括所述被选中人脸图片的标识和所述被选中人脸图片的至少一段视频段信息；

发送模块，用于向所述视频播放器发送所述被选中人脸图片对应的所述视频信息，以供所述视频播放器向用户显示所述被选中人脸图片对应的所述视频信息。
根据权利要求25所述的云服务器，其特征在于，所述云服务器还包括：

建立模块，用于建立所述人脸分类数据库。
根据权利要求26所述的云服务器，其特征在于，所述建立模块，具体包括：

解码单元，用于对所述视频中的每一帧视频进行解码，得到一组图像；

人脸检测单元，用于对所述一组图像中各所述图像进行人脸检测，获取各所述图像中的人脸以及所述人脸的视频播放时间；

人脸时间戳数据库生成单元，用于根据所述人脸以及所述人脸的视频播放时间，生成人脸时间戳数据库；

归类单元，用于将所述人脸时间戳数据库中的所有所述人脸按照各人脸标识进行归类，以使得属于同一人的所述人脸对应同一个所述人脸标识；

估算单元，用于根据各所述人脸标识对应的所述人脸的所述视频播放时间，估算所述人脸标识对应的所述人脸的各段所述视频段信息；人脸分类数据库生成单元，用于根据各所述人脸标识对应的各段所述视频段信息，建立所述人脸分类数据库。
根据权利要求27所述的云服务器，其特征在于，所述建立模块，还包括：

排序单元，用于将所述人脸分类数据库中的各所述人脸标识按照在所述视频中出现的概率由大到小的顺序排列。
根据权利要求28所述的云服务器，其特征在于，所述发送模块，还用于向所述视频播放器发送所述人脸分类数据库中前N个所述人脸标识，以供所述视频播放器向所述用户显示所述前N个所述人脸标识，所述N为大于或者等于1的整数；

进一步地，所述被选中人脸图片为所述用户从所述N个所述人脸标识对应的人脸图片中选择的；或者所述被选中人脸图片为所述用户通过所述人机接口模块输入的。
根据权利要求25所述的云服务器，其特征在于，所述接收模块，还用于接收所述视频播放器发送的所述人脸分类数据库。
一种视频播放系统，其特征在于，所述视频播放系统包括视频播放器和云服务器，所述视频播放器和所述云服务器通信连接，所述视频播放器采用如上权利要求22-24任一所述的视频播放器，所述云服务器采用如上权利要求25-30任一所述的云服务器。