CN113766297A

CN113766297A - 视频处理方法、播放终端及计算机可读存储介质

Info

Publication number: CN113766297A
Application number: CN202110586984.6A
Authority: CN
Inventors: 邓朔
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-05-27
Filing date: 2021-05-27
Publication date: 2021-12-07
Anticipated expiration: 2041-05-27
Also published as: CN113766297B

Abstract

本申请公开了一种视频处理方法、播放终端及计算机可读存储介质，显示标记操作控件；响应于标记操作控件被触发，在视频播放过程中，播放包括有标记图像的视频画面，其中，标记图像用于标记视频画面中的目标人物图像，标记图像的尺寸根据目标人物图像的尺寸而确定。因此，当具有脸盲症的用户在观看例如来自网络媒体的视频时，可以通过标记图像区分视频中的人物角色，而且，标记图像的尺寸根据目标人物图像的尺寸而确定，因此能够降低由于标记图像对视频画面中其它图像的遮挡而产生的影响。所以，本申请能够在不影响用户的观看体验的情况下，达到辅助用户区分当前视频画面中的人物角色的目的。可见，本申请可以广泛应用于视频处理技术中。

Description

视频处理方法、播放终端及计算机可读存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种视频处理方法、播放终端及计算机可读存储介质。

背景技术

面孔识别障碍，又被称之为脸盲，具有脸盲症的用户在观看影视剧集或电影等视频时，会表现为无法区分影视剧集或电影等视频中的人物，进而难以理解剧情的发展，影响观看体验。在目前的技术中，尚无针对上述问题的比较好的解决办法，当具有脸盲症的用户在观看视频时，仅能依靠暂停播放等方式辨认及区分当前视频画面中的人物角色，但这会影响用户观看视频的流畅感，同样影响了用户的观看体验。因此，当具有脸盲症的用户在观看视频时，如何在不影响用户的观看体验的情况下辅助用户区分当前视频画面中的人物角色，是亟待解决的技术问题。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本申请实施例提供了一种视频处理方法、播放终端及计算机可读存储介质，能够在不影响用户的观看体验的情况下，辅助用户区分当前视频画面中的人物角色。

一方面，本申请实施例提供了一种视频处理方法，包括以下步骤：

显示标记操作控件；

响应于所述标记操作控件被触发，在视频播放过程中，播放包括有标记图像的视频画面，其中，所述标记图像用于标记所述视频画面中的目标人物图像，所述标记图像的尺寸根据所述目标人物图像的尺寸而确定。

另一方面，本申请实施例还提供了一种视频处理方法，包括：

接收视频参数请求信息，其中，所述视频参数请求信息由播放终端在检测到标记操作控件被触发的情况下而发送；

根据所述视频参数请求信息获取视频参数信息；

向所述播放终端发送所述视频参数信息，使得所述播放终端在视频播放过程中，根据所述视频参数信息播放包括有标记图像的视频画面，其中，所述标记图像用于标记所述视频画面中的目标人物图像，所述标记图像的尺寸根据所述目标人物图像的尺寸而确定。

另一方面，本申请实施例还提供了一种播放终端，包括：

显示单元，用于显示标记操作控件；

视频播放单元，用于响应于所述标记操作控件被触发，在视频播放过程中，播放包括有标记图像的视频画面，其中，所述标记图像用于标记所述视频画面中的目标人物图像，所述标记图像的尺寸根据所述目标人物图像的尺寸而确定。

可选地，所述标记图像的尺寸根据所述目标人物图像的尺寸而确定，具体为：

当所述视频画面中的所述目标人物图像的尺寸在第一尺寸与第二尺寸之间连续变化，所述标记图像的尺寸在第三尺寸与第四尺寸之间连续变化，其中，所述第一尺寸大于所述第二尺寸，所述第三尺寸大于所述第四尺寸；

或者，

当所述视频画面中的所述目标人物图像的尺寸在第一尺寸与第二尺寸之间切换，所述标记图像的尺寸在第三尺寸与第四尺寸之间切换，其中，所述第一尺寸大于所述第二尺寸，所述第三尺寸大于所述第四尺寸。

可选地，所述标记图像关联有标签信息，所述播放终端还包括：

信息展示单元，用于响应于第一操作指令，在所述视频画面中展示所述标签信息。

可选地，所述视频播放单元包括：

时间戳获取单元，用于获取待播放视频帧图像的显示时间戳；

图像参数获取单元，用于获取与所述显示时间戳对应的图像参数信息，其中，所述图像参数信息包括所述目标人物图像的位置参数、所述目标人物图像的尺寸参数和所述目标人物图像的缩放系数；

图像叠加单元，用于根据所述位置参数、所述尺寸参数和所述缩放系数，在所述待播放视频帧图像中叠加所述标记图像；

图像播放单元，用于显示叠加有所述标记图像的所述待播放视频帧图像。

可选地，所述图像参数获取单元包括：

时间戳发送单元，用于向服务器发送所述显示时间戳，使得所述服务器根据所述显示时间戳获取与所述显示时间戳对应的图像参数信息；

图像参数接收单元，用于接收所述服务器发送的所述图像参数信息。

可选地，所述图像叠加单元包括：

标记位置确定单元，用于根据所述位置参数和所述尺寸参数确定标记位置信息；

标记尺寸确定单元，用于根据所述缩放系数确定标记尺寸信息；

标记叠加单元，用于根据所述标记位置信息和所述标记尺寸信息在所述待播放视频帧图像中叠加所述标记图像。

另一方面，本申请实施例还提供了一种服务器，包括：

接收单元，用于接收视频参数请求信息，其中，所述视频参数请求信息由播放终端在检测到标记操作控件被触发的情况下而发送；

获取单元，用于根据所述视频参数请求信息获取视频参数信息；

发送单元，用于向所述播放终端发送所述视频参数信息，使得所述播放终端在视频播放过程中，根据所述视频参数信息播放包括有标记图像的视频画面，其中，所述标记图像用于标记所述视频画面中的目标人物图像，所述标记图像的尺寸根据所述目标人物图像的尺寸而确定。

或者，

可选地，所述视频参数请求信息为待播放视频帧图像的显示时间戳，所述视频参数信息为与所述显示时间戳对应的图像参数信息，所述图像参数信息用于在所述待播放视频帧图像中叠加所述标记图像。

可选地，所述服务器还包括：

帧图像获取单元，用于获取多个所述待播放视频帧图像；

时间信息获取单元，用于获取多个所述待播放视频帧图像的所述显示时间戳；

检测单元，用于对多个所述待播放视频帧图像进行人脸检测，得到多个所述待播放视频帧图像中的所述目标人物图像的位置参数和尺寸参数；

集合生成单元，用于根据多个所述待播放视频帧图像的播放顺序，将相邻的若干个所述待播放视频帧图像生成帧图像集合，其中，所述帧图像集合中的每一个所述待播放视频帧图像均包括有所述目标人物图像；

缩放系数获取单元，用于对于每一个所述帧图像集合，将首次出现的所述目标人物图像的所述尺寸参数作为参考尺寸参数，根据所述参考尺寸参数和所述帧图像集合中的所述目标人物图像的所述尺寸参数，得到所述帧图像集合中的所述目标人物图像的缩放系数；

参数信息获取单元，用于根据所述显示时间戳、所述位置参数、所述尺寸参数和所述缩放系数得到所述图像参数信息。

可选地，所述缩放系数获取单元包括：

比值计算单元，用于对于所述帧图像集合中的每一个所述目标人物图像，计算所述尺寸参数与所述参考尺寸参数的比值，得到所述帧图像集合中所有所述目标人物图像的缩放比例值；

数据处理单元，用于对所有所述缩放比例值进行数据平滑处理，得到所述帧图像集合中所有所述目标人物图像的缩放系数。

可选地，所述参数信息获取单元包括：

标签获取单元，用于获取所述目标人物图像对应的标签信息；

参数信息获取子单元，用于根据所述标签信息、所述显示时间戳、所述位置参数、所述尺寸参数和所述缩放系数得到所述图像参数信息。

可选地，所述标签获取单元包括：

匹配处理单元，用于将所述目标人物图像与预分类的多个人脸类别进行匹配处理，得到与所述目标人物图像匹配的目标人脸类别；

标签获取子单元，用于获取所述目标人脸类别的标签信息。

可选地，所述服务器还包括：

视频图像获取单元，用于获取多个所述待播放视频帧图像；

人脸检测单元，用于对多个所述待播放视频帧图像进行人脸检测得到多个候选人脸信息；

人脸聚类单元，用于对多个所述候选人脸信息进行人脸聚类处理得到多个人脸信息集合；

标记单元，用于为每一个所述人脸信息集合标记所述标签信息得到多个所述人脸类别。

另一方面，本申请实施例还提供了一种播放终端，包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当至少一个所述程序被至少一个所述处理器执行时，实现如前面以播放终端为执行主体的视频处理方法。

另一方面，本申请实施例还提供了一种计算机可读存储介质，其中存储有处理器可执行的程序，所述处理器可执行的程序被处理器执行时用于实现如前面所述的视频处理方法。

另一方面，本申请实施例还提供了一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在计算机可读存介质中。计算机设备的处理器从计算机可读存储介质读取所述计算机指令，处理器执行所述计算机指令，使得所述计算机设备执行如前面所述的视频处理方法。

本申请实施例中，在视频播放之前或者在视频播放过程中，如果标记操作控件被触发，则播放包括有标记图像的视频画面，其中，标记图像用于标记视频画面中的目标人物图像，标记图像的尺寸根据目标人物图像的尺寸而确定。因此，当具有脸盲症的用户在观看视频时，可以通过标记图像区分视频中的人物角色，从而能够便于理解剧情的发展，提高用户的观看体验；另外，由于标记图像的尺寸根据目标人物图像的尺寸而确定，即是说，当目标人物图像在视频画面中呈现为不同的尺寸时，标记图像也会呈现为不同的尺寸，因此能够降低由于标记图像对视频画面中除目标人物图像之外的其它图像的遮挡而产生的影响。所以，本申请实施例提供的方案能够在不影响用户的观看体验的情况下，辅助用户区分当前视频画面中的人物角色，从而达到辅助用户理解剧情发展的目的。

本申请的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请而了解。本申请的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本申请技术方案的进一步理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本申请的技术方案，并不构成对本申请技术方案的限制。

图1是本申请实施例提供的一种实施环境的示意图；

图2是本申请一种可选实现方式提供的视频处理系统的方案示意图；

图3是本申请实施例提供的一种视频处理方法的流程图；

图4是本申请一个实施方式提供的标记操作控件在播放界面中的示意图；

图5是本申请另一个实施方式提供的标记操作控件在播放界面中的示意图；

图6是本申请另一个实施方式提供的播放界面的示意图；

图7是本申请另一个实施方式提供的标记操作控件在播放界面中的示意图；

图8是本申请一个示例提供的标记图像的第一示意图；

图9是本申请另一个示例提供的标记图像的第二示意图；

图10是本申请另一个示例提供的标记图像的第三示意图；

图11是本申请另一个示例提供的标记图像的第四示意图；

图12是本申请一个具体示例提供的视频画面的第一示意图；

图13是本申请一个具体示例提供的视频画面的第二示意图；

图14是本申请一个具体示例提供的视频画面的第三示意图；

图15是本申请一个具体示例提供的视频画面的第四示意图；

图16是本申请另一个具体示例提供的视频画面的第五示意图；

图17是图3中步骤120的具体方法流程图；

图18是图17中步骤122的具体方法流程图；

图19是图17中步骤123的具体方法流程图；

图20是本申请一个示例提供的标记图像的第一标记位置示意图；

图21是本申请另一个示例提供的标记图像的第二标记位置示意图；

图22是本申请另一个示例提供的标记图像的第三标记位置示意图；

图23是本申请另一个实施例提供的一种视频处理方法的流程图；

图24是本申请实施例提供的图像参数信息的获取方法的流程图；

图25是图24中步骤350的具体方法流程图；

图26是图24中步骤360的具体方法流程图；

图27是本申请实施例提供的预分类的多个人脸类别的获取方法的流程图；

图28是本申请一个具体示例提供的预分类的多个人脸类别的示意图；

图29是本申请实施例提供的一种播放终端的示意图；

图30是本申请实施例提供的一种服务器的示意图。

具体实施方式

下面结合说明书附图和具体的实施例对本申请进行进一步的说明。所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

对本申请实施例进行进一步详细说明之前，对本申请实施例中涉及的名词和术语进行说明，本申请实施例中涉及的名词和术语适用于如下的解释。

1)操作控件，是指用户可与之交互以输入或操作数据的对象。操作控件可以通过对话框或者工具栏等方式展示。

2)标记操作控件，是指用户可进行操作以在视频画面中显示标记图像的控件。

3)响应于，用于表示所执行的操作所依赖的条件或者状态，当满足所依赖的条件或状态时，所执行的一个或多个操作可以是实时的，也可以具有设定的延迟；在没有特别说明的情况下，所执行的多个操作不存在执行先后顺序的限制。

4)视频帧图像：视频内容由一系列视频帧图像组成，通常用每秒传输帧数(FramesPer Second，FPS)表示。每个视频帧图像均是静止图像，当将多个视频帧图像按照顺序进行播放时，可以创建运动图像，即视频内容。

5)脸盲，是指用户在观看影视剧集或电影等视频时，无法区分影视剧集或电影等视频中的人物。

本申请实施例所提供的视频处理方法可以应用于人工智能之中。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

计算机视觉(Computer Vision，CV)：是一门研究如何使机器“看”的科学，更进一步地说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

具有脸盲症的用户在观看影视剧集或电影等视频时，往往会因为无法区分影视剧集或电影等视频中的人物而感到难以理解剧情的发展。为了克服这种情况，这类用户往往只能依靠暂停播放等方式辨认及区分当前视频画面中的人物角色，但是，这会影响用户观看视频的流畅感，从而影响用户的观看体验。

为了能够在不影响观看体验的情况下，辅助具有脸盲症的用户区分当前视频画面中的人物角色，本申请实施例提供了一种视频处理方法、播放终端、服务器及计算机可读存储介质，在视频播放之前或者在视频播放过程中，如果标记操作控件被触发，则播放包括有标记图像的视频画面，其中，标记图像用于标记视频画面中的目标人物图像，标记图像的尺寸根据目标人物图像的尺寸而确定。因此，当具有脸盲症的用户在观看视频时，可以通过标记图像区分视频中的人物角色，从而能够便于理解剧情的发展，提高用户的观看体验；另外，由于标记图像的尺寸根据目标人物图像的尺寸而确定，即是说，当目标人物图像在视频画面中呈现为不同的尺寸时，标记图像也会呈现为不同的尺寸，例如，当视频画面的内容比较丰富而使得目标人物图像的尺寸较小时，标记图像的尺寸也较小，因此，能够降低由于标记图像对视频画面中除目标人物图像之外的其它图像的遮挡而产生的影响。所以，本申请实施例提供的方案能够在不影响用户的观看体验的情况下，辅助用户区分当前视频画面中的人物角色，达到辅助用户理解剧情发展的目的。

本申请实施例提供的方案主要涉及人工智能中计算机视觉的视频处理等技术，具体通过如下实施例进行说明。

图1是本申请实施例提供的一种实施环境的示意图。参照图1，该实施环境包括播放终端101和服务器102。

播放终端101可以是智能手机、平板电脑、笔记本电脑、台式计算机等能够播放视频的终端设备，但并不局限于此。可选地，播放终端101上安装有用于播放影视剧集或电影等视频的播放器应用程序，该播放器应用程序能够响应于用户的操作而播放影视剧集或电影等视频。播放终端101和服务器102之间可以通过有线或无线的通信方式进行直接或间接的连接，本申请实施例对此并不作具体限定。

播放终端101至少具有处理视频以及播放视频等功能，例如能够响应于用户对标记操作控件的触发，在视频播放过程中播放包括有标记图像的视频画面，其中，该标记图像用于标记视频画面中的目标人物图像，并且该标记图像的尺寸根据目标人物图像的尺寸而确定。在本申请实施例中，以播放终端101具有处理视频以及播放视频等功能为例进行说明。

服务器102可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)以及大数据和人工智能平台等基础云计算服务的云服务器。

服务器102至少具有获取并下发用于使播放终端101在视频画面中叠加标记图像的视频参数信息的功能，能够在接收到由播放终端101发送的视频参数请求信息的情况下，根据该视频参数请求信息获取视频参数信息，并向播放终端101发送该视频参数信息，使得播放终端101在视频播放过程中，根据该视频参数信息播放包括有标记图像的视频画面。在本申请实施例中，以服务器102具有获取并向播放终端101下发视频参数信息的功能为例进行说明。

另外，服务器102或者与服务器102关联的其他服务器，还可以根据待播放的视频预先获取并存储视频参数信息，使得服务器102在获取到视频参数请求信息时，根据视频参数请求信息获取视频参数信息。需要说明的是，视频参数信息的存储，可以采用区块链(Blockchain)技术实现。区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中，用户管理模块负责所有区块链参与者的身份信息管理，包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等，并且在授权的情况下，监管和审计某些真实身份的交易情况，提供风险控制的规则配置(风控审计)；基础服务模块部署在所有区块链节点设备上，用来验证业务请求的有效性，并对有效请求完成共识后记录到存储上，对于一个新的业务请求，基础服务先对接口适配解析和鉴权处理(接口适配)，然后通过共识算法将业务信息加密(共识管理)，在加密之后完整一致的传输至共享账本上(网络通信)，并进行记录存储；智能合约模块负责合约的注册发行以及合约触发和合约执行，开发人员可以通过某种编程语言定义合约逻辑，发布到区块链上(合约注册)，根据合约条款的逻辑，调用密钥或者其它的事件触发执行，完成合约逻辑，同时还提供对合约升级注销的功能；运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出，例如：告警、监控网络情况、监控节点设备健康状态等。平台产品服务层提供典型应用的基本能力和实现框架，开发人员可以基于这些基本能力，叠加业务的特性，完成业务逻辑的区块链实现。应用服务层提供基于区块链方案的应用服务给业务参与方进行使用。

在一种可选的实现方式中，如图2所示，播放终端101可以包括前端模块1011，服务器102可以包括有后端模块1021和预处理模块1022，前端模块1011、后端模块1021和预处理模块1022构成了视频处理系统。其中，预处理模块1022用于执行对视频的预处理，例如，先对视频中的人脸进行检测得到多个人脸信息，然后对这些人脸信息进行聚类得到不同的人脸类别，接着将这些人脸类别与视频中的人物角色进行匹配，并为每个人脸类别标记与人物角色对应的标签信息，形成人脸信息数据库。后端模块1021用于执行对视频中人物角色的标记处理，例如，先对视频中的人脸进行检测得到目标人脸图像，并从预处理模块1022的人脸信息数据库中获取与目标人脸图像对应的标签信息，接着对目标人脸图像进行人脸追踪得到目标人脸图像在每一个视频帧图像中的尺寸参数，并根据该目标人脸图像的尺寸参数确定标记图像在每一个视频帧图像中的尺寸参数，然后对标记图像的尺寸参数进行平滑处理，形成标记图像数据库。前端模块1011用于执行对视频的解码及播放处理，例如，先对视频进行解码，然后根据待播放视频帧图像的显示时间戳向后端模块1021请求标记图像的相关参数，前端模块1011在接收到由后端模块1021发送的标记图像的相关参数之后，根据该相关参数在待播放视频帧图像中叠加标记图像，并在视频播放过程中播放包括有该标记图像的视频画面。

在一种可选的实现方式中，播放终端101响应于用户对播放器应用程序的打开操作，显示标记操作控件，当用户触发该标记操作控件，播放终端101向服务器102发送视频参数请求信息；服务器102基于接收到的视频参数请求信息，获取视频参数信息，并向播放终端101发送该视频参数信息；播放终端101基于接收到的视频参数信息，在视频播放过程中，播放包括有标记图像的视频画面，其中，标记图像用于标记视频画面中的目标人物图像，标记图像的尺寸根据目标人物图像的尺寸而确定。

图3是本申请实施例提供的一种视频处理方法的流程图。在本实施例中，以播放终端为执行主体为例进行说明，参照图3，该视频处理方法包括以下步骤110和步骤120。

步骤110：显示标记操作控件。

本步骤中，标记操作控件可以是安装在播放终端中的播放器应用程序自带的控件，也可以是用户在播放器应用程序中额外安装的控件，本实施例对此并不作具体限定。在本步骤中，标记操作控件的显示位置可以有多种不同的实施方式，本实施例对此并不作具体限定。例如，当用户打开播放器应用程序后，可以在播放器应用程序的播放界面中显示该标记操作控件，或者在播放界面的侧边栏中显示该标记操作控件，或者，在用户触发了显示在播放界面中的“更多”按钮或“设置”按钮之后，通过对话框的方式显示该标记操作控件或在播放界面上叠加显示该标记操作控件。另外，在本步骤中，标记操作控件的显示形式也可以有多种不同的实施方式，本实施例对此同样不作具体限定。例如，标记操作控件可以以按钮的形式显示，或者以开关的形式显示，或者以勾选框的形式显示。

下面以不同的实施方式对标记操作控件的显示方式进行说明。

如图4所示，图4是一个实施方式提供的标记操作控件在播放界面中的示意图。在图4中，标记操作控件11以勾选框的形式显示在播放界面12的下方。当用户触发该勾选框使得该勾选框被勾选时，说明用户激活了该标记操作控件11的功能；当用户触发该勾选框使得该勾选框不被勾选时，说明用户去激活了该标记操作控件11的功能。

如图5所示，图5是另一个实施方式提供的标记操作控件在播放界面中的示意图。在图5中，标记操作控件11以开关的形式显示在播放界面12的侧边栏13中。当用户触发该开关使得该开关被打开时，说明用户激活了该标记操作控件11的功能；当用户触发该开关使得该开关被关闭时，说明用户去激活了该标记操作控件11的功能。

如图6和图7所示，图6是另一个实施方式提供的播放界面的示意图，图7是另一个实施方式提供的标记操作控件在播放界面中的示意图。在图6中，播放界面12显示有“更多”按钮14，当用户触发了该“更多”按钮14，播放界面12会显示为如图7所示的形式，在图7中，标记操作控件11以按钮的形式在播放界面12上叠加显示。当用户触发该按钮使得该按钮被选择时，说明用户激活了该标记操作控件11的功能；当用户触发该按钮使得该按钮不被选择时，说明用户去激活了该标记操作控件11的功能。

步骤120：响应于标记操作控件被触发，在视频播放过程中，播放包括有标记图像的视频画面，其中，标记图像用于标记视频画面中的目标人物图像，标记图像的尺寸根据目标人物图像的尺寸而确定。

本步骤中，标记操作控件被触发，可以有多种不同的实施方式，例如，可以是被用户的操作触发，或者可以是被软件触发等，本实施例对此并不作具体限定。其中，标记操作控件被软件触发，可以是播放终端在检测到当前用户为特定用户(如预先录入的用户)时，生成一个触发信号，该触发信号触发标记操作控件。

当播放终端检测到标记操作控件被触发，播放终端可以在视频播放过程中，播放包括有标记图像的视频画面，其中，该标记图像用于标记视频画面中的目标人物图像，因此，当具有脸盲症的用户在观看视频时，可以通过该标记图像区分视频画面中的人物角色，从而能够便于理解剧情的发展，提高用户的观看体验。

需要说明的是，播放终端响应于用户对标记操作控件的触发操作，在视频播放过程中播放包括有标记图像的视频画面，可以有不同的实现场景。例如，当用户在播放界面开始播放视频之前即触发了标记操作控件，那么，在用户触发播放界面中的播放按钮之后，播放界面会播放包括有标记图像的视频画面；又如，在用户触发了播放界面中的播放按钮使得播放界面播放原始的视频内容之后，如果用户触发了标记操作控件，那么，播放界面将会切换为播放包括有标记图像的视频画面。需要说明的是，在播放界面播放包括有标记图像的视频画面的过程中，如果用户再一次触发了标记操作控件，即说明用户关闭了该标记操作控件的功能，此时，播放界面会切换为播放原始的视频内容。

需要说明的是，标记图像与目标人物图像一一对应，当视频画面中包括有多个目标人物图像时，标记图像也会有多个。不同目标人物图像对应的标记图像之间，可以具有不同的形状，或者具有不同的颜色，或者同时具有不同的形状及颜色。例如图8至图11所示，图8至图11分别给出了不同的标记图像的示例。因此，即使视频画面中出现了多个人物角色，用户都可以通过这些不同的标记图像区分不同的人物角色，从而能够便于理解剧情的发展，提高用户的观看体验。

另外，在本步骤中，该标记图像的尺寸根据目标人物图像的尺寸而确定，即是说，当目标人物图像在视频画面中呈现为不同的尺寸时，标记图像也会呈现为不同的尺寸，从而能够降低由于标记图像对视频画面中除目标人物图像之外的其它图像的遮挡而产生的影响。例如，当视频画面的内容比较丰富但目标人物图像的尺寸较小时，标记图像的尺寸可以为较小的尺寸；当视频画面的内容比较单调但目标人物图像的尺寸较大时，标记图像的尺寸可以为较大的尺寸；当视频画面的内容比较丰富但目标人物图像的尺寸较大时，标记图像的尺寸可以为较小的尺寸；当视频画面的内容比较单调但目标人物图像的尺寸较小时，标记图像的尺寸可以为较大的尺寸。

需要说明的是，标记图像的尺寸根据目标人物图像的尺寸而确定，具体可以为：当视频画面中的目标人物图像的尺寸在第一尺寸与第二尺寸之间连续变化，则标记图像的尺寸会在第三尺寸与第四尺寸之间连续变化，其中，第一尺寸大于第二尺寸，第三尺寸大于第四尺寸；或者，当视频画面中的目标人物图像的尺寸在第一尺寸与第二尺寸之间切换，则标记图像的尺寸会在第三尺寸与第四尺寸之间切换；其中，第一尺寸大于第二尺寸，第三尺寸大于第四尺寸。例如图12至图15所示，图12和图13为一个具体示例提供的在同一场景下目标人物图像从远处移动到近处的画面示意图。当目标人物图像15在如图12所示的位置移动到如图13所示的位置时，目标人物图像15的尺寸由小变大，而标记图像16的尺寸也由小变大。图14和图15为一个具体示例提供的目标人物图像在镜头切换时的前后两个镜头画面的示意图。当目标人物图像15在如图14所示的镜头画面切换到如图15所示的镜头画面时，目标人物图像15由小尺寸切换为大尺寸，而标记图像16也由小尺寸切换为大尺寸。

本实施例中，通过采用包括有前面步骤110和步骤120的视频处理方法，在视频播放之前或者在视频播放过程中，如果用户触发标记操作控件，则播放包括有标记图像的视频画面，其中，标记图像用于标记视频画面中的目标人物图像，标记图像的尺寸根据目标人物图像的尺寸而确定。因此，当具有脸盲症的用户在观看视频时，可以通过标记图像区分视频中的人物角色，从而能够便于理解剧情的发展，提高用户的观看体验；另外，由于标记图像的尺寸根据目标人物图像的尺寸而确定，即是说，当目标人物图像在视频画面中呈现为不同的尺寸时，标记图像也会呈现为不同的尺寸，因此能够降低由于标记图像对视频画面中除目标人物图像之外的其它图像的遮挡而产生的影响。所以，本实施例能够在不影响用户的观看体验的情况下，辅助用户区分当前视频画面中的人物角色，从而达到辅助用户理解剧情发展的目的。

另外，本申请的一个实施例，对该视频处理方法进行进一步的说明，在标记图像关联有标签信息的情况下，该视频处理方法具体还可以包括有以下步骤：

响应于第一操作指令，在视频画面中展示标签信息。

本实施例中，标签信息可以是对目标人物图像的角色介绍，例如目标人物图像的性格介绍、喜好介绍等，也可以是用于区分角色关系的文字描述，例如主角、配角等，本实施例对此并不作具体限定。因此，在播放界面播放包括有标记图像的视频画面，并且标记图像关联有标签信息的情况下，如果用户进行了第一操作而使得播放终端检测到第一操作指令，则播放终端可以响应于该第一操作指令，在视频画面中展示标签信息，使得用户能够通过该标签信息进一步理解人物角色，从而便于用户理解剧情的发展。

需要说明的是，用户进行的第一操作可以有不同的实施方式，例如，第一操作可以是用户点击标记图像，也可以是用户将指示光标移动到标记图像所在的图像区域，本实施例对此并不作具体限定。当用户点击标记图像或将指示光标移动到标记图像所在的图像区域时，会产生一个第一操作指令，此时，播放终端会响应该第一操作指令在视频画面中展示标签信息。例如图16所示，图16是另一个具体示例提供的视频画面的示意图，在图16中，当用户点击标记图像16时，视频画面中会展示出目标人物图像15所对应的标签信息17。

需要说明的是，标签信息在视频画面中的展示位置，可以为在视频画面中目标人物图像所处位置之外的其他位置，例如可以在背景颜色比较一致的区域，或者可以在背景景象比较单调的区域，因此，标签信息并不会遮挡目标人物图像，不会影响用户对剧情发展的理解，也不会影响用户的观看体验。

参照图17所示，本申请的一个实施例，对步骤120中的播放包括有标记图像的视频画面进行进一步的说明，步骤120中的播放包括有标记图像的视频画面，可以包括但不限于有步骤121、步骤122、步骤123和步骤124。

步骤121：获取待播放视频帧图像的显示时间戳。

本步骤中，当播放终端检测到用户触发了标记操作控件，播放终端会先获取待播放视频帧图像的显示时间戳(Presentation Time Stamp，PTS)，从而便于后续步骤可以根据该显示时间戳获取对应的图像参数信息。

步骤122：获取与显示时间戳对应的图像参数信息，其中，图像参数信息包括目标人物图像的位置参数、目标人物图像的尺寸参数和目标人物图像的缩放系数。

本步骤中，由于在步骤121中获取到了待播放视频帧图像的显示时间戳，因此可以获取与该显示时间戳对应的图像参数信息，以便于后续步骤中可以根据该图像参数信息中的位置参数、尺寸参数和缩放系数在待播放视频帧图像中叠加标记图像。

需要说明的是，播放终端在下载待播放视频帧图像时，可以同步下载并保存该待播放视频帧图像对应的图像参数信息，因此，当播放终端获取到该待播放视频帧图像的显示时间戳后，可以根据该显示时间戳在本地获取对应的图像参数信息。另外，播放终端在下载待播放视频帧图像时，也可以不下载该待播放视频帧图像对应的图像参数信息，在这种情况下，当播放终端获取到该待播放视频帧图像的显示时间戳后，可以通过请求服务器下发的方式获取与该显示时间戳对应的图像参数信息。

需要说明的是，目标人物图像在待播放视频帧图像中的位置可以通过例如矩形框的方式确定，在这种情况下，目标人物图像的尺寸参数可以是该矩形框的长度值和宽度值，而目标人物图像的位置参数则可以是该矩形框的中心在待播放视频帧图像中的位置坐标，或者可以是该矩形框的任意一个角在待播放视频帧图像中的位置坐标，本实施例对此并不作具体限定。另外，目标人物图像的缩放系数可以确定目标人物图像在每一个待播放视频帧图像中的尺寸大小。在一种可选的实现方式中，可以设定某一个待播放视频帧图像中的目标人物图像的尺寸为参考尺寸，而该目标人物图像在其他待播放视频帧图像中的尺寸与该参考尺寸的比值，即为该目标人物图像的缩放系数。

步骤123：根据位置参数、尺寸参数和缩放系数，在待播放视频帧图像中叠加标记图像。

本步骤中，由于在步骤122中获取到了与显示时间戳对应的图像参数信息，并且该图像参数信息包括有目标人物图像的位置参数、目标人物图像的尺寸参数和目标人物图像的缩放系数，因此，可以根据目标人物图像的位置参数、目标人物图像的尺寸参数和目标人物图像的缩放系数，在待播放视频帧图像中叠加标记图像，以便于后续步骤可以显示叠加有该标记图像的待播放视频帧图像，达到播放包括有标记图像的视频画面的目的。

需要说明的是，由于标记图像的尺寸根据目标人物图像的尺寸而确定，因此，根据目标人物图像的缩放系数可以确定标记图像的缩放系数，从而可以便于根据标记图像的缩放系数确定每一个待播放视频帧图像中标记图像的尺寸。

步骤124：显示叠加有标记图像的待播放视频帧图像。

本步骤中，由于在步骤123中执行了在待播放视频帧图像中叠加标记图像的操作，因此可以通过播放界面显示叠加有标记图像的待播放视频帧图像，从而达到播放包括有标记图像的视频画面的目的。由于标记图像是叠加在待播放视频帧图像中的，因此，当用户再次触发标记操作控件以关闭标记操作控件的功能时，可以将叠加在待播放视频帧图像中的标记图像去除，还原待播放视频帧图像，使得播放界面能够显示原始的待播放视频帧图像，以满足用户的不同观看需求。

参照图18所示，本申请的一个实施例，对步骤122中的获取与显示时间戳对应的图像参数信息进行进一步的说明，步骤122中的获取与显示时间戳对应的图像参数信息，可以包括但不限于有步骤1221和步骤1222。

步骤1221：向服务器发送显示时间戳，使得服务器根据显示时间戳获取与显示时间戳对应的图像参数信息。

本步骤中，由于在步骤121中获取到了待播放视频帧图像的显示时间戳，因此可以向服务器发送该显示时间戳，使得服务器可以根据该显示时间戳获取与该显示时间戳对应的图像参数信息，以便于播放终端能够接收由服务器发送的该图像参数信息，并根据该图像参数信息在待播放视频帧图像中叠加标记图像。

需要说明的是，服务器中可以预先保存有与待播放视频帧图像对应的图像参数信息，该图像参数信息可以以显示时间戳作为键值保存在服务器中，因此，当服务器接收到来自播放终端的显示时间戳后，服务器可以根据该显示时间戳索引到对应的图像参数信息。

步骤1222：接收服务器发送的图像参数信息。

本步骤中，由于播放终端在步骤1221中向服务器发送了显示时间戳以使得服务器获取到对应的图像参数信息，因此播放终端可以接收由服务器发送的该图像参数信息，以便于后续步骤中可以根据该图像参数信息在待播放视频帧图像中叠加标记图像。

参照图19所示，本申请的一个实施例，对步骤123进行进一步的说明，该步骤123可以包括但不限于有以下步骤：

步骤1231：根据位置参数和尺寸参数确定标记位置信息；

步骤1232：根据缩放系数确定标记尺寸信息；

步骤1233：根据标记位置信息和标记尺寸信息在待播放视频帧图像中叠加标记图像。

本实施例中，由于在步骤122中获取到了图像参数信息，并且图像参数信息包括有目标人物图像的位置参数、目标人物图像的尺寸参数和目标人物图像的缩放系数，因此可以根据位置参数和尺寸参数确定标记图像在待播放视频帧图像中的标记位置信息、根据缩放系数确定标记图像在待播放视频帧图像中的标记尺寸信息，以及根据标记位置信息和标记尺寸信息在待播放视频帧图像中叠加标记图像，使得播放终端能够播放包括有该标记图像的视频画面。

需要说明的是，由于目标人物图像的缩放系数可以根据该目标人物图像在其他待播放视频帧图像中的尺寸与参考尺寸的比值而得到，其中，参考尺寸为预先设定的某一个待播放视频帧图像中的目标人物图像的尺寸，而标记图像的尺寸根据目标人物图像的尺寸而确定，因此，可以将目标人物图像的缩放系数作为标记图像的缩放系数，然后在该参考尺寸所对应的待播放视频帧图像中设定一个标记图像的初始尺寸，接着，根据该初始尺寸和该缩放系数的乘积，即可得到标记图像在其他待播放视频帧图像中的标记尺寸信息。

需要说明的是，根据标记位置信息和标记尺寸信息在待播放视频帧图像中叠加的标记图像，可以有不同的实施方式，例如图20至图22所示，图20至图22分别给出了不同标记位置信息的标记图像的示例。如图20所示，当根据位置参数和尺寸参数确定用于表示目标人物图像的矩形框18处于待播放视频帧图像的中间位置时，标记位置信息可以为在该矩形框18的上方并对应于该矩形框18的中心的坐标值，因此，根据该标记位置信息可以确定标记图像16的位置处于该矩形框18的上方并对应于该矩形框18的中心。另外，当根据位置参数和尺寸参数确定用于表示目标人物图像的矩形框18靠近待播放视频帧图像的上方边界，并且该矩形框18与待播放视频帧图像的上方边界之间的距离不满足标记尺寸信息的要求时，如图21所示，标记位置信息可以为该矩形框18的左上角的坐标值，此时，根据该标记位置信息可以确定标记图像16的位置处于该矩形框18的左上角；或者，如图22所示，标记位置信息可以为该矩形框18的右上角的坐标值，此时，根据该标记位置信息可以确定标记图像16的位置处于该矩形框18的右上角。

参照图23所示，图23是本申请另一个实施例提供的一种视频处理方法的流程图。在本实施例中，以服务器为执行主体为例进行说明，参照图23，该视频处理方法包括以下步骤210、步骤220和步骤230。

步骤210：接收视频参数请求信息。

本步骤中，视频参数请求信息由播放终端在检测到标记操作控件被触发的情况下而发送。视频参数请求信息可以为用于请求整个视频源的信息，也可以为用于请求部分的待播放视频帧图像的相关参数信息，本实施例对此并不作具体限定。

步骤220：根据视频参数请求信息获取视频参数信息。

本步骤中，由于服务器在步骤210中接收到了视频参数请求信息，因此可以根据该视频参数请求信息获取视频参数信息。需要说明的是，根据视频参数请求信息的不同，视频参数信息也会有所不同。例如，当视频参数请求信息为用于请求整个视频源的信息时，视频参数信息为整个视频源，其中，该视频源是预先经过处理的叠加有用于标记目标人物图像的标记图像的视频信息；当视频参数请求信息为待播放视频帧图像的显示时间戳时，视频参数信息为与该显示时间戳对应的图像参数信息，其中，该图像参数信息用于在待播放视频帧图像中叠加标记图像。

步骤230：向播放终端发送视频参数信息，使得播放终端在视频播放过程中，根据视频参数信息播放包括有标记图像的视频画面，其中，标记图像用于标记视频画面中的目标人物图像，标记图像的尺寸根据目标人物图像的尺寸而确定。

本步骤中，由于服务器在步骤220中获取到了视频参数信息，因此可以将该视频参数信息发送至播放终端，使得播放终端能够在视频播放过程中，根据该视频参数信息播放包括有标记图像的视频画面，其中，该标记图像用于标记视频画面中的目标人物图像，因此，当具有脸盲症的用户在观看视频时，可以通过该标记图像区分视频画面中的人物角色，从而能够便于理解剧情的发展，提高用户的观看体验。

需要说明的是，标记图像的尺寸根据目标人物图像的尺寸而确定，具体可以为：当视频画面中的目标人物图像的尺寸在第一尺寸与第二尺寸之间连续变化，则标记图像的尺寸会在第三尺寸与第四尺寸之间连续变化，其中，第一尺寸大于第二尺寸，第三尺寸大于第四尺寸；或者，当视频画面中的目标人物图像的尺寸在第一尺寸与第二尺寸之间切换，则标记图像的尺寸会在第三尺寸与第四尺寸之间切换；其中，第一尺寸大于第二尺寸，第三尺寸大于第四尺寸。例如图12至图15所示，图12和图13为一个具体示例提供的在同一场景下目标人物图像从远处移动到近处的画面示意图。当目标人物图像15在如图12所示的位置移动到如图13所示的位置时，目标人物图像15的尺寸由小变大，而标记图像16的尺寸也由小变大。图14和图15为另一个具体示例提供的目标人物图像在镜头切换时的前后两个镜头画面的示意图。当目标人物图像15在如图14所示的镜头画面切换到如图15所示的镜头画面时，目标人物图像15由小尺寸切换为大尺寸，而标记图像16也由小尺寸切换为大尺寸。

本实施例中，通过采用包括有前面步骤210至步骤230的视频处理方法，当服务器接收到由播放终端在检测到标记操作控件被触发的情况下发送的视频参数请求信息时，服务器可以根据该视频参数请求信息获取视频参数信息，并向播放终端发送该视频参数信息，使得播放终端在视频播放过程中，能够根据该视频参数信息播放包括有标记图像的视频画面，其中，标记图像用于标记视频画面中的目标人物图像，标记图像的尺寸根据目标人物图像的尺寸而确定。因此，当具有脸盲症的用户在观看视频时，可以通过标记图像区分视频中的人物角色，从而能够便于理解剧情的发展，提高用户的观看体验；另外，由于标记图像的尺寸根据目标人物图像的尺寸而确定，即是说，当目标人物图像在视频画面中呈现为不同的尺寸时，标记图像也会呈现为不同的尺寸，因此能够降低由于标记图像对视频画面中除目标人物图像之外的其它图像的遮挡而产生的影响。所以，本实施例能够在不影响用户的观看体验的情况下，辅助用户区分当前视频画面中的人物角色，从而达到辅助用户理解剧情发展的目的。

参照图24所示，本申请的一个实施例，对图像参数信息的获取方法进行详细的说明，图像参数信息的获取方法由服务器执行，图像参数信息可以由以下步骤得到：

步骤310：获取多个待播放视频帧图像；

步骤320：获取多个待播放视频帧图像的显示时间戳；

步骤330：对多个待播放视频帧图像进行人脸检测，得到多个待播放视频帧图像中的目标人物图像的位置参数和尺寸参数；

步骤340：根据多个待播放视频帧图像的播放顺序，将相邻的若干个待播放视频帧图像生成帧图像集合，其中，帧图像集合中的每一个待播放视频帧图像均包括有目标人物图像；

步骤350：对于每一个帧图像集合，将首次出现的目标人物图像的尺寸参数作为参考尺寸参数，根据参考尺寸参数和帧图像集合中的目标人物图像的尺寸参数，得到帧图像集合中的目标人物图像的缩放系数；

步骤360：根据显示时间戳、位置参数、尺寸参数和缩放系数得到图像参数信息。

本实施例中，由于图像参数信息包括有目标人物图像的位置参数、目标人物图像的尺寸参数和目标人物图像的缩放系数，并且图像参数信息以显示时间戳作为键值保存在服务器中，所以，图像参数信息包括有显示时间戳、目标人物图像的位置参数、目标人物图像的尺寸参数和目标人物图像的缩放系数。因此，在获取图像参数信息时，可以先执行步骤310得到多个待播放视频帧图像，再执行步骤320和步骤330，得到这些待播放视频帧图像的显示时间戳以及这些待播放视频帧图像中的目标人物图像的位置参数和尺寸参数，然后执行步骤340和步骤350得到目标人物图像的缩放系数，接着根据该显示时间戳、该位置参数、该尺寸参数和该缩放系数得到图像参数信息。

需要说明的是，在执行步骤320获取多个待播放视频帧图像的显示时间戳时，可以将这些显示时间戳以如下方式进行记录：

其中，Video表示这些待播放视频帧图像的集合，

表示每一个待播放视频帧图像的显示时间戳，其中，n为正整数。

需要说明的是，在执行步骤330进行人脸检测时，可以通过例如矩形框的方式确定目标人物图像在待播放视频帧图像中的位置，在这种情况下，目标人物图像的尺寸参数可以是该矩形框的长度值和宽度值，而目标人物图像的位置参数则可以是该矩形框的中心在待播放视频帧图像中的位置坐标，或者可以是该矩形框的任意一个角在待播放视频帧图像中的位置坐标值，本实施例对此并不作具体限定。另外，在对这些待播放视频帧图像进行人脸检测得到目标人物图像的位置参数和尺寸参数之后，可以通过如下方式进行记录：

face_n＝{x,y,w,h}

其中，

表示在第i个显示时间戳对应的待播放视频帧图像中检测到的多个目标人物图像的集合；face_n表示在第i个显示时间戳对应的待播放视频帧图像中检测到的其中一个目标人物图像，其中，n为正整数。x和y表示目标人物图像在待播放视频帧图像中的位置参数，例如可以为框着目标人物图像的矩形框的左上角的坐标值；w和h表示目标人物图像的尺寸参数，例如可以为框着目标人物图像的矩形框的长度值和宽度值。

需要说明的是，目标人物图像并不是在所有待播放视频帧图像中一直出现的，在实际情况中，目标人物图像会在部分待播放视频帧图像中出现，在部分待播放视频帧图像中不出现，因此，为了能够平滑地对出现的目标人物图像进行标记图像的标记处理，可以对目标人物图像实施追踪识别，并记录识别到的目标人物图像的相关参数，直到该目标人物图像在待播放视频帧图像中不出现。在一种可选的实施方式中，先根据这些待播放视频帧图像的播放顺序，将相邻的若干个均包括有目标人物图像的待播放视频帧图像生成帧图像集合，然后检测每一个帧图像集合中的目标人物图像，并通过如下方式记录检测到的目标人物图像的相关参数：

其中，

表示帧图像集合中第1个待播放视频帧图像中的目标人物图像的位置参数和尺寸参数；

表示帧图像集合中第2个待播放视频帧图像中的目标人物图像的位置参数和尺寸参数；

表示帧图像集合中第n个待播放视频帧图像中的目标人物图像的位置参数和尺寸参数；x₁和y₁、x₂和y₂、x_n和y_n，均表示目标人物图像在待播放视频帧图像中的位置参数，例如可以为框着目标人物图像的矩形框的左上角的坐标值；w₁和h₁、w₂和h₂、w_n和h_n，均表示目标人物图像的尺寸参数，例如可以为框着目标人物图像的矩形框的长度值和宽度值；其中，n为正整数。

在得到前面的每一个帧图像集合中的目标人物图像的相关参数之后，可以计算目标人物图像的缩放系数，具体可以为：对于每一个帧图像集合，将首次出现的目标人物图像的尺寸参数作为参考尺寸参数，然后根据参考尺寸参数和帧图像集合中的目标人物图像的尺寸参数，得到帧图像集合中的目标人物图像的缩放系数。在得到每一个帧图像集合中的目标人物图像的缩放系数之后，对于每一个帧图像集合，可以对记录到的目标人物图像的相关参数更新为：

其中，α₁、α₂和α_n，均表示目标人物图像的缩放系数。

此时，根据前面的处理，得到了显示时间戳、目标人物图像的位置参数、目标人物图像的尺寸参数和目标人物图像的缩放系数，因此可以对该显示时间戳、该位置参数、该尺寸参数和该缩放系数进行整合，得到图像参数信息。

参照图25所示，本申请的一个实施例，对步骤350中的根据参考尺寸参数和帧图像集合中的目标人物图像的尺寸参数得到帧图像集合中的目标人物图像的缩放系数进行进一步的说明，步骤350中的根据参考尺寸参数和帧图像集合中的目标人物图像的尺寸参数得到帧图像集合中的目标人物图像的缩放系数，可以包括但不限于有步骤351和步骤352。

步骤351：对于帧图像集合中的每一个目标人物图像，计算尺寸参数与参考尺寸参数的比值，得到帧图像集合中所有目标人物图像的缩放比例值。

本步骤中，当确定了目标人物图像的参考尺寸参数之后，即可通过计算帧图像集合中每一个目标人物图像的尺寸参数与参考尺寸参数的比值，得到帧图像集合中所有目标人物图像的缩放比例值，以便于后续步骤可以根据这些缩放比例值得到帧图像集合中所有目标人物图像的缩放系数。

计算帧图像集合中每一个目标人物图像的尺寸参数与参考尺寸参数的比值，可以通过如下公式实现：

其中，β_i表示帧图像集合中第i个待播放视频帧图像中的目标人物图像的缩放比例值；w_i和h_i表示目标人物图像在第i个待播放视频帧图像中的尺寸参数，例如可以为框着目标人物图像的矩形框的长度值和宽度值；w和h表示目标人物图像的参考尺寸参数；其中，i为正整数。

当利用前面的公式计算帧图像集合中的每一个目标人物图像的尺寸参数与参考尺寸参数的比值之后，得到的帧图像集合中所有目标人物图像的缩放比例值可以为如下所示：

{β₁,β₂,……,β_n}

其中，n为正整数。

步骤352：对所有缩放比例值进行数据平滑处理，得到帧图像集合中所有目标人物图像的缩放系数。

本步骤中，虽然前后两个待播放视频帧图像是连续播放的，但是可能存在前后两个待播放视频帧图像中的目标人物图像的位置和尺寸大小是突变的情况，为了使得标记图像能够在视频画面中更加平滑的显示，在执行步骤351得到了帧图像集合中所有目标人物图像的缩放比例值之后，可以对这些缩放比例值进行数据平滑处理，得到帧图像集合中所有目标人物图像的缩放系数，以便于后续步骤中根据该缩放系数使标记图像在视频画面中显示时，能够显示得更加顺畅、平滑，从而可以提高用户的观看体验。

需要说明的是，对所有缩放比例值进行数据平滑处理，可以为采用滑动平均法对所有缩放比例值进行数据平滑处理，使得相邻的缩放比例值之间的变化能够接近平稳。其中，滑动平均法是指：对于一个包括有N个数据的序列，沿着这N个数据，不断逐个滑动地取m个相邻的数据进行算术平均计算。例如，采用滑动平均法对数据序列{A₁,A₂,A₃,A₄,A₅}进行数据平滑处理，首先，计算A₁、A₂和A₃的算术平均得到

并将A₂更新为

然后，计算A₂、A₃和A₄的算术平均得到

并将A₃更新为

接着，计算A₃、A₄和A₅的算术平均得到

并将A₄更新为

此时，可以得到经过数据平滑处理的数据序列为

参照图26所示，本申请的一个实施例，对步骤360进行进一步的说明，该步骤360可以包括但不限于有以下步骤：

步骤361：获取目标人物图像对应的标签信息；

步骤362：根据标签信息、显示时间戳、位置参数、尺寸参数和缩放系数得到图像参数信息。

本实施例中，为了使用户能够进一步理解视频画面中的人物角色，图像参数信息还可以包括有目标人物图像对应的标签信息，因此，在获取图像参数信息之前，还可以先获取目标人物图像对应的标签信息，然后再根据标签信息、显示时间戳、位置参数、尺寸参数和缩放系数得到图像参数信息。当服务器得到图像参数信息之后，可以以显示时间戳作为键值，将图像参数信息保存在服务器或者独立设置的存储器中，在服务器接收到由播放终端发送的显示时间戳的情况下，服务器再根据该显示时间戳获取对应的图像参数信息。例如表1所示，表1是一个具体示例提供的保存在服务器中的图像参数信息的结构表格，在表1中，图像参数信息包括有显示时间戳表项和多个目标人物图像表项，其中，多个的目标人物图像表项对应于不同目标人物图像，每一个目标人物图像表项中均包括标签信息、位置参数、尺寸参数和缩放系数。

表1

需要说明的是，标签信息可以是对目标人物图像的角色介绍，例如目标人物图像的性格介绍、喜好介绍等，也可以是用于区分角色关系的文字描述，例如主角、配角等，本实施例对此并不作具体限定。

需要说明的是，标签信息可以预先保存在服务器或者独立设置的存储器中，当需要进行获取图像参数信息的操作时，服务器可以在本地直接获取标签信息，或者通过独立设置的存储器获取标签信息。

另外，本申请的一个实施例，对步骤361进行进一步的说明，该步骤361可以包括但不限于有以下步骤：

首先，将目标人物图像与预分类的多个人脸类别进行匹配处理，得到与目标人物图像匹配的目标人脸类别；

然后，获取目标人脸类别的标签信息。

本实施例中，当需要获取目标人物图像对应的标签信息时，可以先将目标人物图像与预分类的多个人脸类别进行匹配处理，得到与目标人物图像匹配的目标人脸类别，然后获取目标人脸类别的标签信息，此时，即可得到目标人物图像对应的标签信息。

参照图27所示，本申请的一个实施例，对预分类的多个人脸类别的获取方法进行详细的说明，该预分类的多个人脸类别的获取方法由服务器执行，该预分类的多个人脸类别可以由以下步骤得到：

步骤410：获取多个待播放视频帧图像；

步骤420：对多个待播放视频帧图像进行人脸检测得到多个候选人脸信息；

步骤430：对多个候选人脸信息进行人脸聚类处理得到多个人脸信息集合；

步骤440：为每一个人脸信息集合标记标签信息得到多个人脸类别。

本实施例中，服务器可以预先对待播放视频帧图像中的人物角色进行人脸类别的预分类处理，以便于在执行获取目标人物图像对应的标签信息时，可以将目标人物图像与已经分类好的人脸类别进行匹配得到目标人脸类别，而后获取该目标人脸类别的标签信息。

本实施例中，服务器在对多个待播放视频帧图像中的多个人脸类别进行预分类时，可以先对这些待播放视频帧图像进行人脸检测得到多个候选人脸信息，然后对这些候选人脸信息进行人脸聚类处理得到多个人脸信息集合，接着为每一个人脸信息集合标记标签信息得到多个人脸类别。例如图28所示，图28是一个具体示例提供的预分类的多个人脸类别的示意图，图28中示出了多个人脸类别，不同的人脸类别对应于待播放视频帧图像中不同的人物角色，并且，不同的人脸类别对应有不同的标签信息。

需要说明的是，对待播放视频帧图像进行人脸检测，可以为采用常规的图像处理方法进行人脸的检测与识别，本实施例对此不作具体限定。另外，由于实际的影视剧集或电影等视频的内容较多，而且存在部分连续的视频帧图像均出现同一个人物角色的情况，如果对所有的视频帧图像均进行人脸检测，则会导致出现人脸检测效率低下的问题，为了解决这个问题，在对多个待播放视频帧图像进行人脸检测得到多个候选人脸信息的过程中，可以每间隔预设帧数或者每间隔预设时间进行一次人脸检测，从而可以降低人脸检测的压力，提高对人脸类别进行分类的效率。需要说明的是，预设帧数和预设间隔都可以根据实际应用情况进行适当的选择，本实施例对此并不作具体限定，例如，预设帧数可以为2帧，预设间隔可以为1秒。

需要说明的是，在对多个待播放视频帧图像进行人脸检测得到多个候选人脸信息的过程中，是对每一个被检测的待播放视频帧图像中的所有人脸均进行检测，因此，得到的多个候选人脸信息会包括有对应于同一个人物角色的重复的人脸信息，因此，可以对这些候选人脸信息进行人脸聚类处理，使得相同人物角色的人脸信息能够聚集为一类，从而得到每一个人物角色的人脸信息集合，然后，为每一个人脸信息集合标记标签信息，即可完成对人脸类别的分类处理。

参照图29，本申请实施例还公开了一种播放终端，该播放终端500能够实现如前面实施例中以播放终端作为执行主体的视频处理方法，该播放终端500包括：

显示单元501，用于显示标记操作控件；

视频播放单元502，用于响应于标记操作控件被触发，在视频播放过程中，播放包括有标记图像的视频画面，其中，标记图像用于标记视频画面中的目标人物图像，标记图像的尺寸根据目标人物图像的尺寸而确定。

在一实施例中，标记图像的尺寸根据目标人物图像的尺寸而确定，具体为：

当视频画面中的目标人物图像的尺寸在第一尺寸与第二尺寸之间连续变化，标记图像的尺寸在第三尺寸与第四尺寸之间连续变化，其中，第一尺寸大于第二尺寸，第三尺寸大于第四尺寸；

或者，

当视频画面中的目标人物图像的尺寸在第一尺寸与第二尺寸之间切换，标记图像的尺寸在第三尺寸与第四尺寸之间切换，其中，第一尺寸大于第二尺寸，第三尺寸大于第四尺寸。

在一实施例中，标记图像关联有标签信息，播放终端500还包括：

信息展示单元503，用于响应于第一操作指令，在视频画面中展示标签信息。

在一实施例中，视频播放单元502包括：

图像参数获取单元，用于获取与显示时间戳对应的图像参数信息，其中，图像参数信息包括目标人物图像的位置参数、目标人物图像的尺寸参数和目标人物图像的缩放系数；

图像叠加单元，用于根据位置参数、尺寸参数和缩放系数，在待播放视频帧图像中叠加标记图像；

图像播放单元，用于显示叠加有标记图像的待播放视频帧图像。

在一实施例中，图像参数获取单元包括：

时间戳发送单元，用于向服务器发送显示时间戳，使得服务器根据显示时间戳获取与显示时间戳对应的图像参数信息；

图像参数接收单元，用于接收服务器发送的图像参数信息。

在一实施例中，图像叠加单元包括：

标记位置确定单元，用于根据位置参数和尺寸参数确定标记位置信息；

标记尺寸确定单元，用于根据缩放系数确定标记尺寸信息；

标记叠加单元，用于根据标记位置信息和标记尺寸信息在待播放视频帧图像中叠加标记图像。

需要说明的是，由于本实施例的播放终端500能够实现如前面实施例中以播放终端作为执行主体的视频处理方法，因此本实施例的播放终端500与前面实施例中以播放终端作为执行主体的视频处理方法，具有相同的技术原理以及相同的有益效果，为了避免内容重复，此处不再赘述。

参照图30，本申请实施例还公开了一种服务器，该服务器600能够实现如前面实施例中以服务器作为执行主体的视频处理方法，该服务器600包括：

接收单元601，用于接收视频参数请求信息，其中，视频参数请求信息由播放终端在检测到标记操作控件被触发的情况下而发送；

获取单元602，用于根据视频参数请求信息获取视频参数信息；

发送单元603，用于向播放终端发送视频参数信息，使得播放终端在视频播放过程中，根据视频参数信息播放包括有标记图像的视频画面，其中，标记图像用于标记视频画面中的目标人物图像，标记图像的尺寸根据目标人物图像的尺寸而确定。

或者，

在一实施例中，视频参数请求信息为待播放视频帧图像的显示时间戳，视频参数信息为与显示时间戳对应的图像参数信息，图像参数信息用于在待播放视频帧图像中叠加标记图像。

在一实施例中，服务器600还包括：

帧图像获取单元604，用于获取多个待播放视频帧图像；

时间信息获取单元605，用于获取多个待播放视频帧图像的显示时间戳；

检测单元606，用于对多个待播放视频帧图像进行人脸检测，得到多个待播放视频帧图像中的目标人物图像的位置参数和尺寸参数；

集合生成单元607，用于根据多个待播放视频帧图像的播放顺序，将相邻的若干个待播放视频帧图像生成帧图像集合，其中，帧图像集合中的每一个待播放视频帧图像均包括有目标人物图像；

缩放系数获取单元608，用于对于每一个帧图像集合，将首次出现的目标人物图像的尺寸参数作为参考尺寸参数，根据参考尺寸参数和帧图像集合中的目标人物图像的尺寸参数，得到帧图像集合中的目标人物图像的缩放系数；

参数信息获取单元609，用于根据显示时间戳、位置参数、尺寸参数和缩放系数得到图像参数信息。

在一实施例中，缩放系数获取单元608包括：

比值计算单元，用于对于帧图像集合中的每一个目标人物图像，计算尺寸参数与参考尺寸参数的比值，得到帧图像集合中所有目标人物图像的缩放比例值；

数据处理单元，用于对所有缩放比例值进行数据平滑处理，得到帧图像集合中所有目标人物图像的缩放系数。

在一实施例中，参数信息获取单元609包括：

标签获取单元，用于获取目标人物图像对应的标签信息；

参数信息获取子单元，用于根据标签信息、显示时间戳、位置参数、尺寸参数和缩放系数得到图像参数信息。

在一实施例中，标签获取单元包括：

匹配处理单元，用于将目标人物图像与预分类的多个人脸类别进行匹配处理，得到与目标人物图像匹配的目标人脸类别；

标签获取子单元，用于获取目标人脸类别的标签信息。

在一实施例中，服务器600还包括：

视频图像获取单元610，用于获取多个待播放视频帧图像；

人脸检测单元611，用于对多个待播放视频帧图像进行人脸检测得到多个候选人脸信息；

人脸聚类单元612，用于对多个候选人脸信息进行人脸聚类处理得到多个人脸信息集合；

标记单元613，用于为每一个人脸信息集合标记标签信息得到多个人脸类别。

需要说明的是，由于本实施例的服务器600能够实现如前面实施例中以服务器作为执行主体的视频处理方法，因此本实施例的服务器600与前面实施例中以服务器作为执行主体的视频处理方法，具有相同的技术原理以及相同的有益效果，为了避免内容重复，此处不再赘述。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，本申请实施例还公开了一种播放终端，该播放终端包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当至少一个所述程序被至少一个所述处理器执行时，实现如前面以播放终端为执行主体的任意实施例的视频处理方法。

本申请实施例还公开了一种计算机可读存储介质，其中存储有处理器可执行的程序，所述处理器可执行的程序被处理器执行时，用于实现如前面任意实施例所述的视频处理方法。

本申请实施例还公开了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行前面任意实施例所述的视频处理方法。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或装置不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或装置固有的其他步骤或单元。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其他的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，可以是电性、机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机装置(可以是个人计算机、服务器或者网络装置等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

对于上述方法实施例中的步骤编号，其仅为了便于阐述说明而设置，对步骤之间的顺序不做任何限定，实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

Claims

1.一种视频处理方法，其特征在于，包括以下步骤：

显示标记操作控件；

2.根据权利要求1所述的视频处理方法，其特征在于，所述标记图像的尺寸根据所述目标人物图像的尺寸而确定，具体为：

或者，

3.根据权利要求1或2所述的视频处理方法，其特征在于，所述标记图像关联有标签信息，所述视频处理方法还包括：

响应于第一操作指令，在所述视频画面中展示所述标签信息。

4.根据权利要求1所述的视频处理方法，其特征在于，所述播放包括有标记图像的视频画面，包括：

获取待播放视频帧图像的显示时间戳；

获取与所述显示时间戳对应的图像参数信息，其中，所述图像参数信息包括所述目标人物图像的位置参数、所述目标人物图像的尺寸参数和所述目标人物图像的缩放系数；

根据所述位置参数、所述尺寸参数和所述缩放系数，在所述待播放视频帧图像中叠加所述标记图像；

显示叠加有所述标记图像的所述待播放视频帧图像。

5.根据权利要求4所述的视频处理方法，其特征在于，所述获取与所述显示时间戳对应的图像参数信息，包括：

向服务器发送所述显示时间戳，使得所述服务器根据所述显示时间戳获取与所述显示时间戳对应的图像参数信息；

接收所述服务器发送的所述图像参数信息。

6.根据权利要求4所述的视频处理方法，其特征在于，所述根据所述位置参数、所述尺寸参数和所述缩放系数，在所述待播放视频帧图像中叠加所述标记图像，包括：

根据所述位置参数和所述尺寸参数确定标记位置信息；

根据所述缩放系数确定标记尺寸信息；

根据所述标记位置信息和所述标记尺寸信息在所述待播放视频帧图像中叠加所述标记图像。

7.一种视频处理方法，其特征在于，包括以下步骤：

根据所述视频参数请求信息获取视频参数信息；

8.根据权利要求7所述的视频处理方法，其特征在于：所述视频参数请求信息为待播放视频帧图像的显示时间戳，所述视频参数信息为与所述显示时间戳对应的图像参数信息，所述图像参数信息用于在所述待播放视频帧图像中叠加所述标记图像。

9.根据权利要求8所述的视频处理方法，其特征在于，所述图像参数信息由以下步骤得到：

获取多个所述待播放视频帧图像；

获取多个所述待播放视频帧图像的所述显示时间戳；

对多个所述待播放视频帧图像进行人脸检测，得到多个所述待播放视频帧图像中的所述目标人物图像的位置参数和尺寸参数；

根据多个所述待播放视频帧图像的播放顺序，将相邻的若干个所述待播放视频帧图像生成帧图像集合，其中，所述帧图像集合中的每一个所述待播放视频帧图像均包括有所述目标人物图像；

对于每一个所述帧图像集合，将首次出现的所述目标人物图像的所述尺寸参数作为参考尺寸参数，根据所述参考尺寸参数和所述帧图像集合中的所述目标人物图像的所述尺寸参数，得到所述帧图像集合中的所述目标人物图像的缩放系数；

根据所述显示时间戳、所述位置参数、所述尺寸参数和所述缩放系数得到所述图像参数信息。

10.根据权利要求9所述的视频处理方法，其特征在于，所述根据所述参考尺寸参数和所述帧图像集合中的所述目标人物图像的所述尺寸参数，得到所述帧图像集合中的所述目标人物图像的缩放系数，包括：

对于所述帧图像集合中的每一个所述目标人物图像，计算所述尺寸参数与所述参考尺寸参数的比值，得到所述帧图像集合中所有所述目标人物图像的缩放比例值；

对所有所述缩放比例值进行数据平滑处理，得到所述帧图像集合中所有所述目标人物图像的缩放系数。

11.根据权利要求9所述的视频处理方法，其特征在于，所述根据所述显示时间戳、所述位置参数、所述尺寸参数和所述缩放系数得到所述图像参数信息，包括：

获取所述目标人物图像对应的标签信息；

根据所述标签信息、所述显示时间戳、所述位置参数、所述尺寸参数和所述缩放系数得到所述图像参数信息。

12.根据权利要求11所述的视频处理方法，其特征在于，所述获取所述目标人物图像对应的标签信息，包括：

将所述目标人物图像与预分类的多个人脸类别进行匹配处理，得到与所述目标人物图像匹配的目标人脸类别；

获取所述目标人脸类别的标签信息。

13.根据权利要求12所述的视频处理方法，其特征在于，预分类的多个所述人脸类别由以下步骤得到：

获取多个所述待播放视频帧图像；

对多个所述待播放视频帧图像进行人脸检测得到多个候选人脸信息；

对多个所述候选人脸信息进行人脸聚类处理得到多个人脸信息集合；

为每一个所述人脸信息集合标记所述标签信息得到多个所述人脸类别。

14.一种播放终端，其特征在于，包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当至少一个所述程序被至少一个所述处理器执行时实现如权利要求1至6任意一项所述的视频处理方法。

15.一种计算机可读存储介质，其特征在于：其中存储有处理器可执行的程序，所述处理器可执行的程序被处理器执行时用于实现如权利要求1至13任意一项所述的视频处理方法。