WO2019141100A1

WO2019141100A1 - 附加对象显示方法、装置、计算机设备及存储介质

Info

Publication number: WO2019141100A1
Application number: PCT/CN2019/070616
Authority: WO
Inventors: 肖仙敏; 张中宝; 蒋辉; 王文涛; 肖鹏; 黎雄志; 张元昊; 林锋
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2018-01-18
Filing date: 2019-01-07
Publication date: 2019-07-25
Also published as: JP7109553B2; JP2021511728A; EP3742743A1; US20200272309A1; EP3742743A4; US11640235B2; CN110062269A

Abstract

本申请是关于一种附加对象显示方法、装置及计算机设备，涉及计算机应用技术领域。该方法包括：在视频播放界面中显示触发控件；响应于对触发控件的激活操作，暂停播放视频，并显示参考画面帧；响应于对触发控件的拖动操作，获取参考画面帧中的目标对象；在播放视频时，在视频的画面帧中对应目标对象显示触发控件对应的附加对象，从而达到在视频播放过程中保持附加对象与视频播放画面相匹配的效果。

Description

附加对象显示方法、装置、计算机设备及存储介质

本申请要求于2018年01月18日提交、申请号为201810050497.6、发明名称为“附加对象显示方法、装置及计算机设备”的中国专利申请的优先权，上述申请的全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机应用技术领域，特别涉及一种附加对象显示方法、装置、计算机设备及存储介质。

背景技术

随着视频处理技术的不断发展，很多应用程序提供在视频中添加显示附加对象的功能，以提高视频的播放效果。

在相关技术中，用户需要在视频中添加显示附加对象时，可以在视频播放界面中指定目标位置以及待添加的附加对象，终端后续播放视频时，将该附加对象持续显示在该目标位置。然而，通过相关技术所示的方案，用户在指定目标位置后，附加对象在视频中的显示位置就固定不变，导致后续视频播放过程中附加对象与视频播放画面不匹配。

发明内容

本申请实施例提供了一种附加对象显示方法、装置、计算机设备及存储介质，可以使视频中的附加对象与视频播放画面匹配，技术方案如下：

一方面，提供了一种附加对象显示方法，所述方法由终端执行，所述方法包括：在视频播放界面中显示触发控件，所述视频播放界面用于播放视频；

响应于对所述触发控件的激活操作，暂停播放所述视频，并在所述视频播放界面中显示参考画面帧，所述参考画面帧是所述视频中对应在暂停时间点处的画面帧；响应于对所述触发控件的拖动操作，获取目标对象；所述目标对象是所述参考画面帧中对应在所述拖动操作的结束位置的显示对象；在播放所述视频时，在所述视频的画面帧中对应所述目标对象显示所述触发控件对应的附加对象。

一方面，提供了一种附加对象显示装置，所述装置用于终端中，所述装置包括：控件显示模块，用于在视频播放界面中显示触发控件，所述视频播放界面用于播放视频；

暂停模块，用于响应于对所述触发控件的激活操作，暂停播放所述视频，并在所述视频播放界面中显示参考画面帧，所述参考画面帧是所述视频中对应在暂停时间点处的画面帧；

对象获取模块，用于响应于对所述触发控件的拖动操作，获取目标对象；所述目标对象是所述参考画面帧中对应在所述拖动操作的结束位置的显示对象；

对象显示模块，用于在播放所述视频时，在所述视频的画面帧中对应所述目标对象显示所述触发控件对应的附加对象。

可选的，所述装置还包括：追踪模块，用于在所述对象显示模块在所述视频中对应所述目标对象显示所述触发控件对应的附加对象之前，在所述视频中的各个画面帧中追踪所述目标对象，获得第一显示信息，所述第一显示信息用于指示所述目标对象分别在所述各个画面帧中的显示位置、显示尺寸以及显示姿态中的至少一种；

信息生成模块，用于根据所述第一显示信息生成第二显示信息，所述第二显示信息用于指示所述附加对象分别在所述各个画面帧中的显示位置、显示尺寸以及显示姿态中的至少一种；

所述对象显示模块，具体用于在播放所述视频时，根据所述第二显示信息，分别在所述各个画面帧中显示所述附加对象。

可选的，所述第一显示信息包括所述目标对象中的目标点分别在所述各个画面帧中的像素坐标，所述目标点是所述目标对象中对应所述拖动操作的结束位置的位置点，所述信息生成模块，具体用于，根据所述目标对象中的目标点分别在所述各个画面帧中的像素坐标，以及所述附加对象与所述目标点之间的相对位置信息，获取所述附加对象分别在所述各个画面帧中的像素坐标；生成包含所述附加对象分别在所述各个画面帧中的像素坐标的所述第二显示信息。

可选的，所述装置还包括：预览图显示模块，用于在所述视频播放界面中显示所述附加对象的预览图；

显示位置获取模块，用于获取所述预览图在所述参考画面帧中的显示位置；

相对位置获取模块，用于根据所述预览图在所述参考画面帧中的显示位置，以及所述拖动操作对应在所述参考画面帧中的结束位置，获取所述附加对象与所述目标点之间的相对位置信息。

可选的，所述装置还包括：移动模块，用于响应于对所述附加对象的预览图的拖动操作，移动所述附加对象的预览图在所述视频播放界面中的位置。

可选的，所述第一显示信息包括所述目标对象分别在所述各个画面帧中的显示尺寸，所述信息生成模块，具体用于，根据所述目标对象分别在所述各个画面帧中的显示尺寸，以及所述目标对象的原始尺寸，计算所述附加对象分别在所述各个画面帧中的缩放倍率；所述目标对象的原始尺寸是所述目标对象在所述参考画面帧中的显示尺寸；根据所述附加对象的原始尺寸和所述缩放倍率获取所述附加对象在所述各个画面帧中的显示尺寸；生成包含所述附加对象在所述各个画面帧中的显示尺寸的所述第二显示信息。

可选的，所述第一显示信息包括所述目标对象分别在所述各个画面帧中的显示位置和显示姿态，所述信息生成模块，具体用于，根据所述目标对象分别在所述各个画面帧中的显示位置和显示姿态，以及所述附加对象与所述目标点之间的相对位置信息，获取所述附加对象分别在所述各个画面帧中的显示位置和显示姿态；生成包含所述附加对象分别在所述各个画面帧中的显示位置和显示姿态的所述第二显示信息。

可选的，所述追踪模块，具体用于，从所述参考画面帧开始，按照播放时间顺序和/或播放时间逆序，在所述各个画面帧中逐帧追踪所述目标显示对象，获得所述第一显示信息。

可选的，所述追踪模块，具体用于，通过可变形物体跟踪的静态自适应对应聚类CMT算法在所述视频中的各个画面帧中追踪所述目标对象，获得所述第一显示信息。

可选的，所述装置还包括：切换控件显示模块，用于在视频播放界面中，对应所述触发控件显示切换控件；

选择界面显示模块，用于响应于对所述切换控件的激活操作，显示附加对象选择界面，所述附加对象选择界面中包含至少两个备选对象；

附加对象获取模块，用于响应于在所述附加对象选择界面中的选择操作，将所述选择操作对应的备选对象获取为所述触发控件对应的新的附加对象。

可选的，所述附加对象为静态显示对象，或者，所述附加对象为动态显示对象。

一方面，提供了一种计算机设备，所述计算机设备包含处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述附加对象显示方法。

一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述附加对象显示方法。

本申请提供的技术方案可以包括以下有益效果：

预先在视频播放界面中显示一个触发控件，检测到用户对该触发控件的激活操作时，即可以暂停视频播放，接收到对触发控件的拖动操作时，将拖动操作结束位置对应的显示对象确定为目标对象，后续播放过程中对应各个画面帧中同样的目标对象显示附加对象，从而达到在视频播放过程中保持附加对象与视频播放画面相匹配的效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1是本申请一个示例性实施例提供的附加对象显示的基本流程图；

图2是图1所示实施例涉及的一种触发控件展示界面图；

图3是本申请一个示例性的实施例提供的附加对象显示方法的流程图；

图4是图3所示实施例涉及的触发控件及附加对象预览图的展示界面图；

图5是图3所示实施例涉及的一种附加对象切换示意图；

图6是图3所示实施例涉及的一种附加对象缩放示意图；

图7是图3所示实施例涉及的触发控件及附加对象预览图的展示界面图；

图8是图3所示实施例涉及的CMT算法的初始化流程；

图9是图3所示实施例涉及的CMT算法的每个画面帧的处理流程图；

图10是图3所示实施例涉及的一种对象追踪流程图；

图11是本申请一示例性实施例提供的一种贴身跟随模式的操作示意图；

图12是本申请一示例性实施例提供的另一种贴身跟随模式的操作示意图；

图13是本申请一示例性实施例提供的一种风筝模式的操作示意图；

图14是本申请一示例性实施例提供的另一种贴身跟随模式的操作示意图；

图15是本申请一个示例性实施例提供的附加对象显示装置的结构方框图；

图16是本申请一示例性实施例提供的计算机设备的结构框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

本申请提供的方案可以应用于具有一定的计算能力，且具备视频播放功能的终端中。比如，该终端可以是智能手机、平板电脑或者电子书阅读器等移动终端，或者，该终端也可以是台式电脑或者笔记本电脑等个人计算机设备。

为了便于理解本申请所提供的方案，下面对本申请涉及到几个名词进行解释。

1、附加对象。在本申请实施例中，附加对象也称为贴纸或视频贴纸，是后期附加在已有的视频上层进行显示的文字或者图像元素。

附加对象按照类型可以分为动态对象(也称动态贴纸)和静态对象(也称静态贴纸)。其中，动态对象是指本身带有动画效果的对象，类似动画表情。而静态对象是指不带动画效果的对象，类似静态图片。

附加对象可以是透明、半透明或者非透明的显示对象。

2、画面帧。本申请中的画面帧是指视频播放过程中，根据时间戳进行播放的图像数据。

3、对象追踪。本申请中的对象追踪，是指在视频的画面帧序列中，对于一帧画面帧中包含的各个显示对象中的指定显示对象，在视频的画面帧序列中除了该画面帧之外的其它画面帧中找到该指定显示对象，并得到该指定显示对象在其它各个画面帧中的位置、尺寸以及姿态(通常可以是旋转角度)等信息。

其中，一个画面帧中的显示对象，是指该画面帧中的可视化元素，比如，一个画面帧中的一个人物、一张人脸、一张桌子、一块石头、一座房子、一片云朵或者一片天空等等都可以是该画面帧中的显示对象。

4、可变形物体跟踪的静态自适应对应聚类算法。可变形物体跟踪的静态自适应对应聚类(Clustering of Static-Adaptive Correspondences for Deformable Object Tracking，CMT)算法是一种对象跟踪算法，可以应用于跟踪视频场景中的显示对象(比如人或物体)。CMT算法是一种基于特征的跟踪方法，其使用了经典的光流法作为算法的一部分。

5、字典。本申请中涉及到的字典是一种用于保存具有映射关系的数据的集合，可以视为用于存储键值(key-value)对的容器，其中，一个键值对可以认为是一个条目(entry)。字典通过key来存取元素，且key不能重复，value必须是对象，键值对在字典中可以有序存储，也可以无序存储。

请参考图1，其示出了本申请一个示例性实施例提供的附加对象显示的基本流程图，该流程可以由终端来实现。如图1所示，该流程可以包括如下几个步骤：

步骤11，在视频播放界面中显示触发控件，该视频播放界面用于播放视频。

在本申请实施例中，终端在播放视频时，可以在视频播放界面中显示一个触发控件，该触发控件悬浮在视频播放界面的上层，且可以接受用户操作，比如光标操作或者触控操作等。

比如，请参考图2，其示出了本申请实施例涉及的一种触发控件展示界面图。如图2所示，终端在视频播放界面20中播放视频画面21，该视频画面21 中包含一触发控件22，其中，该触发控件22并不是视频画面21中原来包含的显示对象，而是终端额外添加在视频画面21的上层悬浮显示的对象。

步骤12，在播放视频时，响应于对该触发控件的激活操作，暂停播放该视频，并在该视频播放界面中显示参考画面帧，该参考画面帧是视频中对应在暂停时间点处的画面帧。

当视频播放至包含有目标对象的画面时，用户可以对触发控件执行激活操作(比如点击触控操作)，此时，终端可以暂停视频播放，以便用户选择需要添加附加对象的目标对象。

如图2所示，触发控件22可以接受用户的点击触控操作，当检测到用户对触发控件22的点击触控操作时，终端暂停播放视频，同时触发控件22进入激活状态，此时，暂停的视频画面帧即为上述参考画面帧。

步骤13，响应于对该触发控件的拖动操作，获取目标对象，该目标对象是该参考画面帧中对应在该拖动操作的结束位置的显示对象。

在本申请实施例中，终端响应用户对触发控件的激活操作之后，该触发控件即可以接受用户的拖动操作，当拖动操作结束时，终端可以根据拖动操作的结束位置获取参考画面帧中的目标对象。

如图2所示，参考画面帧中包含若干个显示对象，比如人物对象23、房屋24以及山丘25等等。触发控件22进入激活状态之后，用户可以通过触摸滑动操作来拖动触发控件22，并将拖动操作结束时，触发控件22所在位置处的显示对象(即图2中的人物对象23)确定为目标对象。

从参考画面帧中获取目标对象之后，终端可以在该视频中的各个画面帧中追踪该目标对象，获得第一显示信息，该第一显示信息用于指示该目标对象分别在该各个画面帧中的显示位置、显示尺寸以及显示姿态中的至少一种；终端根据该第一显示信息生成第二显示信息，该第二显示信息用于指示该附加对象分别在该各个画面帧中的显示位置、显示尺寸以及显示姿态中的至少一种。

步骤14，在播放该视频时，在该视频的画面帧中对应该目标对象显示该触发控件对应的附加对象。

本申请实施例中，终端确定目标对象之后，后续播放该视频时，可以在视频播放界面中对应该目标对象显示该触发控件对应的附加对象。其中，对应该目标对象显示该触发控件对应的附加对象可以是指在目标对象上层覆盖显示附加对象，或者，可以是在目标对象周围显示附加对象，或者，也可以是在对应该目标对象的某一相对位置处显示该附加对象。

比如，在对应该目标对象显示该触发控件对应的附加对象时，在确定目标对象之后，终端在播放该视频时，可以根据上述第二显示信息，分别在各个画面帧中显示该附加对象。

如图2所示，终端确定人物对象23为目标对象之后，在后续播放该视频的过程中，当播放的画面帧中包含该人物对象23时，对应该人物对象23显示附加对象24。

通过图1所示的流程，终端预先在视频播放界面中显示一个触发控件，检测到用户对该触发控件的激活操作时，即可以暂停视频播放，后续再接收到对触发控件的拖动操作时，将拖动操作结束位置对应的显示对象确定为目标对象，后续播放过程中对应各个画面帧中同样的目标对象显示附加对象，从而达到在视频播放过程中保持附加对象与视频播放画面相匹配的效果。

在本申请上述图1所示实施例提供的方案中，在视频中显示触发控件对应的附加对象时，终端可以按照预先设置好的，附加对象与目标对象之间的位置关系显示附加对象；或者，终端也可以按照用户在选择目标对象时设置的附加对象与目标对象之间的位置关系显示附加对象。

请参考图3，其示出了本申请一个示例性的实施例提供的附加对象显示方法的流程图，该附加对象显示方法可以由终端执行。该方法可以包括如下几个步骤：

步骤301，在视频播放界面中显示触发控件。

步骤302，在播放视频时，响应于对该触发控件的激活操作，暂停播放该视频，并在该视频播放界面中显示参考画面帧，该参考画面帧是视频中对应在暂停时间点处的画面帧。

步骤303，响应于对该触发控件的拖动操作，获取目标对象，该目标对象是该参考画面帧中对应在该拖动操作的结束位置的显示对象。

上述步骤301至步骤303所示的方案可以参考上述图1中的步骤11至步骤13，此处不再赘述。

可选的，终端还在视频播放界面中显示附加对象的预览图。

在本申请实施例中，当触发控件被激活(即接受到对该触发控件的激活操作)后，该附加对象的预览图可以随着触发控件一起在视频播放界面中移动。

比如，请参考图4，其示出了本申请实施例涉及的一种触发控件及附加对象预览图的展示界面图。如图4所示，终端在视频播放界面40中播放视频画面41，该视频画面41中包含触发控件42以及附加对象的预览图43，当接受到用户对触发控件42的拖动操作时，触发控件42以及附加对象的预览图43一起移动至视频画面41中的新的位置。

可选的，上述对触发控件的拖动操作的操作点处于触发控件或者附加对象的预览图对应的区域。也就是说，在本申请实施例中，用户在触发控件或者附加对象的预览图上执行的拖动操作，都可以视为对触发控件的拖动操作。

比如，在图4中，用户在触发控件42或者附加对象的预览图43所在的位置处开始拖动时，都能够移动触发控件42以及附加对象的预览图43在视频画面41中的位置。

可选的，终端在视频播放界面中，对应该触发控件显示切换控件，响应于对该切换控件的激活操作，显示附加对象选择界面，该附加对象选择界面中包含至少两个备选对象，响应于在该附加对象选择界面中的选择操作，将该选择操作对应的备选对象获取为该触发控件对应的新的附加对象。

在本申请实施例中，用户还可以自由的切换触发控件对应的附加对象。比如，请参考图5，其示出了本申请实施例涉及的一种附加对象切换示意图。如图5所示，在终端在视频播放界面50中播放视频画面51，该视频画面51中包含触发控件52、附加对象的预览图53以及切换控件54，接受到用户对切换控件54的点击操作(即上述对切换控件的激活操作)时，终端显示附加对象选择界面55，该附加对象选择界面55中包含备选对象55a以及备选对象55b，其中，备选对象55a对应当前的附加对象。进一步的，接受到用户对备选对象55b的点击操作(即上述选择操作)时，终端将附加对象的预览图53中显示的内容切换为备选对象55b的预览图。

可选的，当终端在视频播放界面中显示附加对象的预览图时，还对应该附加对象的预览图显示缩放控件，响应于对该缩放控件的缩放操作，对该附加对象的预览图进行缩放，同时将缩放后的附加对象的预览图的尺寸获取该附加对象的新的显示尺寸。

在本申请实施例中，终端可以将附加对象的预览图在视频播放界面中的尺寸记录为该附加对象的显示尺寸，并且，用户可以自由缩放该附加对象的显示尺寸。

比如，请参考图6，其示出了本申请实施例涉及的一种附加对象缩放示意图。如图6所示，终端在视频播放界面60中播放视频画面61，该视频画面61中包含触发控件62、附加对象的预览图63以及缩放控件66，当接受到用户对缩放控件66的拖动操作(即上述对缩放控件的缩放操作)时，终端调整附加对象的预览图63的尺寸，并将调整后的附加对象的预览图63的尺寸获取为该附加对象的新的显示尺寸。

可选的，终端获取该预览图在该参考画面帧中的显示位置，根据该预览图在该参考画面帧中的显示位置，以及该拖动操作对应在该参考画面帧中的结束位置，获取该附加对象与该目标点之间的相对位置信息。

在本申请实施例中，用户在拖动触发控件的过程中，附加对象的预览图可以不随着触发控件一起移动，在接收到对触发控件的拖动操作之后，终端可以根据该预览图在参考画面帧中的位置，以及拖动操作的结束位置，获取附加对象与目标点之间的相对位置信息。

比如，在初始时刻，触发控件处于预览图的左下角，在用户对触发控件进行拖动之后，触发控件处于预览图左下角的下方偏左30度，且距离为200个像素，则终端可以获取附加对象与目标点之间的相对位置信息为：目标点处于预览图左下角的下方偏左30度，距离200像素。

可选的，终端响应于对该附加对象的预览图的拖动操作，移动该附加对象的预览图在该视频播放界面中的位置。

在本申请实施例中，用户可以分别对触发控件以及附加对象的预览图进行位置移动。比如，请参考图7，其示出了本申请实施例涉及的一种触发控件及附加对象预览图的展示界面图。如图7所示，终端在视频播放界面70中播放视频画面71，该视频画面71中包含触发控件72以及附加对象的预览图73，当接受到用户对触发控件72的拖动操作时，触发控件72移动至新的位置，此过程中附加对象的预览图73位置不变，相应的，接受到用户对预览图73的拖动操作时，预览图73移动至新的位置，此时触发控件72位置不变。

步骤304，在该视频中的各个画面帧中追踪该目标对象，获得第一显示信息，该第一显示信息用于指示该目标对象分别在该各个画面帧中的显示位置、显示尺寸以及显示姿态中的至少一种。

其中，上述各个画面帧可以是视频中的全部画面帧，或者，上述各个画面帧也可以是视频中的部分画面帧。比如，当上述各个画面帧是视频中的部分画面帧时，上述各个画面帧可以是视频中处于参考画面帧之后的全部画面帧，或者，上述各个画面帧也可以是视频中处于参考画面帧之前的全部画面帧，或者，上述各个画面帧也可以是视频中处于参考画面帧之前或者之后的一段时间内的画面帧。

可选的，终端通过CMT算法在视频中的各个画面帧中追踪目标对象，获得该第一显示信息。

在本申请实施例中，针对不同的终端的操作系统，追踪算法都可以采用CMT算法，即本申请所示的方案可以支持多平台。其中，在通过CMT算法追踪各个画面帧中的目标对象时，终端首先要处理初始化算法、需要追踪的图像以及跟踪区域，然后对后续的每一帧画面帧进行匹配处理。请参考图8和图9，其中，图8示出了本申请实施例涉及的CMT算法的初始化流程，图9示出了本申请实施例涉及的CMT算法的每个画面帧的处理流程(找到画面帧中匹配的区域)图。

图8所示的CMT算法初始化具体描述如下：

1、创建初始化的变量，包括跟踪的区域、初始帧的灰度图、物体的中心位置及结果的包含的位置，初始化图片的特征检测算法可以是加速段测试特征 (Features from Accelerated Segment Test，FAST)算法，特征点描述算法可以为二进制鲁棒不变可扩展关键点(Binary Robust Invariant Scalable Keypoints，BRISK)算法。

2、检测第一帧图像的特征点，包括前景点(目标选取框中的点)，背景特征点(目标选取框之外的点)，构造一个包含前景点和背景点的潜在数据库(database_potential)的数据集合。

3、初始化特征点匹配器matcher，用于匹配两张图像的特征点。初始化一致器，用于评估目标的旋转角度和尺度因子；保存目标区域的(前景点)特征点及序号。

如图9所示，CMT算法处理各个画面帧的过程描述如下：

1、用特征点检测(FAST)和描述(BRISK)算法对当前图像特征点进行特征检测和描述。

2、将之前保存的首帧目标特征点与当前的特征点进行全局匹配，得到匹配到的点。

3、用光流法根据上次匹配得到的目标特征点预测当前帧中目标的特征点。

4、融合全局匹配到的点和用光流法追踪到的点(即做并集)。

5、对目标做缩放和旋转的估计，接着用局部匹配的点和一致器计算得到的点做并集融合得到目标特征点。

其中，一致器计算的目的是根据旋转和缩放估计目标区域的点。而局部匹配是指比较当前帧中检测得到的每一个关键点与第一帧中经过旋转和尺度变换之后的所有前景关键点之间的欧氏距离，若该欧氏距离小于阈值(比如阈值可以预先设置为20)，说明该前景关键点是有可能匹配上的，则将这些可能的前景关键点构造成一个特征描述库database_potential；再将当前帧中检测得到的每一个关键点的特征描述与database_potential进行knnMatch匹配，每个特征描述子在database_potential寻找最佳的多个(比如2个)匹配结果，排除不稳定的关键点的策略与全局匹配类似。

通过上述CMT算法，终端可以追踪视频的各个画面帧中包含的上述目标对象的位置、尺寸以及姿态等信息(即上述第一显示信息)。

步骤305，根据该第一显示信息生成第二显示信息，该第二显示信息用于指示该附加对象分别在该各个画面帧中的显示位置、显示尺寸以及显示姿态中的至少一种。

可选的，上述第一显示信息包括该目标对象中的目标点分别在该各个画面帧中的像素坐标，终端根据该目标对象中的目标点分别在该各个画面帧中的像素坐标，以及该附加对象与该目标点之间的相对位置信息，获取该附加对象分别在该各个画面帧中的像素坐标；并生成包含该附加对象分别在该各个画面帧中的像素坐标的该第二显示信息。

在本申请实施例中，第一显示信息所指示的位置信息可以是目标对象中的目标点分别在该各个画面帧中的像素坐标，其中目标点可以是用户对上述触发控件的拖动操作的结束位置对应在目标对象中的位置点，比如，当用户在参考画面帧中将触发控件拖动到人物A的鼻尖位置时，各个包含该人物A的画面帧中的目标点就是对应画面帧中的人物A的鼻尖所在的位置点，相应的，生成的第一显示信息中也包含各个画面帧中的人物A的鼻尖所在的位置点的像素坐标。终端后续根据各个画面帧中的人物A的鼻尖所在的位置点的像素坐标，以及附加对象与目标点之间的相对位置信息获取附加对象分别在各个画面帧中的像素坐标。

可选的，终端获取预览图在参考画面帧中的显示位置，并根据该预览图在该参考画面帧中的显示位置，以及该参考画面帧中对应在该拖动操作的结束位置，获取该附加对象与该目标点之间的相对位置信息。

比如，在图5中，附加对象的预览图在参考画面帧中的显示位置的左下角与目标点(即拖动后的触发控件所在的位置点)重合，则附加对象与该目标点之间的相对位置信息可以为：目标点与附加对象的左下角重合。

可选的，第一显示信息包括该目标对象分别在该各个画面帧中的显示尺寸，在根据该第一显示信息生成第二显示信息时，终端根据该目标对象分别在该各个画面帧中的显示尺寸，以及该目标对象的原始尺寸，计算该附加对象分别在该各个画面帧中的缩放倍率；该目标对象的原始尺寸是该目标对象在该参考画面帧中的显示尺寸；根据该附加对象的原始尺寸和该缩放倍率获取该附加对象在该各个画面帧中的显示尺寸；生成包含附加对象在该各个画面帧中的显示尺寸的该第二显示信息。

在本申请实施例中，目标对象在不同的画面帧中的显示尺寸可能不同，相应的，在生成第二显示信息时，终端可以根据目标对象在各个画面帧中的显示尺寸与目标对象的原始尺寸之间的倍数关系(即上述缩放倍率)，结合附加对象的原始尺寸，确定附加对象在各个不同的画面帧中的显示尺寸，以实现附加对象随着目标对象在不同画面帧中的尺寸变化进行缩放。

可选的，该第一显示信息包括该目标对象分别在该各个画面帧中的显示位置和显示姿态，在根据该第一显示信息生成第二显示信息时，终端根据该目标对象分别在该各个画面帧中的显示位置和显示姿态，以及该附加对象与该目标点之间的相对位置信息，获取该附加对象分别在该各个画面帧中的显示位置和显示姿态；生成包含该附加对象在该各个画面帧中的显示位置和显示姿态的该第二显示信息。

在本申请实施例中，目标对象在不同的画面帧中的位置和姿态也可能不同，相应的，在生成第二显示信息时，终端可以根据目标对象在各个画面帧中的位置和姿态，确定附加对象在各个不同的画面帧中的位置和姿态，以实现附加对象的位置和姿态随着目标对象在不同画面帧中位置和姿态进行改变(比如偏转)。

可选的，在该视频中的各个画面帧中追踪该目标对象，获得第一显示信息时，终端从该参考画面帧开始，按照播放时间顺序和/或播放时间逆序，在该各个画面帧中逐帧追踪该目标显示对象，获得上述第一显示信息。

在本申请实施例中，终端可以只按照播放时间顺序，从参考画面帧开始，在参考画面帧之后的画面帧中追踪目标对象；或者，终端也可以只按照播放时间逆序，从参考画面帧开始，在参考画面帧之前的画面帧中追踪目标对象；或者，终端也可以按照照播放时间顺序和播放时间逆序，从参考画面帧开始，分别在在参考画面帧之前和之后的画面帧中追踪目标对象。

可选的，在视频中的各个画面帧中追踪目标对象时，也可以从参考画面帧开始，只追踪参考画面帧之前和/或之后一小段时间内的目标对象。比如，以追踪参考画面帧之后的一小段时间内的目标对象为例，在一种可能的实现方式中个，终端可以按照预设的追踪时长(比如5s)，确定在参考画面帧对应的播放时间点之后的预设的追踪时长内进行播放的画面帧，并只在确定的画面帧中追踪目标对象；其中，上述预设的追踪时长可以由开发人员预先设置在终端中；或者，上述预设的追踪时长也可以由用户进行设置。

或者，在另一种可能的实现方式中，终端也可以从参考画面帧开始，按照播放时间顺序逐帧追踪目标对象，若追踪到目标对象，则继续在下一画面帧中追踪该目标对象，若在某一画面帧中未追踪到该目标对象，则终端停止对该目标对象的追踪。

步骤306，在播放该视频时，根据该第二显示信息，分别在该各个画面帧中显示该附加对象。

其中，对象追踪(即生成第一显示信息和第二显示信息的过程)和在该各个画面帧中显示该附加对象可以是两个并行的流程。其中，请参考图10，其示出了本申请实施例涉及的一种对象追踪流程图，如图10所示，以附加对象是贴纸为例，该对象追踪流程的步骤可以描述如下：

步骤101，获取贴纸对应的目标对象后，检测到开始追踪的操作(比如用户点击视频播放界面中除了贴纸之外的其他区域)之后开始追踪，获取视频静止时的视频帧图像A，追踪贴纸的所在区域B，根据图像A和区域B初始化追踪对象(包括两个追踪对象，以便正向同时能追踪)，同时获取当前视频的时间戳C以及视频时长D。

步骤102，开两个线程，在时间戳C同时正反向解码视频，一个线程从时间戳C解码到0时刻，另一个线程从时间戳C解码到视频时长D。

步骤103，两个线程解码视频，会得到一帧帧图像以及对应的时间戳，终端将每一帧图像都交给追踪对象进行追踪处理。

步骤104，追踪处理会得到两种结果，如果在图像中追踪到目标对象，则会得到中心点以及缩放值，加上帧对象对应的时间戳，标记为贴纸可显示，保存到字典中。

步骤105，如果没有追踪到，则同样加时间戳，标记为贴纸不可显示，并保存到字典中。

追踪完成后，终端将会得到一个以时间戳为key，追踪数据为value的字典，追踪数据包括指示是否有追踪到目标对象的信息(用于控制贴纸在对应时间戳上是否显示)，还包括了中心点以及缩放值，该中心点以及缩放值用于控制贴纸的位置以及大小的改变。视频预览界面将继续播放，播放过程中，渲染的每一帧都有个时间戳，终端根据时间戳，查找字典中是否存在该时间戳对应的追踪数据，如果有，根据这些追踪数据改变贴纸的属性，同时动态贴纸也会根据时间戳改变显示的图像。预览的时候，贴纸和视频是分开的两个view，这样就可以不断对贴纸进行处理，生成并显示视频时对视频画面和贴纸进行合成，合成时视频中每一帧都有个时间戳，终端根据这个时间戳去获取贴纸的信息(位置，大小以及贴纸图像)，生成改变后的贴纸，然后跟视频帧做融合。

综上所述，本申请实施例所示的方案，终端预先在视频播放界面中显示一个触发控件，检测到用户对该触发控件的激活操作时，即可以暂停视频播放，后续再接收到对触发控件的拖动操作时，将拖动操作结束位置对应的显示对象确定为目标对象，后续播放过程中对应各个画面帧中同样的目标对象显示附加对象，从而达到在视频播放过程中保持附加对象与视频播放画面相匹配的效果。

此外，本申请实施例所示的方案，由于触发控件已经预先显示在视频播放界面中，用户在当前界面中通过激活和拖动操作即可以添加附加对象，从而提高添加显示附加对象的效率。

本技术方案，主要是针对贴纸(也就是附加显示对象)跟随的功能及交互上进行设计，同时在跟踪物体的准确度上保持较好的水平。在功能上，本方案支持静态贴纸和动态贴纸的跟踪，并且可以对整个视频中的目标进行追踪；在交互上，用户可以点击钉子(即附加显示对象对应的触控组件)停止画面，这时候拖动贴纸进行标定目标位置，点击任意区域后开始处理追踪，处理完成之后继续播放，在播放的过程中根据追踪数据改变贴纸的属性。

其中，动态贴纸的资源可以采用便携式网格图形(Animated Portable Network Graphics，APNG)的格式文件，添加动态贴纸后，终端对APNG文件进行解码，然后根据时间戳渲染到对应的画面帧上，包括根据视频渲染时的时间戳找到APNG对应的图像。其中，APNG是PNG的位图动画扩展，可以实现PNG格式的动态图片效果。

上述图3所示的实施例提供的方案，可以应用于拍摄完短视频后添加贴纸玩法的场景。即在拍摄后可以添加静态或动态贴纸，并根据需求选中追踪目标，然后进行贴身跟随模式的追踪。

其中，上述贴身跟随模式，是指贴纸附加对象在各个画面帧中紧贴着目标对象进行显示的模式。

以附加对象是贴纸为例，请参考图11，其示出了本申请一示例性实施例提供的一种贴身跟随模式的操作示意图。如图11所示，贴纸的贴身跟随模式的使用方式主要步骤如下：

1、获取到视频(比如拍摄视频)后自动进入视频编辑界面，在编辑栏中添加一个贴纸(静态或动态)。

2、点击要编辑的贴纸进入编辑状态，出现编辑框。

3、视频播放过程中，如果有要选中的追踪目标，则用户可以点击编辑框左下方的钉子按钮(即触发控件)，视频预览界面会停止播放，同时会在贴纸下方出现透明灰色蒙层，以便更直观的显示在追踪操作过程中。

4、用户拖动贴纸做精准的定位，然后点击贴纸之外的其他区域。

5、预览界面会出现loading状态，做追踪处理，处理完视频恢复播放，选中的贴纸也会根据追踪数据进行位置以及大小的改变。

贴纸的贴身跟随模式在实际使用过程中可以选中人脸，达到挡住人脸的作用，并用动态贴纸做出娱乐化的视频画面，除了人脸遮挡之外，也可以使用在其它的场景，比如遮挡物体等等。

请参考图12，其示出了本申请一示例性实施例提供的另一种贴身跟随模式的操作示意图，如图12所示，在视频播放过程中，画面上层显示一个钉子的图标(即触发控件)以及贴纸。当用户点击钉子时，视频暂停播放，此时画面静止。在画面静止后，用户可以在静止的画面上拖动贴纸，以选择贴纸跟随的目标(即图12中人物的头部)。用户点击静止的画面中除了贴纸以及钉子之外的其它区域后，视频恢复播放，并且，贴纸开始跟随选择的目标(人物的头部)运动。

上述图3所示的实施例提供的方案，也可以应用于拍摄完短视频后添加贴纸玩法的场景。即在拍摄后可以添加静态或动态贴纸，并根据需求选中追踪目标，然后进行风筝模式的追踪。

其中，风筝模式是指贴纸跟随目标对象一起移动改变，但并不会挡住目标对象的模式，其中，贴身跟随模式严格意义上可以归纳为风筝模式下的一个特殊场景，只是定位追踪目标区域为贴纸本身所在的区域，而风筝模式选中的区域可以随意拖动，贴纸只是根据和选中的区域相对位置信息做适当的位置以及大小的改变，请参考图13，其示出了本申请一示例性实施例提供的一种风筝模式的操作示意图。如图13所示，风筝模式如下：

2、点击要编辑的贴纸进入编辑状态，出现编辑框。

4、用户拖动钉子，钉子在选中状态下可以独立于贴纸而被拖出来，拖到要追踪目标上方，同时拖动贴纸做精准的定位，终端处理好贴纸与钉子的相对位置，然后用户点击贴纸之外的其他区域。

贴纸的风筝模式在使用场景上，可以选择让一个动态贴纸根据追踪目标，比如，可以是追踪建筑物目标，此时贴纸作为地理位置的标识进行显示，以用来标记建筑物等。

请参考图14，其示出了本申请一示例性实施例提供的另一种风筝模式的操作示意图，如图14所示，在视频播放过程中，画面上层显示一个钉子的图标(即触发控件)以及贴纸。与图12不同的是，在图14所示的模式中，当画面静止时，若用户按住钉子，该钉子可以脱离贴纸被用户拖动，用户拖动钉子以选择贴纸对应的目标时，钉子与贴纸之间可以显示一根连线，以指示钉子和贴纸之间的相对位置关系。用户拖动完毕并松开手指后，钉子会以闪烁的动画形式进行显示，用户点击静止的画面中除了贴纸以及钉子之外的其它区域后，视频恢复播放，并且，贴纸开始跟随选择的目标以类似风筝的形式运动。

本申请提出的方案旨在解决视频编辑阶段添加显示附加对象的效率较低的问题，可以给用户提供两种跟踪模式(贴身跟随模式以及风筝模式)，提供友好的操作可以精确的选中追踪目标，不管在短视频哪个时间戳选中了追踪目标，都会对整个短视频进行追踪。在保证支持动态贴纸追踪能力，增加娱乐性，同时也要保证追踪的准确性。

图15是根据一示例性实施例示出的一种附加对象显示装置的结构方框图。该虚拟对象控制装置可以用于终端中，以执行图1或图3任一实施例所示的方法的全部或者部分步骤。该附加对象显示装置可以包括：

控件显示模块1501，用于在视频播放界面中显示触发控件，所述视频播放界面用于播放视频；

暂停模块1502，用于响应于对所述触发控件的激活操作，暂停播放所述视频，以在所述视频播放界面中显示参考画面帧，所述参考画面帧是所述视频中对应在暂停时间点处的画面帧；

对象获取模块1503，用于响应于对所述触发控件的拖动操作，获取目标对象；所述目标对象是所述参考画面帧中对应在所述拖动操作的结束位置的显示对象；

对象显示模块1504，用于播放所述视频时，在所述视频的画面帧中对应所述目标对象显示所述触发控件对应的附加对象。

可选的，所述装置还包括：追踪模块，用于在所述对象显示模块1504在所述视频中对应所述目标对象显示所述触发控件对应的附加对象之前，在所述视频中的各个画面帧中追踪所述目标对象，获得第一显示信息，所述第一显示信息用于指示所述目标对象分别在所述各个画面帧中的显示位置、显示尺寸以及显示姿态中的至少一种；

所述对象显示模块1504，具体用于在播放所述视频时，根据所述第二显示信息，分别在所述各个画面帧中显示所述附加对象。

可选的，所述第一显示信息包括所述目标对象中的目标点分别在所述各个画面帧中的像素坐标，所述目标点是所述目标对象中对应所述拖动操作的结束位置的位置点，所述信息生成模块，具体用于，

根据所述目标对象中的目标点分别在所述各个画面帧中的像素坐标，以及所述附加对象与所述目标点之间的相对位置信息，获取所述附加对象分别在所述各个画面帧中的像素坐标；

生成包含所述附加对象分别在所述各个画面帧中的像素坐标的所述第二显示信息。

可选的，所述第一显示信息包括所述目标对象分别在所述各个画面帧中的显示尺寸，所述信息生成模块，具体用于，

根据所述目标对象分别在所述各个画面帧中的显示尺寸，以及所述目标对象的原始尺寸，计算所述附加对象分别在所述各个画面帧中的缩放倍率；所述目标对象的原始尺寸是所述目标对象在所述参考画面帧中的显示尺寸；

根据所述附加对象的原始尺寸和所述缩放倍率获取所述附加对象在所述各个画面帧中的显示尺寸；

生成包含所述附加对象在所述各个画面帧中的显示尺寸的所述第二显示信息。

可选的，所述第一显示信息包括所述目标对象分别在所述各个画面帧中的显示位置和显示姿态，所述信息生成模块，具体用于，

根据所述目标对象分别在所述各个画面帧中的显示位置和显示姿态，以及所述附加对象与所述目标点之间的相对位置信息，获取所述附加对象分别在所述各个画面帧中的显示位置和显示姿态；

生成包含所述附加对象分别在所述各个画面帧中的显示位置和显示姿态的所述第二显示信息。

图16示出了本申请一个示例性实施例提供的终端1600的结构框图。该终端1600可以是：智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1600还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端1600包括有：处理器1601和存储器1602。

处理器1601可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1601可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1601也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central Processing Unit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1601可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1601还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1602可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1602还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1602中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器1601所执行以实现本申请中方法实施例提供的附加对象显示方法。

在一些实施例中，终端1600还可选包括有：外围设备接口1603和至少一个外围设备。处理器1601、存储器1602和外围设备接口1603之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1603相连。具体地，外围设备包括：射频电路1604、触摸显示屏1605、摄像头1606、音频电路1607、定位组件1608和电源1609中的至少一种。

外围设备接口1603可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器1601和存储器1602。在一些实施例中，处理器1601、存储器1602和外围设备接口1603被集成在同一芯片或电路板上；在一些其他实施例中，处理器1601、存储器1602和外围设备接口1603中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1604用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1604将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1604包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1604可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1604还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏1605用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1605是触摸显示屏时，显示屏1605还具有采集在显示屏1605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1601进行处理。此时，显示屏1605还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1605可以为一个，设置终端1600的前面板；在另一些实施例中，显示屏1605可以为至少两个，分别设置在终端1600的不同表面或呈折叠设计；在再一些实施例中，显示屏1605可以是柔性显示屏，设置在终端1600的弯曲表面上或折叠面上。甚至，显示屏1605还可以设置成非矩形的不规则图形，也即异形屏。显示屏1605可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件1606用于采集图像或视频。可选地，摄像头组件1606包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1606还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1601进行处理，或者输入至射频电路1604以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端1600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1601或射频电路1604的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1607还可以包括耳机插孔。

定位组件1608用于定位终端1600的当前地理位置，以实现导航或LBS(Location Based Service，基于位置的服务)。定位组件1608可以是基于美国的GPS(Global Positioning System，全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源1609用于为终端1600中的各个组件进行供电。电源1609可以是交流电、直流电、一次性电池或可充电电池。当电源1609包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端1600还包括有一个或多个传感器1610。该一个或多个传感器1610包括但不限于：加速度传感器1611、陀螺仪传感器1612、压力传感器1613、指纹传感器1614、光学传感器1615以及接近传感器1616。

加速度传感器1611可以检测以终端1600建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1611可以用于检测重力加速度在三个坐标轴上的分量。处理器1601可以根据加速度传感器1611采集的重力加速度信号，控制触摸显示屏1605以横向视图或纵向视图进行用户界面的显示。加速度传感器1611还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1612可以检测终端1600的机体方向及转动角度，陀螺仪传感器1612可以与加速度传感器1611协同采集用户对终端1600的3D动作。处理器1601根据陀螺仪传感器1612采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1613可以设置在终端1600的侧边框和/或触摸显示屏1605的下层。当压力传感器1613设置在终端1600的侧边框时，可以检测用户对终端1600的握持信号，由处理器1601根据压力传感器1613采集的握持信号进行左右手识别或快捷操作。当压力传感器1613设置在触摸显示屏1605的下层时，由处理器1601根据用户对触摸显示屏1605的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器1614用于采集用户的指纹，由处理器1601根据指纹传感器1614采集到的指纹识别用户的身份，或者，由指纹传感器1614根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器1601授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1614可以被设置终端1600的正面、背面或侧面。当终端1600上设置有物理按键或厂商Logo时，指纹传感器1614可以与物理按键或厂商Logo集成在一起。

光学传感器1615用于采集环境光强度。在一个实施例中，处理器1601可以根据光学传感器1615采集的环境光强度，控制触摸显示屏1605的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏1605的显示亮度；当环境光强度较低时，调低触摸显示屏1605的显示亮度。在另一个实施例中，处理器1601还可以根据光学传感器1615采集的环境光强度，动态调整摄像头组件1606的拍摄参数。

接近传感器1616，也称距离传感器，通常设置在终端1600的前面板。接近传感器1616用于采集用户与终端1600的正面之间的距离。在一个实施例中，当接近传感器1616检测到用户与终端1600的正面之间的距离逐渐变小时，由处理器1601控制触摸显示屏1605从亮屏状态切换为息屏状态；当接近传感器1616检测到用户与终端1600的正面之间的距离逐渐变大时，由处理器1601控制触摸显示屏1605从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图16中示出的结构并不构成对终端1600的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

在一示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括至少一条指令、至少一段程序、代码集或指令集的存储器，上述至少一条指令、至少一段程序、代码集或指令集可由处理器执行以完成上述图1或图3任一实施例所示的方法的全部或者部分步骤。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由下面的权利要求指出。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims

一种附加对象显示方法，其特征在于，所述方法由终端执行，所述方法包括：

在视频播放界面中显示触发控件，所述视频播放界面用于播放视频；

响应于对所述触发控件的激活操作，暂停播放所述视频，并在所述视频播放界面中显示参考画面帧，所述参考画面帧是所述视频中对应在暂停时间点处的画面帧；

响应于对所述触发控件的拖动操作，获取目标对象；所述目标对象是所述参考画面帧中对应在所述拖动操作的结束位置的显示对象；

在播放所述视频时，在所述视频的画面帧中对应所述目标对象显示所述触发控件对应的附加对象。
根据权利要求1所述的方法，其特征在于，在所述视频中对应所述目标对象显示所述触发控件对应的附加对象之前，还包括：

在所述视频中的各个画面帧中追踪所述目标对象，获得第一显示信息，所述第一显示信息用于指示所述目标对象分别在所述各个画面帧中的显示位置、显示尺寸以及显示姿态中的至少一种；

根据所述第一显示信息生成第二显示信息，所述第二显示信息用于指示所述附加对象分别在所述各个画面帧中的显示位置、显示尺寸以及显示姿态中的至少一种；

所述在播放所述视频时，在所述视频的画面帧中对应所述目标对象显示所述触发控件对应的附加对象，包括：

在播放所述视频时，根据所述第二显示信息分别在所述各个画面帧中显示所述附加对象。
根据权利要求2所述的方法，其特征在于，所述第一显示信息包括所述目标对象中的目标点分别在所述各个画面帧中的像素坐标，所述目标点是所述目标对象中对应所述拖动操作的结束位置的位置点；

所述根据所述第一显示信息生成第二显示信息，包括：

根据所述目标对象中的目标点分别在所述各个画面帧中的像素坐标，以及所述附加对象与所述目标点之间的相对位置信息，获取所述附加对象分别在所述各个画面帧中的像素坐标；

生成包含所述附加对象分别在所述各个画面帧中的像素坐标的所述第二显示信息。
根据权利要求3所述的方法，其特征在于，所述方法还包括：

在所述视频播放界面中显示所述附加对象的预览图；

获取所述预览图在所述参考画面帧中的显示位置；

根据所述预览图在所述参考画面帧中的显示位置，以及所述拖动操作对应在所述参考画面帧中的结束位置，获取所述附加对象与所述目标点之间的相对位置信息。
根据权利要求4所述的方法，其特征在于，所述方法还包括：

响应于对所述附加对象的预览图的拖动操作，移动所述附加对象的预览图在所述视频播放界面中的位置。
根据权利要求2所述的方法，其特征在于，所述第一显示信息包括所述目标对象分别在所述各个画面帧中的显示尺寸；

所述根据所述第一显示信息生成第二显示信息，包括：

根据所述目标对象分别在所述各个画面帧中的显示尺寸，以及所述目标对象的原始尺寸，计算所述附加对象分别在所述各个画面帧中的缩放倍率；所述目标对象的原始尺寸是所述目标对象在所述参考画面帧中的显示尺寸；

根据所述附加对象的原始尺寸和所述缩放倍率获取所述附加对象在所述各个画面帧中的显示尺寸；

生成包含所述附加对象在所述各个画面帧中的显示尺寸的所述第二显示信息。
根据权利要求2所述的方法，其特征在于，所述第一显示信息包括所述目标对象分别在所述各个画面帧中的显示位置和显示姿态；

所述根据所述第一显示信息生成第二显示信息，包括：

根据所述目标对象分别在所述各个画面帧中的显示位置和显示姿态，以及所述附加对象与所述目标点之间的相对位置信息，获取所述附加对象分别在所述各个画面帧中的显示位置和显示姿态；

生成包含所述附加对象分别在所述各个画面帧中的显示位置和显示姿态的所述第二显示信息。
根据权利要求2所述的方法，其特征在于，所述在所述视频中的各个画面帧中追踪所述目标对象，获得第一显示信息，包括：

从所述参考画面帧开始，按照播放时间顺序和/或播放时间逆序，在所述各个画面帧中逐帧追踪所述目标显示对象，获得所述第一显示信息。
根据权利要求2所述的方法，其特征在于，所述在所述视频中的各个画面帧中追踪所述目标对象，获得第一显示信息，包括：

通过可变形物体跟踪的静态自适应对应聚类CMT算法在所述视频中的各个画面帧中追踪所述目标对象，获得所述第一显示信息。
根据权利要求1至9任一所述的方法，其特征在于，所述方法还包括：

在所述视频播放界面中，对应所述触发控件显示切换控件；

响应于对所述切换控件的激活操作，显示附加对象选择界面，所述附加对象选择界面中包含至少两个备选对象；

响应于在所述附加对象选择界面中的选择操作，将所述选择操作对应的备选对象获取为所述触发控件对应的新的附加对象。
根据权利要求1至9任一所述的方法，其特征在于，所述附加对象为静态显示对象，或者，所述附加对象为动态显示对象。
一种附加对象显示装置，其特征在于，所述装置用于终端中，所述装置包括：

控件显示模块，用于在视频播放界面中显示触发控件，所述视频播放界面用于播放视频；

暂停模块，用于响应于对所述触发控件的激活操作，暂停播放所述视频，并在所述视频播放界面中显示参考画面帧，所述参考画面帧是所述视频中对应在暂停时间点处的画面帧；

对象获取模块，用于响应于对所述触发控件的拖动操作，获取目标对象；所述目标对象是所述参考画面帧中对应在所述拖动操作的结束位置的显示对象；

对象显示模块，用于在播放所述视频时，在所述视频的画面帧中对应所述目标对象显示所述触发控件对应的附加对象。
根据权利要求12所述的装置，其特征在于，所述装置还包括：

追踪模块，用于在所述对象显示模块在所述视频中对应所述目标对象显示所述触发控件对应的附加对象之前，在所述视频中的各个画面帧中追踪所述目标对象，获得第一显示信息，所述第一显示信息用于指示所述目标对象分别在所述各个画面帧中的显示位置、显示尺寸以及显示姿态中的至少一种；

信息生成模块，用于根据所述第一显示信息生成第二显示信息，所述第二显示信息用于指示所述附加对象分别在所述各个画面帧中的显示位置、显示尺寸以及显示姿态中的至少一种；

所述对象显示模块，具体用于在播放所述视频时，根据所述第二显示信息，分别在所述各个画面帧中显示所述附加对象。
一种计算机设备，其特征在于，所述计算机设备包含处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至11任一所述的附加对象显示方法。
一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至11任一所述的附加对象显示方法。