WO2023207522A1

WO2023207522A1 - 视频合成方法、装置、设备、介质及产品

Info

Publication number: WO2023207522A1
Application number: PCT/CN2023/085796
Authority: WO
Inventors: 杨焜傲; 王婕; 高晶; 李秋婷
Original assignee: 北京字跳网络技术有限公司
Priority date: 2022-04-29
Filing date: 2023-03-31
Publication date: 2023-11-02
Also published as: CN114881901A

Abstract

本公开实施例提供一种视频合成方法、装置、设备、介质及产品。该方法包括：对待处理视频中的图像帧进行图像分割，获得目标对象对应的区域图像和除区域图像之外的背景图像；确定区域图像对应的镜像图像；在第一扩展方向对所述区域图像进行扩展处理，获得至少一个第一扩展图像；至少一个第一扩展图像包括区域图像；在第二扩展方向对所述镜像图像进行扩展处理，获得至少一个第二扩展图像；对背景图像、至少一个第二扩展图像和至少一个第一扩展图像进行渲染，获得渲染结束时的目标渲染图像；将图像帧对应的目标渲染图像进行视频合成，获得待处理视频对应的目标视频。通过对视频图像的检测和扩展解决了视频处理方式较为单一的问题。

Description

视频合成方法、装置、设备、介质及产品

相关申请交叉引用

本申请要求于2022年04月29日提交中国专利局、申请号为202210476242.2、发明名称为“视频合成方法、装置、设备、介质及产品”的中国专利申请的优先权，其全部内容通过引用并入本文。

技术领域

本公开实施例涉及计算机技术领域，尤其涉及一种视频合成方法、装置、设备、介质及产品。

背景技术

随着视频领域的迅速发展，短视频和直播视频等视频播放领域中对增加视频的趣味性需求日益增加。特别是在视频的实时采集场景中，目前的视频处理方式多是在视频中增加弹幕、贴图等趣味性内容。

但是，现有的视频趣味性提升的手段，对视频的处理方式较为单一，内容不够丰富，导致视频的传播速度不高，利用率不高。

发明内容

本公开实施例提供一种分身视频合成的视频合成方法、装置、设备、介质及产品，以克服现有技术中视频处理方式较为单一的技术问题。

第一方面，本公开实施例提供一种视频合成方法，包括：

对待处理视频中的图像帧进行图像分割，获得目标对象对应的区域图像和除所述区域图像之外的背景图像；

确定所述区域图像对应的镜像图像；

在第一扩展方向对所述区域图像进行扩展处理，获得至少一个第一扩展图像；至少一个所述第一扩展图像包括所述区域图像；

在第二扩展方向对所述镜像图像进行扩展处理，获得至少一个第二扩展图像；所述第一扩展方向和所述第二扩展方向不同；

对所述背景图像、至少一个所述第二扩展图像和至少一个所述第一扩展图像进行渲染，获得渲染结束时的目标渲染图像；

将所述图像帧对应的目标渲染图像进行视频合成，获得所述待处理视频对应的目标视频。

第二方面，本公开实施例提供一种用于视频合成装置，包括：

图像分割单元，用于对待处理视频中的图像帧进行图像分割，获得目标对象对应的区域图像和除所述区域图像之外的背景图像；

镜像处理单元，用于确定所述区域图像对应的镜像图像；

第一扩展单元，用于在第一扩展方向对所述区域图像进行扩展处理，获得至少一个第一扩展图像；至少一个所述第一扩展图像包括所述区域图像；

第二扩展单元，用于在第二扩展方向对所述镜像图像进行扩展处理，获得至少一个第二扩展图像；所述第一扩展方向和所述第二扩展方向不同；

图像渲染单元，用于对所述背景图像、至少一个所述第二扩展图像和至少一个所述第一扩展图像进行渲染，获得渲染结束时的目标渲染图像；

视频合成单元，用于将所述图像帧对应的目标渲染图像进行视频合成，获得所述待处理视频对应的目标视频。

第三方面，本公开实施例提供一种电子设备，包括：处理器以及存储器；

所述存储器存储计算机执行指令；

所述处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的视频合成方法。

第四方面，本公开实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上第一方面以及第一方面各种可能的设计所述的视频合成方法。

第五方面，本公开实施例提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能的设计所述的视频合成方法。

第六方面，本公开实施例还提供一种计算机程序，该计算机程序被处理器运行时实现如上第一方面以及第一方面各种可能的设计的视频合成方法。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的一种用于分身视频合成方法的一个应用示意图；

图2为本公开实施例提供的一种视频合成方法的一个实施例的流程图；

图3为本公开实施例提供的一个镜像图像的示例图；

图4为本公开实施例提供的一种视频合成方法的又一个实施例的流程图；

图5为本公开实施例提供的一个位移点的示例图；

图6为本公开实施例提供的一种视频合成方法的又一个实施例的流程图；

图7为本公开实施例提供的一个目标渲染图像的示例图；

图8为本公开实施例提供的一种视频合成方法的又一个实施例的流程图；

图9为本公开实施例提供的一种视频合成装置的一个结构示例图；

图10为本公开实施例提供的一种电子设备的硬件结构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

本公开的技术方案可以应用于视频领域，可以通过对视频进行分身提取并扩展、渲染获得渲染图像，并利用各个视频帧的渲染图像合成视频，这一过程中从图像帧提取至图像分割、图像扩展以及渲染合成，均可以自动完成，获得渲染结束时的分身视频，提高分身视频的显示效率。

相关技术中，各种直播视频、短视频对视频的实时处理性需求较高。目前，较为常见的视频实时处理方式一般是，在视频中增加弹幕、贴图等内容，实现视频播放趣味性的提升。但是，这种处理方式较为单一，对视频的传播速度和推荐速度的提升并不高。

为了解决上述技术问题，本公开中考虑增加对视频中处于运动状态的对象进行分身，以增加视频为趣味性。因此，考虑对每帧图像进行自动分身，然后将分身后的视频帧合成为目标视频。为了获得分身的图像，可以将目标对象的区域图像和镜像图像在不同方向进行扩展，然后将扩展的图像进行统一渲染，获得对应的目标渲染图像。通过这种方式可以实现图像中的对象分身以利用视频合成，提高视频的合成效率和趣味性，对视频的播放率提升具有积极作用。

本公开的实施例中，对待处理视频中的图像帧进行分割，获得目标对象所在的区域图像和背景图像，在第一扩展方向对区域图像进行扩展和第二扩展方向对镜像图像进行图像扩展，获得至少一个第一扩展图像和至少一个第二扩展图像，通过至少一个第一扩展图像和至少一个第二扩展图像以及背景图像的渲染，获得具备目标对象分身的目标渲染图像。目标渲染图像是通过渲染背景图像、至少一个第二扩展图像和至少一个第一扩展图像获得的，可以展示正向的分身和反向的分身，提高图像的展示效率。将图像帧对应的目标渲染图像进行视频合成，获得待处理视频的目标视频，通过自动完成图像渲染和目标视频的自动合成，可以提高视频的获取效率和精度，确保目标视频的播放量和播放速度得到有效提升。

下面将以具体实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面几个具体实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图对本发明的实施例进行详细描述。

图1是根据本公开视频合成方法的一个应用示意图。根据本公开实施例的应用示意图中可以包括一个电子设备以及一个与该电子设备通过局域网或者广域网进行网络连接的用户端，假设该电子设备可以为个人计算机、普通服务器，超级个人计算机，云服务器等类型的服务器，本公开中对电子设备的具体类型并不作出过多限定。客户端例如可以为手机、平板电脑、个人计算机、智能家电、可穿戴设备等终端设备，本公中对客户端的具体类型并不作出过多限定。如图1所示，以电子设备为云服务器1，用户端2可以配置于手机21、平板电脑22等终端设备为例，任一个用户端2可以向云服务器1提供待处理视频。云服务器1中可以获取任一个用户端2发送的待处理视频，并基于本公开实施例提供的视频合成方法，合成目标视频。

之后，云服务器1可以将合成的目标视频发送至用户端2。此外，在实际应用中，目标视频被用户端2确认发布之后，可以对目标视频进行发布。目标视频发布成功，其它用户端3，例如图1所示的手机3，可以获取目标视频并播放目标视频。当然在实际应用中也可以向其它用户端3推荐目标视频，提高目标视频的播放率。

参考图2，图2为本公开实施例提供的一种视频合成方法的一个实施例的流程图，该方法可以配置为一视频合成装置，视频合成装置可以位于电子设备中。其中，视频合成方法可以包括以下几个步骤：

201：对待处理视频中的图像帧进行图像分割，获得目标对象对应的区域图像和除区域图像之外的背景图像。

可选地，图像帧可以从待处理视频中采样获得。在实际应用中，待处理视频可以对应有帧率((Frame rate))＝帧数(Frames)/时间(Time)，帧率的单位为帧每秒(f/s,frames per second,fps)，在从待处理视频中采样时，可设置采样频率包括待处理视频的帧率。若设置采样频率与图像帧的帧率相同，则可以确保视频中的每个图像帧均可以被采样，并采用本公开的技术方案进行图像处理以获得对应的目标渲染图像。

当然，在实际应用中，待处理视频的采样频率也可以根据实际需求设置，并不局限于与帧率等同。采样频率越高，单位时间内被采集的图像帧的数量越多，出现不连续画面的可能性越低。采样频率越低，单位时间内被采集的图像着呢的数量越少，出现不连续画面的可能性越高。

图像帧可以从待处理视频中采样获得。图像帧可以包括至少一个，每个图像帧均可以通过步骤201-204获得对应的目标渲染图像。

区域图像可以为目标对象的轮廓所在区域的图像，可以为不规则的图像。背景图像可以为待处理视频中除目标对象轮廓之外的其它区域所对应的图像。

可选地，目标对象可以包括人体、物体、动物等可以运动的物体，较为常见的目标对象例如可以包括运动过程中的人或者动物。

202：确定区域图像对应的镜像图像。

镜像图像可以通过对区域图像进行镜像翻转获得，镜像图像的图像内容与区域图像相同，但是显示方向相反。

镜像图像可以包括水平镜像图像、垂直镜像图像和对角镜像图像中的任一种。其中，水面镜像图像是指将图像的左右部分以图像垂直中轴线为中心进行镜像对换。垂直镜像图像可以是将图像的上下两个部分以图像水平中轴线为中心进行镜像对换。而对角镜像图像可以是将图像以图像水平中轴线和垂直中轴线的交点为中心进行镜像对换，相当于将图像先后执行水平镜像和垂直镜像。为了便于理解，参考图3所示的三角形301，其顶点A在边长B的左边，经过水平镜像对换301之后，顶点A’在边长B’的右边。

203：在第一扩展方向对区域图像进行扩展处理，获得至少一个第一扩展图像；至少一个第一扩展图像包括区域图像。

204：在第二扩展方向对镜像图像进行扩展处理，获得至少一个第二扩展图像。

其中，第一扩展方向和第二扩展方向不同。

在某些实施例中，第一扩展方向和第二扩展方向可以相反。也即，第一扩展方向和第二扩展方向的夹角为180度。当然，第一扩展方向和第二扩展方向也可以是基于水平线的垂线所形成的两个夹角确定，水平线的垂线可以作为两个夹角的公共边，两个夹角的另一边指向的方向可以分别为第一扩展方向和第二扩展方向。假设两个夹角使用夹角A和夹角B表示。在实际应用中夹角A和夹角B的夹角角度可以相等也可以不相等，夹角A和夹角B的夹角角度在0至180度之间。其中，夹角为90度时，第一扩展方向和第二扩展方向相反。夹角A和夹角B相同时，第一扩展方向和第二扩展方向相对于水平线的垂线对称。

可选地，以在水平线的垂线为例，第一扩展方向可以包括水平线的垂线右侧，第二扩展方向可以包括水平线的垂线右侧。在实际应用中，水平线可以包括目标对象的中心点所对应的水平线。为了便于理解，以图像在显示屏幕显示，人观看显示屏幕中的图像为例，人眼能观看到的显示屏幕中图像的左方可以为反向，人眼能观看到的显示屏幕中图像的右方可以为正向。正向和反向具体可以是指图像的左方扩展还是右方扩展。区域图像可以向右进行第一扩展方向的扩展，获得至少一个第一扩展图像，向左进行第二扩展方向的扩展，获得至少一个第二扩展图像。

205：对背景图像、至少一个第二扩展图像和至少一个第一扩展图像进行渲染，获得渲染结束时的目标渲染图像。

可选地，目标渲染图像可以为背景图像、至少一个第二扩展图像和至少一个第一扩展图像分别渲染获得的，具体可以包括背景图像、至少一个第二扩展图像和至少一个第一扩展图像多层渲染结束时获得的渲染图像。

206：将图像帧对应的目标渲染图像进行视频合成，获得待处理视频对应的目标视频。

目标视频可以由多个图像帧分别对应的目标渲染图像合成获得。将图像帧对应的目标渲染图像进行视频合成时，可以按照图像帧的时间戳将该图像帧对应的目标渲染图像进行视频合成。图像帧的时间戳即为其对应的目标渲染图像的时间戳。视频合成的过程中，可以根据待处理视频的帧率确定目标视频的帧率，通过视频的帧率可以对视频的合成时间进行准确控制。

本公开实施例中，对待处理视频中的图像帧进行分割，获得目标对象所在的区域图像和背景图像，利用区域图像和区域图像的镜像图像进行图像扩展，获得至少一个第一扩展图像和至少一个第二扩展图像，通过至少一个第一扩展图像和至少一个第二扩展图像以及背景图像的渲染，获得具备目标对象分身的目标渲染图像。目标渲染图像是通过渲染背景图像、至少一个第二扩展图像和至少一个第一扩展图像获得的，可以展示正向的分身和反向的分身，提高图像的展示效率。之后可以将图像帧对应的目标渲染图像进行视频合成，获得待处理视频的目标视频，通过自动完成图像渲染和目标视频的自动合成，可以提高视频的获取效率和精度，确保目标视频的播放量和播放速度得到有效提升。

此外，本公开中涉及的待处理视频可以是实时采集的，通过对实时采集的视频进行图像帧的提取。之后对图像帧进行目标对象的区域分割，以利用分割获得的区域图像进行镜像翻转，实现正向的区域图像的扩展和镜像的镜像图像的扩展，获得至少一个第一扩展图像和至少一个第二扩展图像。通过对除区域图像之外的背景图像、至少以第一扩展图像和至少一个第二扩展图像的渲染，获得目标渲染图像，以利用目标渲染图像进行视频的合成。这一过程中均是自动完成的，并不需要人工介入，例如常见的绘图软件的手动复制等操作，视频的合成效率较高，可以解决现有技术中手动完成分身视频的合成效率较低的问题。

本实施例中，对待处理视频中的图像帧进行分割，获得目标对象所在的区域图像和背景图像，利用区域图像和区域图像的镜像图像进行图像扩展，具体可以通过第一扩展方向对区域图像进行扩展，获得至少一个第一扩展图像，通过第二扩展方向对镜像图像进行扩展，获得至少一个第二扩展图像。通过图像的扩展，可以实现对目标对象的分身。进而通过至少一个第一扩展图像和至少一个第二扩展图像以及背景图像的渲染，获得具备目标对象分身的目标渲染图像。目标渲染图像是通过渲染背景图像、至少一个第二扩展图像和至少一个第一扩展图像获得的，可以展示第一扩展方向和第二扩展方向的扩展图像，提高图像的展示效率和趣味性。将图像帧对应的目标渲染图像进行视频合成，获得待处理视频的目标视频，通过自动完成图像渲染和目标视频的自动合成，可以提高视频的获取效率和精度，确保目标视频的播放速度和效率得到有效提升。

为了获得准确的第一扩展图像，如图4所示，为本公开实施例提供的一种视频合成方法的又一个实施例的流程图，与其它实施例的不同之处在于，其中，在第一扩展方向对区域图像进行扩展处理，获得至少一个第一扩展图像，可以包括：

401：确定目标对象在图像帧对应的位移速度。

位移速度可以指目标对象在待处理视频中的移动速度。例如假设目标对象从视频播放时，在N位置，在播放至第二帧图像时，移动至M位置，则目标对象的位移速度可以根据N位置和M位置的差值结合两个图像帧的时间差计算获得。

402：以区域图像的原始位置点作为基础，按照位移速度和第一扩展方向进行位移处理，获得包含原始位置点的至少一个正向位移点。

区域图像可以指将图像帧中属于目标对象的像素点进行标记，获得区域图像在图像帧中的像素点，区域图像所对应像素点的坐标点还可以通过图像帧的像素坐标系表示。未被标记为区域图像的像素点即为背景图像的像素点。

其中，区域图像的原始位置点可以指目标对象的关键点在图像帧所对应的像素坐标点。关键点可以指能够对区域图像的位置进行确认的像素点，该像素点的坐标是通过整个图像帧的像素坐标系表示的。原始位置点例如可以包括区域图像的中心点在图像帧中的坐标点。例如，目标对象为人体为例，还可以为人体中某个关键位置点，例如眉心点、鼻尖点、中心点等像素点的坐标，关于原始位置点所对应的位置含义并不在此进行限制。同样，正向位移点可以包括原始位置点产生位移之后获得的位于图像帧中的像素坐标点。原始位置点和正向位移点均可以包括位于图像帧的像素坐标系中的坐标点。

可选地，第一扩展方向可以包括正向位移角度。第一扩展方向可以通过目标对象在视频帧中的轨迹确定。例如，同样以由N位置移动到M位置为例，两个位置连线相对于水平线或者垂线可能存在夹角，该夹角即为正向位移角度。假设正向位移角度为45度为例，目标对象位移时，可以向右上方且与水平线夹角为45度的直线，移动的距离按照位移速度计算获得点，即为一个正向位移点。为了便于理解，如图5所示，假设P0为原始位置点，P0按照正向位移45度，获得的正向位移点可以为P1。

403：将区域图像复制到正向位移点，获得区域图像在至少一个正向位移点分别对应的第一扩展图像。

将区域图像复制到正向位移点，可以包括将区域图像的像素点所对应的像素值，按照正向位移点移动到对应的坐标点，也即，可以根据区域图像在图像帧中的坐标点和正向位移点，确定第一扩展图像在图像帧中的正向坐标点，通过将区域图像中的坐标点处的像素值赋值给对应的正向坐标点，即可以获得正向坐标点所对应的像素值构成的第一扩展图像。当然，在实际应用中，区域图像的像素点可以包括多个，可以根据正向位移点一一将每个像素点进行移动，获得移动后的多个像素点组成的第一扩展图像。第一扩展图像中，除移动后的区域图像的像素点的坐标值为真，其它像素点的坐标被设置为透明属性，显示时均是透明的，不存在颜色的，以不对其它图像，例如背景图像产生显示遮挡。

正向位移点可以包括原始位置点，也即在不对区域图像进行位移的情况下，生成一原始位置点对应的第一扩展图像，可以确保原始位置处的区域图像能够正常显示。原始位置点对应的第一扩展图像的像素点的坐标不发生变化。

本公开实施例，可以通过获取目标对象的位移速度，在目标对象的原始位置点的基础上进行正向位移获得准确的至少一个正向位移点。以利用至少一个正向位移点，将区域图像按照正向位移点进行确认，以获得正向位移点确定对应的第一扩展图像，提高第一扩展图像的定位准确性，获得定位精度更高的至少一个正向位移点分别对应的第一扩展图像。

在一种可能的设计中，以区域图像的原始位置点作为基础，按照位移速度和第一扩展方向进行位移处理，获得包含原始位置点的至少一个正向位移点，可以包括：

确定区域图像的区域宽度和图像帧的图像宽度。

基于区域宽度和图像宽度，结合位移速度，在第一扩展方向上计算区域图像的正向位移数量以及正向偏移步长。

根据区域图像的原始位置，按照每次正向偏移步长和正向位移数量，确定至少一个正向位置点，获得原始位置点和至少一个正向位置点构成的至少一个正向位移点。

可选地，区域图像的区域宽度可以指对象轮廓区域的水平宽度。图像宽度也可以指图像帧的水平宽度。

正向位移数量可以根据区域宽度和图像宽度自动计算获得，例如可以计算二分之一的图像宽度和区域宽度的商，再将获得的结果取整，即可以获得正向位移数量。但是，在实际应用中，正向位移数量也可以预先设置获得。例如可以由运维人员设置也可以由使用该视频合成方法的前端用户设置获得。在较为常见的场景中可以设置正向位移数量为3。

正向偏移步长可以根据二分之一图像宽度、区域宽度的宽度差值和正向位移数量求商，以位移速度作为约束条件，确定的。通常可以计算宽度差值和正向位移数量的商，再将求商结果取整即可以获得初始的正向偏移步长，若位移速度大于某个阈值，则步长减小，若位移速度小于某个阈值，则步长增加。

本公开实施例中，确定正向位移点时，可以根据区域图像的区域宽度和图像帧的图像宽度准确计算第一扩展方向上的正向位移数量和正向偏移步长，可以通过正向位移数量和正向偏移步长，准确对正向位置点进行定位，获得位置精度更高的正向位移点。

为了获得准确的第二扩展图像，如图6所示，为本公开实施例提供的一种视频合成方法的又一个实施例的流程图，与其它实施例的不同之处在于，其中，在第二扩展方向对镜像图像进行扩展处理，获得至少一个第二扩展图像，包括：

601：确定目标对象在图像帧对应的位移速度。

本实施例中部分步骤与其它实施例中部分步骤相同，在此不再赘述。

602：以区域图像的原始位置点作为基础，基于位移速度和第二扩展方向进行位移处理，获得与原始位置点相对应的至少一个反向位移点。

其中，区域图像的原始位置点可以指目标对象的关键点在图像帧所对应的像素坐标点。关键点可以指能够对区域图像的位置进行确认的像素点，该像素点的坐标是通过整个图像帧的像素坐标系表示的。原始位置点例如可以包括区域图像的中心点在图像帧中的坐标点。例如，目标对象为人体为例，还可以为人体中某个关键位置点，例如眉心点、鼻尖点、中心点等像素点的坐标，关于原始位置点所对应的位置含义并不在此进行限制。同样，反向位移点可以包括原始位置点产生位移之后获得的位于图像帧中的像素坐标点。原始位置点和反向位移点均可以包括位于图像帧的像素坐标系中的坐标点。

可选地，第二扩展方向可以包括反向位移角度。第二扩展方向可以通过目标对象在视频帧中的轨迹确定。例如，同样以由N位置移动到M位置为例，两个位置连线相对于水平线或者垂线可能存在夹角，该夹角即为反向位移角度。反向位移过程与正向位移类似，在此不再赘述。

603：将镜像图像复制到反向位移点，获得镜像图像在至少一个反向位移点分别对应的第二扩展图像。

将区域图像复制到反向位移点，可以包括将区域图像的像素点所对应的像素值，按照反向位移点移动到对应的坐标点，也即，可以根据区域图像在图像帧中的坐标点和反向位移点，确定第二扩展图像在图像帧中的反向坐标点，通过将区域图像中的坐标点处的像素值赋值给对应的反向坐标点，即可以获得反向坐标点所对应的像素值构成的第二扩展图像。当然，在实际应用中，区域图像的像素点可以包括多个，可以根据反向位移点一一将每个像素点进行移动，获得移动后的多个像素点组成的第二扩展图像。第二扩展图像中，除移动后的区域图像的像素点的坐标值为真，其它像素点的坐标被设置为透明属性，显示时均是透明的，不存在颜色的，以不对其它图像，例如背景图像产生显示遮挡。

本公开实施例中，可以通过获取目标对象的位移速度，在目标对象的原始位置点的基础上进行反向位移获得准确的至少一个反向位移点。以利用至少一个反向位移点，将区域图像按照反向位移点进行确认，以获得反向位移点确定对应的第二扩展图像，提高第二扩展图像的定位准确性，获得定位精度更高的至少一个反向位移点分别对应的第二扩展图像。

作为一个实施例，以区域图像的原始位置点作为基础，基于位移速度和第二扩展方向进行位移处理，获得与原始位置点相对应的至少一个反向位移点，包括：

确定区域图像的区域宽度和图像帧的图像宽度；

基于区域宽度和图像宽度，结合位移速度，在第二扩展方向上计算区域图像的反向位移数量以及反向偏移步长；

根据区域图像的原始位置，按照反向偏移步长和反向偏移数量，确定至少一个反向位置点，获得至少一个反向位置点构成的至少一个反向位移点。

反向位移数量可以根据区域宽度和图像宽度自动计算获得，例如可以计算二分之一的图像宽度和区域宽度的商，再将获得的结果取整，即可以获得反向位移数量。但是，在实际应用中，反向位移数量也可以预先设置获得。例如可以由运维人员设置也可以由使用该视频合成方法的前端用户设置获得。在较为常见的场景中可以设置反向位移数量为3。

反向偏移步长可以根据二分之一图像宽度、区域宽度的宽度差值和反向位移数量求商，以位移速度作为约束条件，确定的。通常可以计算宽度差值和反向位移数量的商，再将求商结果取整即可以获得初始的反向偏移步长，若位移速度大于某个阈值，则步长减小，若位移速度小于某个阈值，则步长增加。

本公开实施例中，确定反向位移点时，可以根据区域图像的区域宽度和图像帧的图像宽度准确计算第二扩展方向上的反向位移数量和反向偏移步长，可以通过反向位移数量和反向偏移步长，准确对反向位置点进行定位，获得位置精度更高的反向位移点。

作为一个实施例，确定目标对象在图像帧对应的位移速度，包括：

确定图像帧在待处理视频对应的前一个图像帧。

确定目标对象在前一个图像帧的第一位置和在图像帧的第二位置；

根据第一位置和第二位置，计算目标对象对应的位移量；

利用待处理视频的图像帧显示时间间隔，和位移量，计算获得目标对象在图像帧对应的位移速度。

可选地，根据第一位置和第二位置，计算目标对象对应的位移量可以包括：确定待处理视频的帧率，根据待处理视频的帧率计算两个图像帧之间的时间间隔，根据第一位置和第二位置计算位置差值。该位置差值可以指第一位置和第二位置的绝对差值，具体可以通过两个位置的横向位移差值和纵向位移差值进行三角形计算获得，也即以横向差值和纵向差值分别坐标直角三角形的两个直角边，位移量为该直角三角形的斜边长度。位移量和时间间隔的商即可以为位移速度。

本公开实施例中，可以通过获取前一个图像帧中目标对象所在的第一位置，和当前图像帧的第二位置，通过计算第一位置和第二位置，可以计算目标对象对应的位移量，通过位移量和两个图像帧之间的时间间隔，可以准确计算目标图像的位移速度。通过相邻两个图像帧之间的位移量和时间间隔可以对目标对象的位移速度进行准确计算，获得高精度的位移速度。

为了确保图像显示的准确性，使得用户能够正常观看到目标对象，在一种可能的设计中，对背景图像、至少一个第二扩展图像和至少一个第一扩展图像进行渲染，获得渲染结束时的目标渲染图像，可以包括：

按照背景图像为第一渲染顺序，至少一个第二扩展图像为第二渲染顺序和至少一个第一扩展图像为第三渲染顺序，依次叠加渲染背景图像、至少一个第二扩展图像和至少一个第一扩展图像，获得渲染结束时的目标渲染图像。

可选地，对背景图像、至少一个第二扩展图像和至少一个第一扩展图像进行渲染，获得渲染结束时的目标渲染图像可以包括：对背景图像、至少一个第二扩展图像和至少一个第一扩展图像分别进行渲染，获得渲染结束时的目标渲染图像。目标渲染图像可以由背景图像、至少一个第二扩展图像和至少一个第一扩展图像分别渲染获得。

本公开实施例中，可以分别为背景图像、至少一个第二扩展图像和至少一个第一扩展图像分别设置渲染顺序，以实现目标渲染图像的准确渲染，避免因图像间的随机渲染导致图像显示覆盖问题，确保显示的有效性。

作为一种可能的实现方式，依次叠加渲染背景图像、至少一个第二扩展图像和至少一个第一扩展图像，获得渲染结束时的目标渲染图像，可以包括：

将背景图像在最底层渲染。

确定至少一个第二扩展图像与背景图像的中心点分别对应的反向中心距离；

按照反向中心距离从大到小的顺序，依次渲染至少一个第二扩展图像；

确定至少一个第一扩展图像与背景图像的中心点分别对应的正向中心距离；

按照正向中心距离从大到小的顺序，依次渲染至少一个第一扩展图像，直至最后一个第一扩展图像渲染结束，获得目标渲染图像。

第二扩展图像与背景图像中心点的反向中心距离可以通过第二扩展图像的反向位移点与背景图像的中心点计算获得。同样，第一扩展图像与背景图像的中心点的正向中心距离，可以通过第一扩展图像的正向位移点和背景图像的中心点计算获得。

目标渲染图像可以为背景图像、至少一个第二扩展图像和至少一个第一扩展图像多层渲染获得。具体可以是将背景图像在最底层渲染，将第二扩展图像在背景图像的上层渲染，将第一扩展图像在第二扩展图像的上层渲染。而至少一个第二扩展图像渲染过程中也存在渲染顺序，也即将距离图像中心点距离最大的第二扩展图像先渲染，随着距离的减少，渲染顺序越靠后。至少一个第一扩展图像渲染过程相似，也即将距图像中心点距离最大的第一扩展图像先渲染，随着距离的减少，渲染顺序越靠后。

当然，还可以使用其他的渲染顺序。例如至少一个第二扩展图像和至少一个第一扩展图像同批次渲染，直接按照距离中心点的距离的大小，从最大的距离对应的图像开始渲染，直至最后一个第一扩展图像渲染结束。第一扩展图像包括区域图像，区域图像距离中心点的位置最小。为了便于理解，如图7所示，假设区域图像为701所示，则对区域图像进行第一扩展方向的扩展处理和第二扩展方向的扩展处理后，在显示屏幕700中显示的至少一个第一扩展图像分别为701-703，至少一个第二扩展图像分别为704-705。

本公开实施例中，将背景图像在最底层渲染，确保背景图像正常显示。第一扩展图像和第二扩展图像可以位于背景图像的上层渲染，在渲染正第二扩展图像时，可以按照反向中心距离和正向中心距离的从大到小的顺序，依次将第二扩展图像和第一扩展图像向上层渲染，使得图像的渲染层次与距离相关，实现图像的准确渲染，确保区域图像能够在最上层渲染，获得精准渲染的目标渲染图像。

如图8所示，为本公开实施例提供的一种视频合成方法的又一个实施例的流程图，该视频合成方法中可以为区域图像设置贴图图像，参考图8，对背景图像、至少一个第二扩展图像和至少一个第一扩展图像进行渲染，获得渲染结束时的目标渲染图像之后，本公开中的视频合成方法还可以包括：

801：获取用户为目标对象选择的贴图图像。

802：基于区域图像在图像帧的原始位置点，确定贴图图像在图像帧中的贴图位置。

803：将贴图图像按照贴图位置渲染至目标渲染图像中，获得目标贴图图像。

804：将图像帧对应的目标贴图图像进行视频合成，获得待处理视频对应的贴图目标视频。

贴图图像可以为提供待处理视频的用户指定，可以指各种卡通形象、风景图像、大头贴等诸多类型的贴图。当然，贴图位置也可以由该用户指定。根据原始位置点可以对贴图位置点进行定位。

可以基于区域图像在图像帧的原始位置点，确定区域图像中头部顶点所在的位置点，将该头部顶点所在的位置点作为贴图位置。

本公开实施例中，在获得用户为目标对象选择的贴图图像之后，可以基于区域图像在图像帧的原始位置点，确定贴图图像在图像帧中的贴图位置。通过贴图位置的确定，可以将贴图图像按照贴图位置渲染至目标渲染图像中，获得目标贴图图像，将图像帧对应的目标贴图图像进行视频合成，即可以获得待处理视频对应的贴图目标视频。通过贴图可以使得目标视频的内容更全面化，提高视频显示效率。

作为一个实施例，对待处理视频中的图像帧进行图像分割，获得目标对象对应的区域图像和除区域图像之外的背景图像，包括：

从待处理视频中提取图像帧；

识别图像帧中目标对象的对象轮廓区域；

利用对象轮廓区域分割图像帧，获得对象轮廓区域对应的区域图像和除区域图像之外的背景图像。

可选地，可以采用轮廓提取算法识别图像帧中目标对象的对象轮廓区域。轮廓提取算法可以为常见的轮廓提取算法，本公开中对轮廓提取算法的具体类型并不作出过多限定。图像分割具体可以指将对象轮廓区域所包围的像素点设置为对象标识，将位于对象轮廓区域之外的其它像素点设置为背景标识。可以通过像素点的标识，区分区域图像和背景图像的像素点。

本公开实施例中，可以从待处理视频中提取图像帧，并识别图像帧中目标对象的对象轮廓区域，对象轮廓区域可以用于对图像帧进行分割，以获得准确的对象轮廓区域的区域图像和背景图像。通过图像分割可以实现图像的准确分割，实现区域图像和背景图像的准确获取。

在一种可能的设计中，该方法还可以包括：

基于第一用户触发的目标视频采集请求，获取待处理视频。

将图像帧对应的目标渲染图像进行视频合成，获得待处理视频对应的目标视频，之后，还包括：

为第一用户输出目标视频。

待处理视频可以实时采集，也可以从已存储的视频中读取获得。

其中，为第一用户输出目标视频可以包括利用输出装置为第一用户输出目标视频或者将目标视频发送至第一用户对应的用户设备，由用户设备中的输出装置输出目标视频。

本公开实施例中，可以获取第一用户提供的待处理视频，在获得目标视频之后，还可以为第一用户输出目标视频。通过与第一用户交互处理可以实现待处理视频的获取和目标视频的输出，以便于为第一用户以更高效率、更自动化模式提供目标视频。

作为一个实施例，为第一用户输出目标视频之后，还包括：

检测第一用户针对目标视频触发的发布请求；

响应于发布请求，将目标视频发布至第一用户的用户视频账户，目标视频供第二用户的第二用户设备读取并播放。

可选地，电子设备可以为第一用户提供目标视频的发布控件。第一用户的用户设备检测到第一用户触发发布控件时，用户设备即可以发送发布请求至电子设备。电子设备可以响应于该发布请求以将目标视频存储至第一用户的用户视频账户中，具体可以是将目标视频存储，并建立该目标视频的视频名称或者视频标识与第一用户的账户名称之间建立存储关联。用户视频账户可以对应多个视频，其中可以包括目标视频。第二用户设备需要播放目标视频时，从第一用户的用户视频账户中确定身份视频，将目标视频发送至第二用户设备。其中，目标视频被播放一次，该目标视频的播放次数随之增加。

本公开实施例中，可以检测第一用户针对目标视频触发的发布请求，将目标视频发布至第一用户的用户视频账户，目标视频可以供第二用户的第二用户设备读取并播放。通过第一用户对目标视频的发布控制，可以实现目标视频的有效发布。

在某些实施例中，检测第一用户触发的目标视频采集请求，获取待处理视频包括：

接收第一用户设备发送的待处理视频；待处理视频是第一用户的用户设备在用户触发目标视频采集请求时采集获得的；

为第一用户输出目标视频，包括：

发送目标视频至第一用户设备，并控制第一用户设备播放目标视频。

当然，在某些实施例中，电子设备可以直接与第一用户进行交互，采集待处理视频，并基于本公开的视频合成方法合成待处理视频对应的目标视频，实现在单个电子设备中完成视频的采集和处理，提高电子设备的利用率。

本公开实施例中，可以接收第一用户设备发送的待处理视频，待处理视频可以为第一用户的用户设备采集。通过为待处理视频的视频帧进行目标视频的自动生成，可以将生成的目标视频发送至第一用户设备，实现向第一用户设备反馈目标视频。实现目标视频的生成和输出的分离，降低第一用户设备的处理压力，对第一用户设备的正常运行起到保障作用。同时，利用运算能力更强的电子设备完成目标视频的生成，可以使得目标视频的生成效率和稳定性更高，确保目标视频的生成效率和成功率。

如图9所示，为本公开实施例提供的一种视频合成装置的一个实施例的结构示意图，该视频合成装置900可以包括：

图像分割单元901：用于对待处理视频中的图像帧进行图像分割，获得目标对象对应的区域图像和除区域图像之外的背景图像；

镜像处理单元902：用于确定区域图像对应的镜像图像；

第一扩展单元903：用于在第一扩展方向对区域图像进行扩展处理，获得至少一个第一扩展图像；至少一个第一扩展图像包括区域图像；

第二扩展单元904：用于在第二扩展方向对镜像图像进行扩展处理，获得至少一个第二扩展图像；第一扩展方向和第二扩展方向不同；

图像渲染单元905：用于对背景图像、至少一个第二扩展图像和至少一个第一扩展图像进行渲染，获得渲染结束时的目标渲染图像；

视频合成单元906：用于将图像帧对应的目标渲染图像进行视频合成，获得待处理视频对应的目标视频。

作为一个实施例，第一扩展单元，可以包括：

速度确定模块，用于确定目标对象在图像帧对应的位移速度；

第一扩展模块，用于以区域图像的原始位置点作为基础，按照位移速度和第一扩展方向进行位移处理，获得包含原始位置点的至少一个正向位移点；

第一确定模块，用于将区域图像复制到正向位移点，获得区域图像在至少一个正向位移点分别对应的第一扩展图像。

在某些实施例中，第一扩展模块，可以包括：

第一确定子模块，用于确定区域图像的区域宽度和图像帧的图像宽度；

第一计算子模块，用于基于区域宽度和图像宽度，结合位移速度，在第一扩展方向上计算区域图像的正向位移数量以及正向偏移步长；

正向位移子模块，用于根据区域图像的原始位置，按照正向偏移步长和正向位移数量，确定至少一个正向位置点，获得原始位置点和至少一个正向位置点构成的至少一个正向位移点。

作为一个实施例，第二扩展单元，可以包括：

第二扩展模块，用于以区域图像的原始位置点作为基础，基于位移速度和第二扩展方向进行位移处理，获得与原始位置点相对应的至少一个反向位移点；

第二确定模块，用于将镜像图像复制到反向位移点，获得镜像图像在至少一个反向位移点分别对应的第二扩展图像。

在某些实施例中，第二扩展模块，包括：

第二确定子模块，用于确定区域图像的区域宽度和图像帧的图像宽度；

第二计算子模块，用于基于区域宽度和图像宽度，结合位移速度，在第二扩展方向上计算区域图像的反向位移数量以及反向偏移步长；

反向位移子模块，用于根据区域图像的原始位置，按照反向偏移步长和反向偏移数量，确定至少一个反向位置点，获得至少一个反向位置点构成的至少一反向位移点。

在某些实施例中，速度确定模块，包括：

第三确定模块，用于确定图像帧在待处理视频对应的前一个图像帧；

第四确定模块，用于确定目标对象在前一个图像帧的第一位置和在图像帧的第二位置；

位移计算模块，用于根据第一位置和第二位置，计算目标对象对应的位移量；

速度计算模块，用于利用待处理视频的图像帧显示时间间隔，和位移量，计算获得目标对象在图像帧对应的位移速度。

在某些实施例中，图像渲染单元，可以包括：

顺序渲染模块，用于按照背景图像为第一渲染顺序，至少一个第二扩展图像为第二渲染顺序和至少一个第一扩展图像为第三渲染顺序，依次叠加渲染背景图像、至少一个第二扩展图像和至少一个第一扩展图像，获得渲染结束时的目标渲染图像。

在某些实施例中，顺序渲染模块，包括：

第一渲染模块，用于将背景图像在最底层渲染；

第一距离模块，用于确定至少一个第二扩展图像与背景图像的中心点分别对应的反向中心距离；

第二渲染模块，用于按照反向中心距离从大到小的顺序，依次渲染至少一个第二扩展图像；

第二距离模块，用于确定至少一个第一扩展图像与背景图像的中心点分别对应的正向中心距离；

第二渲染模块，用于按照正向中心距离从大到小的顺序，依次渲染至少一个第一扩展图像，直至最后一个第一扩展图像渲染结束，获得目标渲染图像。

作为又一个实施例，该装置还包括：

贴图获取单元，用于获取用户为目标对象选择的贴图图像；

位置确定单元，用于基于区域图像在图像帧的原始位置点，确定贴图图像在图像帧中的贴图位置；

图像贴图单元，用于将贴图图像按照贴图位置渲染至目标渲染图像中，获得目标贴图图像；

贴图视频单元，用于将图像帧对应的目标贴图图像进行视频合成，获得待处理视频对应的贴图目标视频。

在某些实施例中，图像分割单元，包括：

图像提取模块，用于从待处理视频中提取图像帧；

区域识别模块，用于识别图像帧中目标对象的对象轮廓区域；

图像分割模块，用于利用对象轮廓区域分割图像帧，获得对象轮廓区域对应的区域图像和除区域图像之外的背景图像。

在某些实施例中，该装置还包括：

视频获取单元，用于基于第一用户触发的目标视频采集请求，获取待处理视频；

视频输出单元，用于为第一用户输出目标视频。

作为又一个实施例，该装置还可以包括：

发布检测单元，用于检测第一用户针对目标视频触发的发布请求；

请求响应单元，用于响应于发布请求，将目标视频发布至第一用户的用户视频账户，目标视频供第二用户的第二用户设备读取并播放。

在某些实施例中，视频获取单元，包括：

视频接收模块，用于接收第一用户设备发送的待处理视频；待处理视频是第一用户的用户设备在用户触发目标视频采集请求时采集获得的；

视频输出单元，包括：

视频发送模块，用于发送目标视频至第一用户设备，并控制第一用户设备播放目标视频。

本实施例提供的装置，可用于执行上述方法实施例的技术方案，其实现原理和技术效果类似，本实施例此处不再赘述。

为了实现上述实施例，本公开实施例还提供了一种电子设备。

参考10，其示出了适于用来实现本公开实施例的电子设备1000的结构示意图，该电子设备1000可以为终端设备或服务器。其中，终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、个人数字助理(Personal Digital Assistant，简称PDA)、平板电脑(Portable Android Device，简称PAD)、便携式多媒体播放器(Portable Media Player，简称PMP)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图10示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图10所示，电子设备1000可以包括处理装置(例如中央处理器、图形处理器等)1001，其可以根据存储在只读存储器(Read Only Memory，简称ROM)1002中的程序或者从存储装置1008加载到随机访问存储器(Random Access Memory，简称RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中，还存储有电子设备1000操作所需的各种程序和数据。处理装置1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。

通常，以下装置可以连接至I/O接口1005：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置1006；包括例如液晶显示器(Liquid Crystal Display，简称LCD)、扬声器、振动器等的输出装置1007；包括例如磁带、硬盘等的存储装置1008；以及通信装置1009。通信装置1009可以允许电子设备1000与其他设备进行无线或有线通信以交换数据。虽然图10示出了具有各种装置的电子设备1000，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置1009从网络上被下载和安装，或者从存储装置1008被安装，或者从ROM 1002被安装。在该计算机程序被处理装置1001执行时，执行本公开实施例的方法中限定的上述功能。

本公开的实施例还包括一种计算机程序，该计算机程序被处理器运行时执行本公开实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备执行上述实施例所示的方法。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(Local Area Network，简称LAN)或广域网(Wide Area Network，简称WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，单元的名称在某种情况下并不构成对该单元本身的限定，例如，第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

第一方面，根据本公开的一个或多个实施例，提供了一种目标视频的合成方法，包括：

对待处理视频中的图像帧进行图像分割，获得目标对象对应的区域图像和除区域图像之外的背景图像；

确定区域图像对应的镜像图像；

在第一扩展方向对区域图像进行扩展处理，获得至少一个第一扩展图像；至少一个第一扩展图像包括区域图像；

在第二扩展方向对镜像图像进行扩展处理，获得至少一个第二扩展图像；第一扩展方向和第二扩展方向不同。

对背景图像、至少一个第二扩展图像和至少一个第一扩展图像进行渲染，获得渲染结束时的目标渲染图像；

将图像帧对应的目标渲染图像进行视频合成，获得待处理视频对应的目标视频。

根据本公开的一个或多个实施例，在第一扩展方向对区域图像进行扩展处理，获得至少一个第一扩展图像，包括：

确定目标对象在图像帧对应的位移速度；

以区域图像的原始位置点作为基础，按照位移速度和第一扩展方向进行位移处理，获得包含原始位置点的至少一个正向位移点；

将区域图像复制到正向位移点，获得区域图像在至少一个正向位移点分别对应的第一扩展图像。

根据本公开的一个或多个实施例，以区域图像的原始位置点作为基础，按照位移速度和第一扩展方向进行位移处理，获得包含原始位置点的至少一个正向位移点包括：

确定区域图像的区域宽度和图像帧的图像宽度；

基于区域宽度和图像宽度，结合位移速度，在第一扩展方向上计算区域图像的正向位移数量以及正向偏移步长；

根据区域图像的原始位置，按照正向偏移步长和正向位移数量，确定至少一个正向位置点，获得原始位置点和至少一个正向位置点构成的至少一个正向位移点。

根据本公开的一个或多个实施例，在第二扩展方向对镜像图像进行扩展处理，获得至少一个第二扩展图像，包括：

确定目标对象在图像帧对应的位移速度；

以区域图像的原始位置点作为基础，基于位移速度和第二扩展方向进行位移处理，获得与原始位置点相对应的至少一个反向位移点；

将镜像图像复制到反向位移点，获得镜像图像在至少一个反向位移点分别对应的第二扩展图像。

根据本公开的一个或多个实施例，以区域图像的原始位置点作为基础，基于位移速度和第二扩展方向进行位移处理，获得与原始位置点相对应的至少一个反向位移点，包括：

确定区域图像的区域宽度和图像帧的图像宽度；

根据区域图像的原始位置，按照反向偏移步长和反向偏移数量，确定至少一个反向位置点，获得至少一个反向位置点构成的至少一反向位移点。

根据本公开的一个或多个实施例，确定目标对象在图像帧对应的位移速度，包括：

确定图像帧在待处理视频对应的前一个图像帧；

根据第一位置和第二位置，计算目标对象对应的位移量；

根据本公开的一个或多个实施例，对背景图像、至少一个第二扩展图像和至少一个第一扩展图像进行渲染，获得渲染结束时的目标渲染图像，包括：

根据本公开的一个或多个实施例，依次叠加渲染背景图像、至少一个第二扩展图像和至少一个第一扩展图像，获得渲染结束时的目标渲染图像，包括：

将背景图像在最底层渲染；

根据本公开的一个或多个实施例，对背景图像、至少一个第二扩展图像和至少一个第一扩展图像进行渲染，获得渲染结束时的目标渲染图像之后，方法还包括：

获取用户为目标对象选择的贴图图像；

基于区域图像在图像帧的原始位置点，确定贴图图像在图像帧中的贴图位置；

将贴图图像按照贴图位置渲染至目标渲染图像中，获得目标贴图图像；

将图像帧对应的目标贴图图像进行视频合成，获得待处理视频对应的贴图目标视频。

根据本公开的一个或多个实施例，对待处理视频中的图像帧进行图像分割，获得目标对象对应的区域图像和除区域图像之外的背景图像，包括：

从待处理视频中提取图像帧；

识别图像帧中目标对象的对象轮廓区域；

根据本公开的一个或多个实施例，还包括：

基于第一用户触发的目标视频采集请求，获取待处理视频；

为第一用户输出目标视频。

根据本公开的一个或多个实施例，为第一用户输出目标视频之后，还包括：

检测第一用户针对目标视频触发的发布请求；

根据本公开的一个或多个实施例，基于第一用户触发的目标视频采集请求，获取待处理视频包括：

为第一用户输出目标视频，包括：

第二方面，根据本公开的一个或多个实施例，提供了一种用于视频合成装置，包括：

图像分割单元，用于对待处理视频中的图像帧进行图像分割，获得目标对象对应的区域图像和除区域图像之外的背景图像；

镜像处理单元，用于确定区域图像对应的镜像图像；

第一扩展单元，用于在第一扩展方向对区域图像进行扩展处理，获得至少一个第一扩展图像；至少一个第一扩展图像包括区域图像；

第二扩展单元，用于在第二扩展方向对镜像图像进行扩展处理，获得至少一个第二扩展图像；第一扩展方向和第二扩展方向不同。

图像渲染单元，用于对背景图像、至少一个第二扩展图像和至少一个第一扩展图像进行渲染，获得渲染结束时的目标渲染图像；

视频合成单元，用于将图像帧对应的目标渲染图像进行视频合成，获得待处理视频对应的目标视频。

第三方面，根据本公开的一个或多个实施例，提供了一种电子设备，包括：至少一个处理器和存储器；

存储器存储计算机执行指令；

至少一个处理器执行存储器存储的计算机执行指令，使得至少一个处理器执行如上第一方面以及第一方面各种可能的设计的视频合成方法。

第四方面，根据本公开的一个或多个实施例，提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机执行指令，当处理器执行计算机执行指令时，实现如上第一方面以及第一方面各种可能的设计的视频合成方法。

第五方面，根据本公开的一个或多个实施例，提供了一种计算机程序产品，包括计算机程序，计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能的设计的视频合成方法。

第六方面，本公开实施例还提供一种计算机程序，计算机程序被处理器运行时实现如上第一方面以及第一方面各种可能的设计的视频合成方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims

一种视频合成方法，包括：

对待处理视频中的图像帧进行图像分割，获得目标对象对应的区域图像和除所述区域图像之外的背景图像；

确定所述区域图像对应的镜像图像；

在第一扩展方向对所述区域图像进行扩展处理，获得至少一个第一扩展图像；至少一个所述第一扩展图像包括所述区域图像；

在第二扩展方向对所述镜像图像进行扩展处理，获得至少一个第二扩展图像；所述第一扩展方向和所述第二扩展方向不同；

对所述背景图像、至少一个所述第二扩展图像和至少一个所述第一扩展图像进行渲染，获得渲染结束时的目标渲染图像；

将所述图像帧对应的目标渲染图像进行视频合成，获得所述待处理视频对应的目标视频。
根据权利要求1所述的方法，其中，所述在第一扩展方向对所述区域图像进行扩展处理，获得至少一个第一扩展图像，包括：

确定所述目标对象在所述图像帧对应的位移速度；

以所述区域图像的原始位置点作为基础，按照所述位移速度和第一扩展方向进行位移处理，获得包含所述原始位置点的至少一个正向位移点；

将所述区域图像复制到所述正向位移点，获得所述区域图像在至少一个所述正向位移点分别对应的第一扩展图像。
根据权利要求2所述的方法，其中，所述以所述区域图像的原始位置点作为基础，按照所述位移速度和第一扩展方向进行位移处理，获得包含所述原始位置点的至少一个正向位移点，包括：

确定所述区域图像的区域宽度和所述图像帧的图像宽度；

基于所述区域宽度和所述图像宽度，结合所述位移速度，在所述第一扩展方向上计算所述区域图像的正向位移数量以及正向偏移步长；

根据所述区域图像的原始位置，按照正向偏移步长和所述正向位移数量，确定至少一个正向位置点，获得所述原始位置点和至少一个所述正向位置点构成的所述至少一个正向位移点。
根据权利要求1所述的方法，其中，所述在第二扩展方向对所述镜像图像进行扩展处理，获得至少一个第二扩展图像，包括：

确定所述目标对象在所述图像帧对应的位移速度；

以所述区域图像的原始位置点作为基础，基于所述位移速度和第二扩展方向进行位移处理，获得与所述原始位置点相对应的至少一个反向位移点；

将所述镜像图像复制到所述反向位移点，获得所述镜像图像在至少一个所述反向位移点分别对应的第二扩展图像。
根据权利要求4所述的方法，其中，所述以所述区域图像的原始位置点作为基础，基于所述位移速度和第二扩展方向进行位移处理，获得与所述原始位置点相对应的至少一个反向位移点，包括：

确定所述区域图像的区域宽度和所述图像帧的图像宽度；

基于所述区域宽度和所述图像宽度，结合所述位移速度，在所述第二扩展方向上计算所述区域图像的反向位移数量以及反向偏移步长；

根据所述区域图像的原始位置，按照反向偏移步长和所述反向偏移数量，确定至少一个反向位置点，获得至少一个所述反向位置点构成的至少一所述反向位移点。
根据权利要求2或3所述的方法，其中，所述确定所述目标对象在所述图像帧对应的位移速度，包括：

确定所述图像帧在所述待处理视频对应的前一个图像帧；

确定所述目标对象在所述前一个图像帧的第一位置和在所述图像帧的第二位置；

根据所述第一位置和所述第二位置，计算所述目标对象对应的位移量；

利用所述待处理视频的图像帧显示时间间隔，和所述位移量，计算获得所述目标对象在所述图像帧对应的位移速度。
根据权利要求1-6任一项所述的方法，其中，所述对所述背景图像、至少一个所述第二扩展图像和至少一个所述第一扩展图像进行渲染，获得渲染结束时的目标渲染图像，包括：

按照所述背景图像为第一渲染顺序，至少一个所述第二扩展图像为第二渲染顺序和至少一个所述第一扩展图像为第三渲染顺序，依次叠加渲染所述背景图像、至少一个所述第二扩展图像和至少一个所述第一扩展图像，获得渲染结束时的所述目标渲染图像。
根据权利要求7所述的方法，其中，所述依次叠加渲染所述背景图像、至少一个所述第二扩展图像和至少一个所述第一扩展图像，获得渲染结束时的所述目标渲染图像，包括：

将所述背景图像在最底层渲染；

确定至少一个所述第二扩展图像与所述背景图像的中心点分别对应的反向中心距离；

按照反向中心距离从大到小的顺序，依次渲染至少一个所述第二扩展图像；

确定至少一个所述第一扩展图像与所述背景图像的中心点分别对应的正向中心距离；

按照正向中心距离从大到小的顺序，依次渲染至少一个所述第一扩展图像，直至最后一个第一扩展图像渲染结束，获得所述目标渲染图像。
根据权利要求1至6任一项所述的方法，其中，所述对所述背景图像、至少一个所述第二扩展图像和至少一个所述第一扩展图像进行渲染，获得渲染结束时的目标渲染图像之后，方法还包括：

获取用户为所述目标对象选择的贴图图像；

基于所述区域图像在所述图像帧的原始位置点，确定所述贴图图像在所述图像帧中的贴图位置；

将所述贴图图像按照所述贴图位置渲染至所述目标渲染图像中，获得目标贴图图像；

将所述图像帧对应的目标贴图图像进行视频合成，获得所述待处理视频对应的贴图目标视频。
根据权利要求1至9任一项所述的方法，其中，所述对待处理视频中的图像帧进行图像分割，获得目标对象对应的区域图像和除所述区域图像之外的背景图像，包括：

从所述待处理视频中提取图像帧；

识别所述图像帧中目标对象的对象轮廓区域；

利用所述对象轮廓区域分割所述图像帧，获得所述对象轮廓区域对应的区域图像和除所述区域图像之外的背景图像。
根据权利要求1至10任一项所述的方法，其中，所述方法还包括：

基于第一用户触发的目标视频采集请求，获取所述待处理视频；

所述将所述图像帧对应的目标渲染图像进行视频合成，获得所述待处理视频对应的目标视频，之后，还包括：

为所述第一用户输出所述目标视频。
根据权利要求11所述的方法，其中，所述为所述第一用户输出所述目标视频之后，还包括：

检测所述第一用户针对所述目标视频触发的发布请求；

响应于所述发布请求，将所述目标视频发布至所述第一用户的用户视频账户，所述目标视频供第二用户的第二用户设备读取并播放。
根据权利要求11所述的方法，其中，所述基于第一用户触发的目标视频采集请求，获取所述待处理视频包括：

接收所述第一用户设备发送的所述待处理视频；所述待处理视频是所述第一用户的用户设备在所述用户触发目标视频采集请求时采集获得的；

所述为所述第一用户输出所述目标视频，包括：

发送所述目标视频至第一用户设备，并控制所述第一用户设备播放所述目标视频。
一种用于视频合成装置，其特征在于，包括：

图像分割单元，用于对待处理视频中的图像帧进行图像分割，获得目标对象对应的区域图像和除所述区域图像之外的背景图像；

镜像处理单元，用于确定所述区域图像对应的镜像图像；

第一扩展单元，用于在第一扩展方向对所述区域图像进行扩展处理，获得至少一个第一扩展图像；至少一个所述第一扩展图像包括所述区域图像；

第二扩展单元，用于在第二扩展方向对所述镜像图像进行扩展处理，获得至少一个第二扩展图像；所述第一扩展图像和所述第二扩展图像不同；

图像渲染单元，用于对所述背景图像、至少一个所述第二扩展图像和至少一个所述第一扩展图像进行渲染，获得渲染结束时的目标渲染图像；

视频合成单元，用于将所述图像帧对应的目标渲染图像进行视频合成，获得所述待处理视频对应的目标视频。
一种电子设备，其特征在于，包括：处理器、存储器；

所述存储器存储计算机执行指令；

所述处理器执行所述存储器存储的计算机执行指令，使得所述处理器配置有如权利要求1至13任一项所述的视频合成方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如权利要求1至13任一项所述的视频合成方法。
一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如权利要求1至13任一项所述的视频合成方法。
一种计算机程序，所述计算机程序被处理器执行时实现如权利要求1至13任一项所述的视频合成方法。