WO2020114251A1

WO2020114251A1 - 视频拼接方法、装置、电子设备及计算机存储介质

Info

Publication number: WO2020114251A1
Application number: PCT/CN2019/119616
Authority: WO
Inventors: 邓朔
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2018-12-07
Filing date: 2019-11-20
Publication date: 2020-06-11
Also published as: EP3893513A1; US11972580B2; EP3893513A4; CN111294644B; CN111294644A; US20210183013A1

Abstract

本申请涉及视频处理领域，公开了一种视频拼接方法、装置、电子设备及计算机可读存储介质，其中，视频拼接方法包括：检测第一图像与第二图像之间的相似度，第一图像为第一待拼接视频的最后一帧图像，第二图像为第二待拼接视频的首帧图像；接着，如果相似度满足预设条件，则确定第一图像相对于所述第二图像的运动向量；接着，根据运动向量，确定第一图像与第二图像之间的至少一个补偿帧，并基于至少一个补偿帧拼接第一图像与所述第二图像，以拼接第一待拼接视频与第二待拼接视频。

Description

视频拼接方法、装置、电子设备及计算机存储介质

本申请要求于2018年12月7日提交中国专利局、申请号为201811496469.3、申请名称为“视频拼接方法、装置、电子设备及计算机存储介质”的中国专利申请的优先权。

技术领域

本申请涉及视频处理技术领域，具体而言，本申请涉及一种视频拼接方法、装置、电子设备及计算机存储介质。

背景技术

随着流量费用的降低，用户发表拍摄的视频的成本也随之降低，于是有很多用户将拍摄的视频上传到相应的视频平台。若用户进行的是非线性的视频拍摄，即在同一地点拍摄了多个前后取景相似的视频片段，且只是拍摄时间不同，则在完成拍摄以后，将该多个前后取景相似的视频片段上传到相应的视频平台前，往往会对该多个视片段进行拼接，随后将拼接后的视频上传到相应的视频平台。

然而，在拼接两段取景相似的视频片段时，由于拍摄者的智能终端位置可能发生轻微改变，导致两段视频衔接处发生抖动，极大降低用户观看体验。

发明内容

本申请提供一种视频拼接方法、装置、电子设备及计算机存储介质。

一方面，提供了一种视频拼接方法，包括：

检测第一图像与第二图像之间的相似度，第一图像为第一待拼接视频的最后一帧图像，第二图像为第二待拼接视频的首帧图像；

如果所述相似度满足预设条件，则确定第一图像相对于第二图像的运动向量；

根据运动向量，确定第一图像与第二图像之间的至少一个补偿帧，并基于至少一个补偿帧拼接第一图像与第二图像，以拼接第一待拼接视频与第二待拼接视频。

另一方面，提供了一种视频拼接装置，包括：

检测模块，用于检测第一图像与第二图像之间的相似度，第一图像为第一待拼接视频的最后一帧图像，第二图像为第二待拼接视频的首帧图像；

确定模块，用于当相似度满足预设条件时，确定第一图像相对于第二图像的运动向量；

拼接模块，用于根据运动向量，确定第一图像与第二图像之间的至少一个补偿帧，并基于至少一个补偿帧拼接第一图像与第二图像，以拼接第一待拼接视频与第二待拼接视频。

另一方面，提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行所述程序时实现上述的视频拼接方法。

另一方面，提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该程序被处理器执行时实现上述的视频拼接方法。

本申请附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1a为本申请一个实施例的视频拼接系统的应用场景图；

图1b为本申请一个实施例的视频拼接方法的流程示意图；

图2为本申请一个实施例的对视频进行拼接的示意图；

图3a为本申请一个实施例的图像形变及运动过程的示意图；

图3b为本申请一个实施例的计算第一差异值的示意图；

图3c为本申请一个实施例的计算第二差异值的示意图；

图4为本申请一个实施例的差异值曲线示意图；

图5为本申请一个实施例的运动向量的示意图；

图6为本申请一个实施例的第一图像过渡为第二图像的示意图；

图7为本申请又一实施例的视频拼接装置的基本结构示意图；

图8为本申请又一实施例的视频拼接装置的详细结构示意图；

图9为本申请另一实施例的电子设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本申请，而不能解释为对本申请的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本申请的实施例进行描述。

传统的视频拼接往往是基于视频插帧的方法，例如将30FPS(Frames Per Second，每秒传输帧数)的视频通过插帧补偿生成60FPS的视频，且主要用于单个视频内容内的插帧，但是对于非线性的视频拍摄，在对两段视频进行拼接时，由于其前后帧的关系存在不确定性，因而不能完全满足插帧的条件。

此外，传统的视频插帧方法，通常运算量比较大、运行时间比较长，其使用场景偏向于传统的视频后处理；如果将其应用于移动设备端，则需要移动设备中的硬件能够支持该功能，但是目前只有极少数的硬件厂商支持了此类功能，而且算法较为固定，导致对移动设备及使用场景有较多的限制。另外，即使将传统的视频插帧方法应用于移动设备端，也会因为移动设备的计算能力有限，导致很难做到实时处理，造成实时性较差、需要用户等待等情况的发生。因此，亟需一种在移动设备端对非线性的视频拍摄进行拼接的方法。

图1a为本申请一个实施例的视频拼接系统的应用场景图。如图1a所示，视频拼接系统100包括：目标物体101、电子设备102和用户103。用户103在某个地点，使用电子设备102上安置的摄像装置1021，对目标物体101进行拍摄，得到多个视频片段。然后，启动电子设备102上的视频拼接装置1022对多个视频片段进行拼接。例如，对每相邻的两个待拼接视频“视频1”和“视频2”，使用本申请实施例所述的方法进行拼接，从而基于拍摄的多个视频片段得到一个连续的视频文件。之后，用户可以启动电子设备102上的视频应用程序1023，将拼接后的视频文件上传至视频平台进行分享。

本申请一个实施例提供了一种视频拼接方法，如图1b所示，可以由电子设备执行，该电子设备可以是图1a所示的电子设备102，该方法包括：

步骤S110，检测第一图像与第二图像之间的相似度，第一图像为第一待拼接视频的最后一帧图像，第二图像为第二待拼接视频的首帧图像。

具体地，本申请实施例的视频拼接方法，主要适应于待拼接视频片段的前后帧相似(例如满足预设相似度条件)的情况，其中，图2为本申请实施例的对视频进行拼接的示意图。若前后帧的差异过大，则无法进行后续的运动向量估计与插帧补偿，因此，在预处理阶段，需要对前后帧进行相似性评价，保证拼接算法的运行意义。

进一步地，在具体应用中，可以使用相似性估计方法，对前后帧进行相似性评价，例如检测第一待拼接视频的最后一帧图像与第二待拼接视频的首帧图像之间的相似度是否满足预设条件，如果满足预设条件，则可以继续进行本申请实施的视频拼接方法中的后续步骤(即步骤S120与步骤S130)，进行多个视频的平滑拼接。换言之，当用户需要拼接A段视频与B段视频时，若A段视频的尾帧与B段视频的首帧是强关联的，则可使用本申请实施的方法，进行防抖动插帧补偿，使得A段视频与B段视频之间可以平滑过渡，从而有效过滤不符合拼接条件的使用场景。

步骤S120，如果相似度满足预设条件，则确定第一图像相对于第二图像的运动向量。

具体地，当第一图像与第二图像之间满足预设相似度条件时，确定第一图像相对于第二图像的运动向量，即估计第一图像与第二图像之间的运动轨迹，例如运动距离与运动方向等，从而奠定后续对第一待拼接视频与第二待拼接视频进行平滑拼接的必要基础。

步骤S130，根据运动向量，确定第一图像与第二图像之间的至少一个补偿帧，并基于至少一个补偿帧拼接第一图像与第二图像，以拼接第一待拼接视频与第二待拼接视频。

具体地，在确定出第一图像相对于第二图像的运动向量之后，可以根据该确定出的运动向量，确定第一图像与第二图像之间的至少一个补偿帧，并根据该至少一个补偿帧对第一图像进行演化补偿，使得可以由第一图像慢慢地平滑过渡为第二图像，实现第一图像与第二图像的拼接，从而拼接第一待拼接视频与第二待拼接视频。

本申请实施例提供的视频拼接方法，与传统技术相比，通过确定满足预设条件的第一图像相对于第二图像的运动向量，以及根据运动向量，确定第一图像与第二图像之间的至少一个补偿帧，并基于至少一个补偿帧拼接第一图像与第二图像，提供了一种能够在移动设备端对非线性的视频拍摄片段进行拼接的方法，不仅可以在移动设备端实时、高效地对多段视频进行拼接，高质地对衔接处发生的抖动进行平滑补偿，使得多段视频之间可以平滑过渡，有效减少多段视频拼接后的图像抖动或图像跳变等情况的发生，极大提升用户的视频拼接、发布及观看体验；而且能够覆盖安卓、苹果等操作系统的终端设备，无需终端设备中特定硬件的支撑，避免了对硬件厂商的依赖，解决了传统视频插帧方法对移动设备及使用场景的限制。

本申请实施例提供了另一种可能的实现方式，其中，相似度满足预设条件，包括：相似度不小于预设相似度阈值。

检测第一图像与第二图像之间的相似度，包括：

确定第一图像的第一灰度直方图与第二图像的第二灰度直方图；

确定所述第一灰度直方图各个灰度的权重；

根据所确定的权重、第一灰度直方图中各个灰度对应的像素个数及第二灰度直方图中各个灰度对应的像素个数，确定第一图像与第二图像之间的相似度。

具体地，假如第一待拼接视频为A视频，且第一待拼接视频的尾帧图像为I _a，第二待拼接视频为B视频，且第二待拼接视频的首帧图像为I _b，则在检测第一图像与第二图像之间的相似度是否满足预设条件时，可以通过确定I _a与I _b之间的相似度，并检测该相似度是否不小于(即大于或等于)预设相似度阈值，来确定I _a与I _b之间的相似度是否满足预设条件。其中，如果I _a与I _b之间的相似度不小于预设相似度阈值，则确定I _a与I _b之间的相似度满足预设条件，可以继续进行后续的其它操作步骤，否则不满足预设条件，不能进行后续的其它操作步骤。

进一步地，可以根据I _a与I _b分别对应的灰度直方图H _a(即上述的第一灰度直方图)与H _b(即上述的第二灰度直方图)，来确定I _a与I _b之间的相似度，其中，可以根据I _a的灰度直方图H _a中各个灰度的权重、H _a中各个灰度对应的像素个数及H _b中各个灰度对应的像素个数，确定I _a与I _b之间的相似度。

下面通过具体示例对确定第一图像与第二图像之间的相似度进行介绍：

第一步：确定I _a的灰度直方图H _a与I _b的灰度直方图H _b。

具体地，H _a与H _b的灰度的分布范围均为[0,255]，表示亮度从深到浅，对应图像中的颜色为从黑到白，即白色为255，黑色为0。其中，灰度直方图是将数字图像中的所有像素，按照灰度值的大小，统计其出现的频率。灰度直方图是灰度级的函数，它表示图像中具有某种灰度级的像素的个数，反映了图像中某种灰度出现的频率。

第二步：计算H _a中各个灰度的权重(记作ε _i，i的取值范围为0至255)。

具体地，针对每个灰度，将该灰度对应的像素的个数与像素总数的比值作为该灰度的权重。例如，可以通过如下公式来计算H _a中各个灰度的权重ε _i：

其中，上式中的

表示I _a中具有灰度值i的像素的个数，

表示I _a中各种灰度值的像素的总数。

进一步地，本申请实施例使用灰度直方图的相似程度对I _a与I _b之间的相似程度进行评价，本实施例中将I _a作为参考图像，其灰度分布越多的区域，代表图像的主要信息的分布越集中在此区域，本实施例利用此信息，确定每个灰度范围的权重，保障视频拼接方法的稳定性。

第三步：评价I _a与I _b之间的相似度，其中，相似度记作S。

具体地，可以通过如下公式来计算I _a与I _b之间的相似度：

其中，上式为归一化后的相似度计算公式,S∈[0，1]，上式中的

表示I _b中具有灰度值i的像素的个数，S值越大代表相似程度越高。

进一步地，可以将计算得到的相似度值S与预设相似度阈值(例如0.87)进行比较，如果S不小于预设相似度阈值，则确定I _a与I _b之间满足预设相似度条件。

对于本实现方式，通过对前后帧进行相似性评价，确保了拼接算法的运行意义，有效过滤不符合使用条件的拼接场景。

本申请实施例提供了另一种可能的实现方式，步骤S120(确定第一图像相对于第二图像的运动向量)具体包括：

基于预设形变比率，对第一图像与第二图像分别进行横向形变与纵向形变；

根据横向形变后的第一图像相对于横向形变后的第二图像的水平移动距离，确定第一图像在水平方向上的第一运动距离；

根据纵向形变后的第一图像相对于纵向形变后的第二图像的垂直移动距离，确定第一图像在垂直方向上的第二运动距离；

根据第一运动距离、第二运动距离以及预设形变比率，确定运动向量。

具体地，本申请实施例假定第二图像是固定不变的，只对第一图像进行运动，相当于第二图像是由第一图像运动而来的，故需要计算第一图像的运动向量。

进一步地，在计算第一图像的运动向量前，需要先根据预设形变比率对第一图像与第二图像分别进行横向形变与纵向形变。其中，预设形变比率包括横向形变比率与纵向形变比率，横向形变比率与纵向形变比率相同或者不相同。

本申请实施例中，所述的形变具体是指按一定比率，在横向或者纵向上对图像进行拉伸或者缩短。预设形变比率的具体数值将会直接影响到运动向量的估计精度。在实际应用中，如果横向形变比率为1，则横向宽度保持原始宽度不变。如果纵向高度变为高度10，则纵向形变比率

原始高度。其中，图像的原始宽度与原始高度是图像本身的属性，即给出一帧图像后就可以获知其原始宽度与原始高度。

进一步地，可以根据横向形变比率对第一图像与第二图像分别进行横向形变，得到相应的第一横向形变图像与第二横向形变图像。其中，由于第一图像与第二图像是由同一终端设备拍摄的相同背景的视频中的图像，所以第一图像的原始横向高度与第二图像的原始横向高度相同，第一图像的原始纵向高度与第二图像的原始纵向高度相同，于是第一横向形变图像的宽度与第二横向形变图像的宽度相同，第一横向形变图像的高度与第二横向形变图像的高度相同。

进一步地，为便于计算后续计算第一横向形变图像在水平方向上的移动距离，可以将得到的第一横向形变图像与第二横向形变图像，设置为在水平方向上平行且两端对齐，如图3a中的第(1)部分所示，此为第一横向形变图像与第二横向形变图像的初始位置。

进一步地，可以根据纵向形变比率对第一图像与第二图像分别进行纵向形变，得到相应的第一纵向形变图像与第二纵向形变图像。其中，由于第一图像与第二图像是由同一终端设备拍摄的相同背景的视频中的图像，所以第一图像的原始横向高度与第二图像的原始横向高度相同，第一图像的原始纵向高度与第二图像的原始纵向高度相同，于是第一纵向形变图像的宽度与第二纵向形变图像的宽度相同，第一纵向形变图像的高度与第二纵向形变图像的高度相同。

进一步地，为便于计算后续计算第一纵向形变图像相对于第二纵向形变图像在垂直方向上的移动距离，可以将得到的第一纵向形变图像与第二纵向形变图像，设置为在垂直方向上平行且两端对齐，如图3a中的第(1)部分所示。

进一步地，在根据横向形变后的第一图像相对于横向形变后的第二图像的水平移动距离，确定第一图像在水平方向上的第一运动距离的过程中，可以将第一横向形变图像在水平方向上依次移动，并在每次移动后，确定该次移动后的第一横向形变图像与第二横向形变图像在垂直方向上相对应的两个子图像，计算该两个子图像之间的第一差异值，并确定该次移动后第一横向形变图像产生移动的像素点总数，即第一横向形变图像相对于初始位置移动的像素点总数。

若总共移动X个像素点，X为正整数，上述的X个像素点为在水平方向上移动后的第一横向形变图像与第二横向形变图像之间，在垂直方向上不存在相对应部分的情况下，第一横向形变图像总共移动的像素点数。

上述在水平方向上的移动可以为水平左移，例如图3a中的(2)所示，也可以为水平右移，本申请实施例不对其做限制。下面以水平左移为例，对其进行介绍，如下所示：

在一种情况下，若将第一横向形变图像在水平方向上依次左移，且每次均移动m个像素点，1≤m≤X，即每次左移m个像素点(例如第一次移动1个像素点，第二次移动是在第一次移动的基础上再移动1个像素点，第三次移动是在第二次移动的基础上再移动1个像素点等等)，所有移动次数的总和为X个像素点，则每移动一次第一横向形变图像，就计算一次差异值，即计算一次移动后的第一横向形变图像与第二横向形变图像在垂直方向上相对应的两个子图像之间的第一差异值。

如附图3b所示，第一横向形变图像与第二横向形变图像在水平方向上平行且两端对齐后，将第一横向形变图像向左移动m个像素点，得到虚线所示的移动后的第一横向形变图像，然后将移动后的第一横向形变图像和第二横向形变图像在垂直方向上对齐后，得到相互对应(即能够相互重叠)的两个子图像。

假如总共移动了L次，则总共计算得到L个差异值，其中，每次计算得到的差异值相同或不同。另外，本段涉及到的差异值均指第一差异值。

在另一种情况下，若将第一横向形变图像在水平方向上依次左移，且每次移动的像素点数不固定(例如第一次移动1个像素点，第二次移动是在第一次移动的基础上再移动2个像素点，第三次移动是在第二次移动的基础上再移动4个像素点等等)，即每次移动的像素点数是动态改变的，所有移动次数的总和为X个像素点，则每移动一次第一横向形变图像，就计算一次差异值，即计算一次移动后的第一横向形变图像与第二横向形变图像在垂直方向上相对应的两个子图像之间的差异值。假如总共移动了Q次，则总共计算得到Q个差异值，其中，每次计算得到的差异值相同或不同。另外，本段涉及到的差异值均指第一差异值。

进一步地，在计算得到每次移动后的第一横向形变图像与第二横向形变图像在垂直方向上相对应部分的多个第一差异值后，确定各个第一差异值中的最小值，并将该最小值对应的第一差异值记作第一目标差异值，即从多个差异值中确定取值最小的差异值，并将该取值最小的差异值确定为第一目标差异值。

进一步地，在确定出第一目标差异值之后，确定该第一目标差异值所对应的移动的像素点总数，并将该像素点总数确定为第一图像在水平方向上的第一运动距离。假如第一次移动1个像素点，第二次移动是在第一次移动的基础上再移动2个像素点，第三次移动是在第二次移动的基础上再移动4个像素点等等，总共移动了X个像素点，且确定出的第一目标差异值为第三移动后的第一横向形变图像与第二横向形变图像之间在垂直方向上的相对应部分的差异值，则该第一目标差异值所对应的移动的像素点总数为7，即前三次移动的像素点总数，从而得到第一图像在水平方向上的第一运动距离为7个像素点。

进一步地，在根据纵向形变后的第一图像相对于纵向形变后的第二图像的垂直移动距离，确定第一图像在垂直方向上的第二运动距离的过程中，可以将第一纵向形变图像在垂直方向上依次移动，并在每次移动后，确定该次移动后的第一纵向形变图像与第二纵向形变图像在水平方向上相对应的两个子图像，计算该两个子图像之间的第二差异值，并确定该次移动时所述第一纵向形变图像产生移动的像素点总数。

若总共移动Y个像素点，Y为正整数，上述的Y个像素点为在垂直方向上移动后的第一纵向形变图像与第二纵向形变图像之间，在水平方向上不存在相对应部分的情况下，第一纵向形变图像总共移动的像素点数。

上述在垂直方向上的移动可以为垂直向下，例如图3a中的(3)所示，也可以为垂直向上，本申请实施例不对其做限制。下面以垂直向上为例，对其进行介绍，如下所示：

在一种情况下，若将第一纵向形变图像在垂直方向上依次上移，且每次均移动n个像素点，1≤n≤X，即每次上移n个像素点(例如第一次移动1个像素点，第二次移动是在第一次移动的基础上再移动1个像素点，第三次移动是在第二次移动的基础上再移动1个像素点等等)，所有移动次数的总和为Y个像素点，则每移动一次第一纵向形变图像，就计算一次差异值，即计算一次移动后的第一纵向形变图像与第二纵向形变图像在水平方向上相对应的两个子图像之间的第二差异值。

如附图3c所示，第一纵向形变图像与第二纵向形变图像在垂直方向上平行且两端对齐后，将第一横向形变图像向上移动n个像素点，得到虚线所示的移动后的第一纵向形变图像，然后将移动后的第一纵向形变图像和第二纵向形变图像在水平方向上对齐后，得到相互对应(即能够相互重叠)的两个子图像。

假如总共移动了R次，则总共计算得到R个差异值，其中，每次计算得到的差异值相同或不同。另外，本段涉及到的差异值均指第二差异值。

在另一种情况下，若将第一纵向形变图像相对于第二纵向形变图像在垂直方向上依次上移，且每次移动的像素点数不固定(例如第一次移动1个像素点，第二次移动是在第一次移动的基础上再移动2个像素点，第三次移动是在第二次移动的基础上再移动4个像素点等等)，即每次移动的像素点数是动态改变的，所有移动次数的总和为Y个像素点，则每移动一次第一纵向形变图像，就计算一次差异值，即计算一次移动后的第一纵向形变图像与第二纵向形变图像在水平方向上相对应部分的差异值。假如总共移动了P次，则总共计算得到P个差异值，其中，每次计算得到的差异值相同或不同。另外，本段涉及到的差异值均指第二差异值。

进一步地，在计算得到每次移动后的第一纵向形变图像与第二纵向形变图像在水平方向上相对应部分的多个第二差异值后，确定各个第二差异值中的最小值，并将该最小值对应的第二差异值记作第二目标差异值，即从多个差异值中确定取值最小的差异值，并将该取值最小的差异值确定为第二目标差异值。

进一步地，在确定出第二目标差异值之后，确定该第二目标差异值所对应的移动的像素点总数，并将该像素点总数确定为第一图像在垂直方向上的第二运动距离。假如第一次移动1个像素点，第二次移动是在第一次移动的基础上再移动2个像素点，第三次移动是在第二次移动的基础上再移动4个像素点等等，总共移动了Y个像素点，且确定出的第二目标差异值为第三移动后的第一纵向形变图像与第二纵向形变图像在水平方向上相对应部分的差异值，则该第二目标差异值所对应的移动的像素点总数为7，即前三次移动的像素点总数，从而得到第一图像在垂直方向上的第二运动距离为7个像素点。

进一步地，在得到上述的第一运动距离与第二运动距离后，根据第一运动距离、第二运动距离以及预设形变比率，确定运动向量。其中，在确定运行向量的过程中，由于第一运动距离与第二距离都是根据形变后的第一图像计算得到的，所以在计算运动向量时，需要对第一运动距离与第二运动距离分别根据相应的形变比率进行反方向的调整。

其中，第一运动距离的反方向调整为：计算第一运动距离与横向形变比率的第一比值，第二运动距离的反方向调整为：计算第二运动距离与纵向形变比率的第二比值。其中，第一比值即为根据横向形变比率反方向调整后的第一运动距离，第二比值即为根据纵向形变比率反方向调整后的第二运动距离。

进一步地了，在得到第一比值与第二比值后，可以根据第一比值与第二比值，确定运动向量。例如运动向量为第一比值的方向向量与第二比值的方向向量的和。

下面给出本实现方式中计算运动向量的一种可行方式：

假如第一图像为图像A，第二图像为图像B，第一图像与第二图像的横向形变比率为

第一图像与第二图像的纵向形变比率为

第一横向形变图像为

第二横向形变图像为

第一纵向形变图像为

第二纵向形变图像为

则第一横向形变图像在水平方向上左移m个点后，第一横向形变图像与第二横向形变图像在垂直方向上相对应的两个子图像之间的第一差异值diff _m，可以根据如下公式计算得到：

其中，上式中的width表示第一图像与第二图像横向形变后的宽度，

表示第一横向形变图像在水平方向上左移m个点后，与第二横向形变图像在垂直方向上相对应的子图像部分，

表示第二横向形变与在水平方向上左移m个点的第一横向形变图像在垂直方向上相对应的子图像部分，两个子图像的大小是相同的，函数

表示计算两个子图像相应像素之间差值的总和并进行归一化。

类似地，第一纵向形变图像在垂直方向上移n个点后，第一纵向形变图像与第二纵向形变图像之间在水平方向上相对应的两个子图像之间的第二差异值diff _n，可以根据如下公式计算得到：

其中，上式中的height表示第一图像与第二图像纵向形变后的高度，

表示第一纵向形变图像在垂直方向上移n个点后，与第二纵向形变图像在水平方向上相对应的子图像部分，

表示第二纵向形变图像与在垂直方向上移n个点的第一纵向形变图像在水平方向上相对应的子图像部分，两个子图像的大小是相同的，函数

进一步地，在具体情况中，还可以将得到的多个第一差异值分别表示在直角坐标系中，并将多个第一差异值依次连线，构成一条曲线，该曲线中的极小值即为第一目标差异值。类似地，也可以将得到的多个第二差异值分别表示在直角坐标系中，并将多个第二差异值依次连线，构成一条曲线，该曲线中的极小值即为第二目标差异值。如图4所示。

进一步地，第一图像的运动向量可以通过下式计算得到：

其中，上式中的

表示第一图像的运动向量，

表示第一运动距离与横向形变比率的第一比值，

表示第二运动距离与纵向形变比率的第二比值。

向量所指的方向即为第一图像的运动方向，其角度记为θ，其长度为运动距离，如图5所示。

另外，在通过上式(3)与(4)估算第一差异值时，计算的是两个形变后的图像之间的差值之和，可以表征两个子图像所对应向量的相对距离，这种根据相对距离计算差异值的方式，能够提高运算速度。

本申请实施例提供了另一种可能的实现方式，其中，在根据运动向量，确定第一图像与第二图像之间的至少一个补偿帧时，可以在预定的补偿时长的任一补偿时间区间上，根据运动向量，确定第一图像与第二图像之间的补偿帧。

具体地，在获得第一图像的运动向量(包括运动方向与运动距离)后，便可以对第一图像进行演化补偿。其中，具体的补偿策略为：首先确定在任一补偿时间区间上的第一预设参数；接着计算第一预设参数与第二图像的向量之间的第一乘积；接着计算第二预设参数与第三图像的向量之间的第二乘积，该第二预设参数为预设数值与第一预设参数间的差值，其中，第三图像为根据运动向量运动后的第一图像与第二图像之间的重叠部分；接着根据第一乘积与第二乘积，确定该补偿时间区间上的图像帧，并渲染图像帧，得到补偿帧。

其中，通过上述方式可以在预定的补偿时长的多个补偿时间区间上，得到对应的多个补偿帧，从而基于该多个补偿帧拼接第一图像与第二图像，以拼接第一待拼接视频与第二待拼接视频。

进一步地，给出本实现方式中计算确定补偿帧的一种可行方式：

α∝T

其中，上式中的α为上述的第一预设参数，T为某个补偿时间区间，α正比于时间参数T，

表示根据运动向量运动后的第一图像与第二图像之间的重叠部分，

表示第二图像，μ为预设数值，可以设置为1，I _{interpolation}表示计算得到的补偿帧。

换言之，T每取一个数值，α就对应取一个值，从而可以得到一个相应的图像补偿帧I _{interpolation}。其中，计算出的补偿帧有多个，而且补偿帧的个数与时间参数T的取值密切相关。

进一步地，在得到多个补偿帧后，可以利用终端设备的GPU(Graphics Processing Unit，图形处理器)对得到的至少一个补偿帧进行渲染，将第一图像过渡为第二图像，即实现了第二图像与运动后的第一图像的融合，如图 6所示。另外，本步骤的方法无需全局的信息，因此在算法上是可并行的，在移动设备端均可与渲染结合，实现实时的渲染以及编码。

本申请实施例提供的方法，可以利用移动设备端GPU渲染合成的优势，对两段视频之间的抖动进行平滑补偿，使两段视频之间可以平滑过渡，不同于传统的模板类转场特效，本实施例的方法有着更强的适应性，同时使用GPU对算法进行加速，其抖动的补偿是实时的，对用户造成的影响较小，能够最大限度的保障用户的使用体验。

另外，本申请实施例提供的方法，移动设备端设计，从快速性以及补偿准确性出发，并利用了移动设备端的GPU对算法进行加速。(1)在性能上，选择使用可并行的算法，加快计算速度，并结合GPU渲染，实现实时拼接的效果。(2)在准确性上，针对非线性的视频拍摄拼接进行优化定制，减少多段视频拼接后的图像抖动，提供更好的视频拼接以及发布体验。(3)在适用性上，本方法覆盖Android(安卓)移动设备端以及iOS(苹果)移动设备端，能够尽量覆盖多数用户。

本申请再一实施例提供了一种视频拼接装置，其结构示意图如图7所示，该装置70可以包括检测模块71、确定模块72与拼接模块73，其中，

检测模块71用于检测第一图像与第二图像之间的相似度，第一图像为第一待拼接视频的最后一帧图像，第二图像为第二待拼接视频的首帧图像；

确定模块72用于当相似度满足预设条件时，确定第一图像相对于第二图像的运动向量；

拼接模块73用于根据运动向量，确定第一图像与第二图像之间的至少一个补偿帧，并基于至少一个补偿帧拼接第一图像与第二图像，以拼接第一待拼接视频与第二待拼接视频。

具体地，图8为本申请再一实施例提供的一种视频拼接处理装置的详细结构示意图，该装置80可以包括检测模块81、确定模块82与拼接模块83。其中，图8中的检测模块81所实现的功能与图7中的检测模块71相同，图8中的确定模块82所实现的功能与图7中的确定模块72相同，图8中的拼接模块83所实现的功能与图7中的拼接模块73相同，在此不再赘述。下面对图8所示的视频拼接装置进行详细介绍：

其中，相似度满足预设条件，包括：相似度不小于预设相似度阈值。

在一种实现方式中，检测模块81具体用于确定第一图像的第一灰度直方图与第二图像的第二灰度直方图；以确定所述第一灰度直方图各个灰度的权重；及用于根据所确定的权重、第一灰度直方图中各个灰度对应的像素个数及第二灰度直方图中各个灰度对应的像素个数，确定第一图像与第二图像之间的相似度。

在另一种实现方式中，确定模块82包括形变子模块721、第一确定子模块722、第二确定子模块723与第三确定子模块724；

形变子模块721用于基于预设形变比率，对第一图像与第二图像分别进行横向形变与纵向形变；

第一确定子模块722用于根据横向形变后的第一图像相对于横向形变后的第二图像的水平移动距离，确定第一图像在水平方向上的第一运动距离；

第二确定子模块723用于根据纵向形变后的第一图像相对于纵向形变后的第二图像的垂直移动距离，确定第一图像在垂直方向上的第二运动距离；

第三确定子模块724用于根据第一运动距离、第二运动距离以及预设形变比率，确定运动向量。

在另一种实现方式中，预设形变比率包括横向形变比率与纵向形变比率，形变子模块721包括第一形变单元7211与第二形变单元7212；其中，

第一形变单元7211用于根据横向形变比率对第一图像与第二图像分别进行横向形变，得到相应的第一横向形变图像与第二横向形变图像；

第二形变单元7212用于根据纵向形变比率对第一图像与第二图像分别进行纵向形变，得到相应的第一纵向形变图像与第二纵向形变图像。

在另一种实现方式中，第一形变单元7211具体用于，将所述第一横向形变图像与所述第二横向形变图像设置为在水平方向上平行且两端对齐；将第一横向形变图像在水平方向上依次移动，并在每次移动后，确定该次移动后的第一横向形变图像与第二横向形变图像在垂直方向上相对应的两个子图像，计算该两个子图像之间的第一差异值，并确定该次移动后所述第一横向形变图像产生移动的像素点总数；确定各个第一差异值中的最小值，并将该最小值对应的第一差异值记作第一目标差异值；将与所述第一目标差异值相对应的移动的像素点总数，确定为所述第一图像在水平方向上的第一运动距离。

在另一种实现方式中，第二形变单元7212具体用于，将所述第一纵向形变图像与所述第二纵向形变图像设置为在垂直方向上平行且两端对齐；将第一纵向形变图像在垂直方向上依次移动，并在每次移动后，确定该次移动后的第一纵向形变图像与第二纵向形变图像在水平方向上相对应的两个子图像，计算该两个子图像之间的第二差异值，并确定该次移动时所述第一纵向形变图像产生移动的像素点总数；确定各个第二差异值中的最小值，并将该最小值对应的第二差异值记作第二目标差异值；将与所述第二目标差异值相对应的移动的像素点总数，确定为所述第一图像在垂直方向上的第二运动距离。

在另一种实现方式中，第三确定子模块724包括第一计算单元7241、第二计算单元7242与确定单元7243；

第一计算单元7241用于计算第一运动距离与横向形变比率的第一比值；

第二计算单元7242用于计算第二运动距离与纵向形变比率的第二比值；

确定单元7243用于根据第一比值与第二比值，确定运动向量。

在另一种实现方式中，拼接模块83包括第四确定子模块831、第一计算子模块832、第二计算子模块833及处理子模块834；

第四确定子模块831用于确定在任一补偿时间区间上的第一预设参数；

第一计算子模块832用于计算第一预设参数与第二图像的向量之间的第一乘积；

第二计算子模块833用于计算第二预设参数与第三图像的向量之间的第二乘积，第三图像为根据运动向量运动后的第一图像与第二图像之间的重叠部分；

处理子模块834用于根据第一乘积与第二乘积，确定该补偿时间区间上的图像帧，并渲染图像帧，得到补偿帧。

在另一种实现方式中，拼接模块83用于，对所述至少一个补偿帧进行渲染，将所述第一图像过渡为所述第二图像

本申请实施例提供的装置，与传统技术相比，通过确定满足预设相似性条件的第一图像相对于第二图像的运动向量，以及根据运动向量，确定第一图像与第二图像之间的至少一个补偿帧，并基于至少一个补偿帧拼接第一图像与第二图像，提供了一种能够在移动设备端对非线性的视频拍摄片段进行拼接的方法，不仅能够在移动设备端可以实时、高效地对多段视频进行拼接，高质地对衔接处发生的抖动进行平滑补偿，使得多段视频之间可以平滑过渡，确保用户上传的视频更加平滑，有效减少多段视频拼接后的图像抖动或图像跳变等情况的发生，从而极大提升用户的视频拼接、发布及观看体验，而且能够覆盖安卓、苹果等操作系统的终端设备，无需终端设备中特定硬件的支撑，避免了对硬件厂商的依赖，解决了传统视频插帧方法对移动设备及使用场景的限制。

本申请另一实施例提供了一种电子设备，如图9所示，图9所示的电子设备900包括：处理器901和存储器903。其中，处理器901和存储器903相连，如通过总线902相连。进一步地，电子设备900还可以包括收发器904。需要说明的是，实际应用中收发器904不限于一个，该电子设备900的结构并不构成对本申请实施例的限定。

其中，处理器901应用于本申请实施例中，用于实现图7或图8所示的检测模块、确定模块及拼接模块的功能。

处理器901可以是CPU，通用处理器，DSP，ASIC，FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器901也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等。

总线902可包括一通路，在上述组件之间传送信息。总线902可以是PCI总线或EISA总线等。总线902可以分为地址总线、数据总线、控制总线等。为便于表示，图9中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器903可以是ROM或可存储静态信息和指令的其他类型的静态存储设备，RAM或者可存储信息和指令的其他类型的动态存储设备，也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。

存储器903用于存储执行本申请方案的应用程序代码，并由处理器901来控制执行。处理器901用于执行存储器903中存储的应用程序代码，以实现图7或图8所示实施例提供的视频拼接装置的动作。

本申请实施例提供的电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时，与传统技术相比，可实现：通过确定满足预设条件的第一图像相对于第二图像的运动向量，以及根据运动向量，确定第一图像与第二图像之间的至少一个补偿帧，并基于至少一个补偿帧拼接第一图像与第二图像，提供了一种能够在移动设备端对非线性的视频拍摄片段进行拼接的方法，不仅可以在移动设备端实时、高效地对多段视频进行拼接，高质地对衔接处发生的抖动进行平滑补偿，使得多段视频之间可以平滑过渡，确保用户上传的视频更加平滑，有效减少多段视频拼接后的图像抖动或图像跳变等情况的发生，极大提升用户的视频拼接、发布及观看体验，而且能够覆盖安卓、苹果等操作系统的终端设备，无需终端设备中特定硬件的支撑，避免了对硬件厂商的依赖，解决了传统视频插帧方法对移动设备及使用场景的限制。

本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该程序被处理器执行时实现实施例一所示的方法。与传统技术相比，通过确定满足预设条件的第一图像相对于第二图像的运动向量，以及根据运动向量，确定第一图像与第二图像之间的至少一个补偿帧，并基于至少一个补偿帧拼接第一图像与第二图像，提供了一种能够在移动设备端对非线性的视频拍摄片段进行拼接的方法，不仅可以在移动设备端实时、高效地对多段视频进行拼接，高质地对衔接处发生的抖动进行平滑补偿，使得多段视频之间可以平滑过渡，确保用户上传的视频更加平滑，有效减少多段视频拼接后的图像抖动或图像跳变等情况的发生，极大提升用户的视频拼接、发布及观看体验，而且能够覆盖安卓、苹果等操作系统的终端设备，无需终端设备中特定硬件的支撑，避免了对硬件厂商的依赖，解决了传统视频插帧方法对移动设备及使用场景的限制。

本申请实施例提供的计算机可读存储介质适用于上述方法的任一实施例。在此不再赘述。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上所述仅是本申请的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

一种视频拼接方法，由电子设备执行，包括：

检测第一图像与第二图像之间的相似度，所述第一图像为第一待拼接视频的最后一帧图像，所述第二图像为第二待拼接视频的首帧图像；

如果所述相似度满足预设条件，则确定所述第一图像相对于所述第二图像的运动向量；

根据所述运动向量，确定所述第一图像与所述第二图像之间的至少一个补偿帧，并基于所述至少一个补偿帧拼接所述第一图像与所述第二图像，以拼接所述第一待拼接视频与所述第二待拼接视频。
根据权利要求1所述的方法，其中，所述检测第一图像与第二图像之间的相似度，包括：

确定第一图像的第一灰度直方图与第二图像的第二灰度直方图；

确定所述第一灰度直方图各个灰度的权重；

根据所确定的权重、所述第一灰度直方图中各个灰度对应的像素个数及所述第二灰度直方图中各个灰度对应的像素个数，确定所述第一图像与所述第二图像之间的相似度。
根据权利要求2所述的方法，其中，所述确定所述第一灰度直方图各个灰度的权重，包括：

针对每个灰度，将该灰度对应的像素的个数与像素总数的比值作为该灰度的权重。
根据权利要求1所述的方法，其中，所述确定所述第一图像相对于所述第二图像的运动向量，包括：

基于预设形变比率，对所述第一图像与所述第二图像分别进行横向形变与纵向形变；

根据横向形变后的第一图像相对于横向形变后的第二图像的水平移动距离，确定所述第一图像在水平方向上的第一运动距离；

根据纵向形变后的第一图像相对于纵向形变后的第二图像的垂直移动距离，确定所述第一图像在垂直方向上的第二运动距离；

根据所述第一运动距离、所述第二运动距离以及所述预设形变比率，确定所述运动向量。
根据权利要求4所述的方法，其中，所述预设形变比率包括横向形变比率与纵向形变比率，所述基于预设形变比率，对所述第一图像与所述第二图像分别进行横向形变与纵向形变，包括：

根据所述横向形变比率对所述第一图像与所述第二图像分别进行横向形变，得到相应的第一横向形变图像与第二横向形变图像；

根据所述纵向形变比率对所述第一图像与所述第二图像分别进行纵向形变，得到相应的第一纵向形变图像与第二纵向形变图像。
根据权利要求5所述的方法，其中，所述根据横向形变后的第一图像相对于横向形变后的第二图像的水平移动距离，确定所述第一图像在水平方向上的第一运动距离，包括：

将所述第一横向形变图像与所述第二横向形变图像设置为在水平方向上平行且两端对齐；

将第一横向形变图像在水平方向上依次移动，并在每次移动后，确定该次移动后的第一横向形变图像与第二横向形变图像在垂直方向上相对应的两个子图像，计算该两个子图像之间的第一差异值，并确定该次移动后所述第一横向形变图像产生移动的像素点总数；

确定各个第一差异值中的最小值，并将该最小值对应的第一差异值记作第一目标差异值；

将与所述第一目标差异值相对应的移动的像素点总数，确定为所述第一图像在水平方向上的第一运动距离。
根据权利要求5所述的方法，其中，所述根据纵向形变后的第一图像相对于纵向形变后的第二图像的垂直移动距离，确定所述第一图像在垂直方向上的第二运动距离，包括：

将所述第一纵向形变图像与所述第二纵向形变图像设置为在垂直方向上平行且两端对齐；

将第一纵向形变图像在垂直方向上依次移动，并在每次移动后，确定该次移动后的第一纵向形变图像与第二纵向形变图像在水平方向上相对应的两个子图像，计算该两个子图像之间的第二差异值，并确定该次移动时所述第一纵向形变图像产生移动的像素点总数；

确定各个第二差异值中的最小值，并将该最小值对应的第二差异值记作第二目标差异值；

将与所述第二目标差异值相对应的移动的像素点总数，确定为所述第一图像在垂直方向上的第二运动距离。
根据权利要求4所述的方法，其中，所述预设形变比率包括横向形变比率与纵向形变比率，所述根据所述第一运动距离、所述第二运动距离以及所述预设形变比率，确定所述运动向量，包括：

计算所述第一运动距离与所述横向形变比率的第一比值；

计算所述第二运动距离与所述纵向形变比率的第二比值；

根据所述第一比值与所述第二比值，确定所述运动向量。
根据权利要求1所述的方法，其中，所述根据所述运动向量，确定所述第一图像与所述第二图像之间的至少一个补偿帧，包括：

确定在任一补偿时间区间上的第一预设参数；

计算第一预设参数与所述第二图像的向量之间的第一乘积；

计算第二预设参数与第三图像的向量之间的第二乘积，所述第三图像为根据所述运动向量运动后的第一图像与第二图像之间的重叠部分；

根据所述第一乘积与所述第二乘积，确定该补偿时间区间上的图像帧，并渲染所述图像帧，得到所述补偿帧。
根据权利要求1所述的方法，其中，所述基于所述至少一个补偿帧拼接所述第一图像与所述第二图像，包括：

对所述至少一个补偿帧进行渲染，将所述第一图像过渡为所述第二图像。
一种视频拼接装置，包括：

检测模块，用于检测第一图像与第二图像之间的相似度，所述第一图像为第一待拼接视频的最后一帧图像，所述第二图像为第二待拼接视频的首帧图像；

确定模块，用于当所述相似度满足预设条件时，确定所述第一图像相对于所述第二图像的运动向量；

拼接模块，用于根据所述运动向量，确定所述第一图像与所述第二图像之间的至少一个补偿帧，并基于所述至少一个补偿帧拼接所述第一图像与所述第二图像，以拼接所述第一待拼接视频与所述第二待拼接视频。
根据权利要求11所述的装置，其中，所述检测模块用于，确定第一图像的第一灰度直方图与第二图像的第二灰度直方图；确定所述第一灰度直方图各个灰度的权重；根据所确定的权重、所述第一灰度直方图中各个灰度对应的像素个数及所述第二灰度直方图中各个灰度对应的像素个数，确定所述第一图像与所述第二图像之间的相似度。
根据权利要求11所述的装置，其中，所述确定模块包括：

形变子模块，用于基于预设形变比率，对所述第一图像与所述第二图像分别进行横向形变与纵向形变；

第一确定子模块，用于根据横向形变后的第一图像相对于横向形变后的第二图像的水平移动距离，确定所述第一图像在水平方向上的第一运动距离；

第二确定子模块，用于根据纵向形变后的第一图像相对于纵向形变后的第二图像的垂直移动距离，确定所述第一图像在垂直方向上的第二运动距离；

第三确定子模块，用于根据所述第一运动距离、所述第二运动距离以及所述预设形变比率，确定所述运动向量。
根据权利要求13所述的装置，其中，所述行变子模块包括：

第一形变单元，用于根据所述横向形变比率对所述第一图像与所述第二图像分别进行横向形变，得到相应的第一横向形变图像与第二横向形变图像；

第二形变单元，用于根据所述纵向形变比率对所述第一图像与所述第二图像分别进行纵向形变，得到相应的第一纵向形变图像与第二纵向形变图像。
根据权利要求13所述的装置，其中，所述第三确定子模块包括：

第一计算单元，用于计算所述第一运动距离与所述横向形变比率的第一比值；

第二计算单元，用于计算所述第二运动距离与所述纵向形变比率的第二比值；

确定单元，用于根据所述第一比值与所述第二比值，确定所述运动向量。
根据权利要求11所述的装置，其中，所述拼接模块包括：

第四确定子模块，用于确定在任一补偿时间区间上的第一预设参数；

第一计算子模块，用于计算第一预设参数与所述第二图像的向量之间的第一乘积；

第二计算子模块，用于计算第二预设参数与第三图像的向量之间的第二乘积，所述第三图像为根据所述运动向量运动后的第一图像与第二图像之间的重叠部分；

处理子模块，用于根据所述第一乘积与所述第二乘积，确定该补偿时间区间上的图像帧，并渲染所述图像帧，得到所述补偿帧。
根据权利要求11所述的装置，其中，所述拼接模块用于，对所述至少一个补偿帧进行渲染，将所述第一图像过渡为所述第二图像。
一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1-10任一项所述的视频拼接方法。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该程序被处理器执行时实现权利要求1-10任一项所述的视频拼接方法。