CN109040619A

CN109040619A - 一种视频融合方法和装置

Info

Publication number: CN109040619A
Application number: CN201810974130.3A
Authority: CN
Inventors: 王志纯
Original assignee: Hefei Jingzhang Technology Co Ltd
Current assignee: Hefei Jingzhang Technology Co Ltd
Priority date: 2018-08-24
Filing date: 2018-08-24
Publication date: 2018-12-18

Abstract

本发明公开了一种视频融合方法和装置，其中，所述视频融合方法包括：响应于视频融合指令，获取至少两个待融合视频；针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征；融合所述至少两个待融合视频的角色特征得到角色融合特征；和融合所述至少两个待融合视频的风格特征得到风格融合特征；根据所述角色融合特征和风格融合特征生成目标视频。通过融合所述至少两个待融合视频的角色特征得到角色融合特征，进而根据所述角色融合特征和风格融合特征生成目标视频，实现了多个视频中各维度特征的融合，以呈现出内容更加丰富的目标视频，提高用户体验。

Description

一种视频融合方法和装置

技术领域

本发明涉及人工智能领域，特别涉及一种视频融合方法和装置。

背景技术

视频融合技术是虚拟现实技术的一个分支，也可以说是虚拟现实的一个发展阶段。视频融合技术指将一个或多个由视频采集设备采集的关于某场景或模型的图像序列视频与一个与之相关的虚拟场景加以融合，以生成一个新的关于此场景的虚拟场景或模型。

这个模型中因为视频的加入得到一个无论是虚拟场景还是视频本身都无法单独完成的信息结合体。视频融合的目的是增加虚拟场景与现实的互动性，减小计算机模型中信息不确定因素，增加虚拟模型的信息承载量，为现实与虚拟之间架起一座桥梁，拓展虚拟现实技术的应用领域。

发明内容

本发明要解决的技术问题是提供一种视频融合方法，以实现多个视频中特征的融合，以呈现出内容更加丰富的目标视频。

为了解决上述技术问题，本发明的技术方案为一种视频融合方法，具体包括：

响应于视频融合指令，获取至少两个待融合视频；

针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征；

融合所述至少两个待融合视频的角色特征得到角色融合特征；和融合所述至少两个待融合视频的风格特征得到风格融合特征；

根据所述角色融合特征和风格融合特征生成目标视频。

在上述实施例的基础上，针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征之前，还包括：

根据用户的选择确定所述目标视频的场景特征；

对应的，所述根据所述角色融合特征和风格融合特征生成目标视频，包括：

根据所述角色融合特征、所述风格融合特征和所述场景特征得到目标视频。

在上述实施例的基础上，所述针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征，还包括：

针对任意一个待融合视频，从待融合视频中提取关键帧；

从关键帧中提取多个角色特征片段和多个风格特征片段；

整合所述多个角色特征片段得到角色特征；和整合所述多个风格特征片段得到风格特征。

在上述实施例的基础上，所述针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征，之前，还包括；

预处理所述待融合视频。

依照相同的思路，本发明还提供了一种视频融合装置，具体为：

获取模块，用于响应于视频融合指令，获取至少两个待融合视频；

提取模块，用于针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征；

融合模块，用于融合所述至少两个待融合视频的角色特征得到角色融合特征；和融合所述至少两个待融合视频的风格特征得到风格融合特征；

视频生成模块，用于根据所述角色融合特征和风格融合特征生成目标视频。

在上述实施例的基础上，场景特征确定模块，用于根据用户的选择确定所述目标视频的场景特征；

对应的，所述融合模块包括多类融合单元，用于根据所述角色融合特征、所述风格融合特征和所述场景特征得到目标视频。

在上述实施例的基础上，所述提取模块包括：

提取关键帧单元，用于针对任意一个待融合视频，从待融合视频中提取关键帧；

特征片段提取单元，用于从关键帧中提取多个角色特征片段和多个风格特征片段；

特征整合单元，用于整合所述多个角色特征片段得到角色特征；和整合所述多个风格特征片段得到风格特征。

在上述实施例的基础上，视频融合装置还包括：

预处理模块，用于预处理所述待融合视频。

本发明实施例提供的一种视频融合方法和装置，通过融合所述至少两个待融合视频的角色特征得到角色融合特征，进而根据所述角色融合特征和风格融合特征生成目标视频，实现了多个视频中各维度特征的融合，以呈现出内容更加丰富的目标视频，提高用户体验。

附图说明

图1为本发明实施例一提供的一种视频融合方法的流程图；

图2为本发明实施例三提供的一种视频融合装置的结构示意图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是，对于这些实施方式的说明用于帮助理解本发明，但并不构成对本发明的限定。此外，下面所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。

实施例一

图1为本发明实施例一提供的一种视频融合方法的流程图，本实施例可以适用于：通过融合所述至少两个待融合视频的角色特征得到角色融合特征，进而根据所述角色融合特征和风格融合特征生成目标视频的情况。该方法可以由一种视频融合装置来执行，该装置可以通过软件和/或硬件的方式实现，并集成在是智能设备中。

其中，视频融合技术可以分为三个层次，即预处理、信息融合与应用层。预处理技术主要用来对视频图像进行几何校正、噪声消除、色彩；亮度调整及配准等等。视频图像配准是指找到视频图像与三维虚拟场景的最大相关，以消除图像在空间、相位和分辨率等方向的信息差异，达到融合更真实，信息更准确的目的。

本实施例通过的方法具体包括如下步骤：

S110、响应于视频融合指令，获取至少两个待融合视频。

其中,所述视频融合指令由用户通过移动终端发出，同时开始待融合视频的获取操作。所述待融合视频可以是由不同的用户上传，并想要通过融合待融合视频得到一个可以包括待融合视频中的所有视频对象、且视频对象可以发生关联的视频。

S120、针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征。

其中，所述角色特征用于表示待融合视频中出现的所有角色，例如视频中的主人公。所述风格特征用于表示待融合视频中视频剧情和色彩风格。本实施例中可以通过预先训练好的卷积神经网络提取所述角色特征和风格特征。

S130、融合所述至少两个待融合视频的角色特征得到角色融合特征；和融合所述至少两个待融合视频的风格特征得到风格融合特征。

本实施例中，在提取到所述角色特征和风格特征后，会针对所述至少两个待融合视频中的角色特征和风格特征分别进行融合，进而得到可以包括待融合视频中的全部角色的角色融合特征，得到与多个待融合视频的视频风格(或剧情风格)。

S140、根据所述角色融合特征和风格融合特征生成目标视频。

其中，所述目标视频即通过融合待融合视频所得到的结果，其基于所述角色融合特征和风格融合特征生成。在目标视频中可以看到待融合视频中的所有角色，以及与待融合视频相关的视频风格。

实施例二

在实施例一的基础上，本实施例还可以为用户提供场景特征选项，所述视频融合方法可以根据用户的选择确定所述目标视频的场景特征、色融合特征和风格融合特征得到目标视频。以得到与用户需求相匹配的目标视频。

具体的，所述视频融合方法包括：

S210、响应于视频融合指令，获取至少两个待融合视频。

S220、根据用户的选择确定所述目标视频的场景特征。

本实施例中，所述目标视频中所展示的场景可以通过用户的选择来确定，具体的，在用户执行视频融合指令之前，可以展示出多个场景特征以为用户提供多个场景特征选项。

S230、针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征；

具体的，所述针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征，还包括：

针对任意一个待融合视频，从待融合视频中提取关键帧；

从关键帧中提取多个角色特征片段和多个风格特征片段；

S240、融合所述至少两个待融合视频的角色特征得到角色融合特征；和融合所述至少两个待融合视频的风格特征得到风格融合特征；

S250、根据所述角色融合特征、所述风格融合特征和所述场景特征得到目标视频。

在上述实施例的基础上，所述针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征，之前，还包括；预处理所述待融合视频。这样的好处在于:

实施例三

图2为本发明实施例三提供的一种寻找视频融合装置的结构示意图，具体包括：获取模块310、提取模块320、融合模块330和视频生成模块340。

其中，获取模块310，用于响应于视频融合指令，获取至少两个待融合视频；

提取模块320，用于针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征；

融合模块330，用于融合所述至少两个待融合视频的角色特征得到角色融合特征；和融合所述至少两个待融合视频的风格特征得到风格融合特征；

视频生成模块340，用于根据所述角色融合特征和风格融合特征生成目标视频。

在上述实施例的基础上，所述提取模块包括：

在上述实施例的基础上，预处理模块，用于预处理所述待融合视频。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种视频融合方法，其特征在于，包括：

响应于视频融合指令，获取至少两个待融合视频；

根据所述角色融合特征和风格融合特征生成目标视频。

2.根据权利要求1所述的视频融合方法，其特征在于，针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征之前，还包括：

根据用户的选择确定所述目标视频的场景特征；

3.根据权利要求1所述的视频融合方法，其特征在于，所述针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征，还包括：

针对任意一个待融合视频，从待融合视频中提取关键帧；

从关键帧中提取多个角色特征片段和多个风格特征片段；

4.根据权利要求1所述的视频融合方法，其特征在于，所述针对任意一个待融合视频，从所述待融合视频中提取角色特征和风格特征，之前，还包括：

预处理所述待融合视频。

5.一种视频融合装置，其特征在于，包括：

6.根据权利要求5所述的视频融合装置，其特征在于，还包括：

场景特征确定模块，用于根据用户的选择确定所述目标视频的场景特征；

7.根据权利要求5所述的视频融合装置，其特征在于，所述提取模块包括：

8.根据权利要求5所述的视频融合装置，其特征在于，还包括；

预处理模块，用于预处理所述待融合视频。