WO2022063124A1

WO2022063124A1 - 视频融合方法和设备

Info

Publication number: WO2022063124A1
Application number: PCT/CN2021/119606
Authority: WO
Inventors: 杨晖
Original assignee: 连尚(北京)网络科技有限公司
Priority date: 2020-09-25
Filing date: 2021-09-22
Publication date: 2022-03-31
Also published as: CN112153422B; CN112153422A

Abstract

本申请实施例公开了视频融合方法和设备。该方法的一具体实施方式包括：获取终端上传的源视频，检测该源视频的帧图像中是否存在预先确定的可编辑特征，响应于确定帧图像中存在至少一个可编辑特征，向该终端发送帧图像中所存在的可编辑特征对应的推送模板集合以及标记信息，其中，标记信息中至少包括可编辑特征和帧图像中的一种；响应于从该终端接收到对该推送模板集合中的目标推送模板的选择信息，将对应的目标推送模板融合至该源视频中，以生成融合视频。该实施方式可以结合上传用户和其他用户提供的模板信息对源视频进行二次编辑，丰富源视频中的内容，以提升源视频的质量并发掘源视频的更多价值。

Description

视频融合方法和设备

本申请是以CN申请号为202011025894.1，申请日为2020.09.25的申请为基础，并主张其优先权，该CN申请的公开内容在此作为整体引入本申请中。

技术领域

本申请实施例涉及计算机技术领域，具体涉及视频融合方法和设备。

背景技术

随着社会进入互联网时代，越来越多的视频网站和自媒体的逐渐兴起，用户可以将自己制作的视频上传至视频网站或者自媒体中实现与其他用户的分享。

目前，视频文件制作时，仅可基于用户自身的灵感和内容进行制作，视频内容受到用户自身的水平限制，无法很好的适应当前互联网时代中信息交互的需求。

发明内容

本申请实施例提出了视频融合方法和设备。

第一方面，本申请实施例提供了一种视频融合方法，包括：获取终端上传的源视频；检测该源视频的帧图像中是否存在预先确定的可编辑特征；响应于确定该帧图像中存在至少一个可编辑特征，向该终端发送该帧图像中所存在的可编辑特征对应的推送模板集合以及标记信息，其中，该标记信息中至少包括该可编辑特征和该帧图像中的一种；响应于从该终端接收到对该推送模板集合中的目标推送模板的选择信息，将该目标推送模板融合至该源视频中，以生成融合视频。

在一些实施例中，将推送模板融合至该源视频中，以生成融合视频，包括：采用人工智能图像融合技术将该目标推送模板融合至该源视频对应的帧图像中。在一些实施例中，融合该推送模板至该源视频中生成融合视频包括：采用人工智能图像融合技术将该目标推送模板融合至该源视频对应的帧图像中。

在一些实施例中，采用人工智能图像融合技术将推送模板融合至源视频对应的帧图像中的步骤包括：获取该源视频对应的帧图像；采用语义分割神经网络处理该源视频对应的帧图像，确定该源视频对应的帧图像中包括该可编辑特征的图像区域，得到目标融合区域；将该目标推送模板中的内容替换添加至该目标融合区域。

在一些实施例中，检测源视频的帧图像中是否存在预先确定的可编辑特征包括：获取不同类型的推送模板集合，根据该推送模板集合的类型确定对应的匹配可编辑特征；检测该源视频的帧图像中是否存在该匹配可编辑特征。

在一些实施例中，响应于确定帧图像中存在至少一个可编辑特征，向终端发送帧图像中所存在的可编辑特征对应的推送模板集合,包括：响应于确定该帧图像中存在至少一个该匹配可编辑特征，得到与该匹配可编辑特征对应的匹配推送模板集合；向该终端发送该匹配推送模板集合。

在一些实施例中，目标推送模板的选择信息，包括：根据该匹配推送模板集合得到的匹配推送模板的选择信息；以及该将该目标推送模板融合至该源视频中，以生成融合视频包括：将该匹配推送模板融合至该源视频中，以生成融合视频。

在一些实施例中，响应于确定帧图像中存在至少一个可编辑特征，向终端发送帧图像中所存在的可编辑特征对应的推送模板集合以及标记信息之前，还包括：响应于接收到该终端发送的可编辑特征集合获取请求，向该终端发送可编辑特征集合，其中，该可编辑特征集合中包括一个或多个可编辑特征；接收该终端发送的关于该可编辑特征集合的选择信息，该选择信息用于指示该终端从该一个或多个可编辑特征中选择的至少一个可编辑特征；以及确定帧图像中存在至少一个可编辑特征，包括：根据该选择信息确定该帧图像中存在至少一个可编辑特征。

在一些实施例中，该方法还包括：响应于从该终端接收到推送模板集合更新请求，重新确定该可编辑特征对应的推送模板集合，得到更新推送模板集合；向该终端发送该更新推送模板集合。

在一些实施例中，该方法应用于第一服务器，还包括：向该终端发送该融合视频，以使得该终端向用户展示该融合视频；响应于接收到该终端发送的指向该融合视频的确认消息，该确认消息包括该用户的标识信息；为该融合视频添加该用户的标识信息和与该目标推送模板对应的使用标记。

在一些实施例中，该方法应用于第一服务器，还包括：接收第二服务器发送的至少一个推送模板集合。

在一些实施例中，该方法应用于第一服务器，还包括：向第二服务器发送该融合视频；接收到该第二服务器发送的使用许可信息；向该终端发送该使用许可信息。

在一些实施例中，该方法应用于第二服务器，还包括：向该终端发送该融合视频。

第二方面，本申请实施例提供了一种视频融合方法，应用于终端包括：向第一服务器或第二服务器发送用户选择的源视频；响应于接收到该第一服务器或该第二服务器发送的推送模板集合以及标记信息；其中，该标记信息中至少包括可编辑特征和帧图像信息中的一种；呈现该推送模板集合和该标记信息给该用户；响应于接收到目标推送模板的选择信息，向该第一服务器或该第二服务器发送该目标推送模板的选择信息。

在一些实施例中，该方法还包括：响应于接收到该第一服务器发送的融合视频，并呈现该融合视频给该用户；响应于接收到指向该融合视频的合格信号，获取该用户的标识信息生成确认消息；向该第一服务器发送该确认消息。

在一些实施例中，该方法还包括：响应于接收到该第二服务器发送的融合视频，并呈现该融合视频给用户；响应于接收到指向该融合视频的合格信号，获取该用户的标识信息，为该融合视频添加该用户的标识信息和与该目标推送模板对应的使用标记，生成确认融合视频；发送该确认融合视频至该第一服务器。

在一些实施例中，推送模板集合包括：获取该第一服务器或该第二服务器发送的匹配推送模板集合；以及该呈现该推送模板集合和该标记信息给该用户，包括：呈现该匹配推送模板集合和该标记信息给该用户；以及该目标推送模板的选择信息，包括：根据该推送模板集合得到的匹配推送模板的选择信息。

在一些实施例中，该方法还包括：向该第一服务器或该第二服务器发送获取可编辑特征集合请求；响应于接收到该第一服务器或该第二服务器发送的可编辑特征集合；其中，该可编辑特征集合中包括一个或多个可编辑特征；呈现该可编辑特征集合给该用户；接收到该可编辑特征集合的选择信息；其中，该选择信息用于指示该终端从该一个或多个可编辑特征中选择的至少一个可编辑特征；向该第一服务器或该第二服务器发送该可编辑特征集合的选择信息。

在一些实施例中，该方法还包括：响应于接收到更新推送模板指令，生成推送模板更新请求；向该第一服务器或该第二服务器发送该推送模板更新请求；接收该第一服务器或该第二服务器发送的更新推送模板集合；以及该呈现该推送模板集合和该标记信息给该用户，包括：呈现该更新推送模板集合和该标记信息给该用户。

第三方面，本申请实施例提供了一种视频融合装置，包括：源视频获取单元，被配置成获取终端上传的源视频；源视频检测单元，被配置成检测该源视频的帧图像中是否存在预先确定的可编辑特征；推送模板发送单元，被配置成响应于确定该帧图像中存在至少一个可编辑特征，向该终端发送该帧图像中所存在的可编辑特征对应的推送模板集合以及标记信息，其中，该标记信息中至少包括该可编辑特征和该帧图像中的一种；融合视频生成单元，被配置成响应于从该终端接收到对该推送模板集合中的目标推送模板的选择信息，将该目标推送模板融合至该源视频中，以生成融合视频。

在一些实施例中，融合视频生成单元中进一步被配置成：采用人工智能图像融合技术将该目标推送模板融合至该源视频对应的帧图像中。在一些实施例中，融合该推送模板至该源视频中生成融合视频包括：采用人工智能图像融合技术将该目标推送模板融合至该源视频对应的帧图像中。

在一些实施例中，融合视频生成单元中采用人工智能图像融合技术将推送模板融合至源视频对应的帧图像中的步骤包括：获取该源视频对应的帧图像；采用语义分割神经网络处理该源视频对应的帧图像，确定该源视频对应的帧图像中包括该可编辑特征的图像区域，得到目标融合区域；将该目标推送模板中的内容替换添加至该目标融合区域。

在一些实施例中，该源视频检测单元进一步被配置成：获取不同类型的推送模板集合，根据该推送模板集合的类型确定对应的匹配可编辑特征；检测该源视频的帧图像中是否存在该匹配可编辑特征。

在一些实施例中，该推送模板发送单元进一步被配置成：响应于确定该帧图像中存在至少一个该匹配可编辑特征，得到与该匹配可编辑特征对应的匹配推送模板集合；向该终端发送该匹配推送模板集合。

在一些实施例中，融合视频生成单元中的目标推送模板的选择信息，包括：根据该匹配推送模板集合得到的匹配推送模板的选择信息以及该将该目标推送模板融合至该源视频中，以及融合视频生成单元进一步被配置成：将该匹配推送模板融合至该源视频中，以生成融合视频。

在一些实施例中，还包括可编辑特征发送单元，被配置成响应于接收到该终端发送的可编辑特征集合获取请求，向该终端发送可编辑特征集合，其中，该可编辑特征集合中包括一个或多个可编辑特征；编辑特征选择信息接收单元，被配置成接收该终端发送的关于该可编辑特征集合的选择信息，该选择信息用于指示该终端从该一个或多个可编辑特征中选择的至少一个可编辑特征；以及推送模板发送单元进一步被配置成，根据该选择信息确定该帧图像中存在至少一个可编辑特征。

在一些实施例中，推送模板更新单元，被配置成响应于从该终端接收到推送模板集合更新请求，重新确定该可编辑特征对应的推送模板集合，得到更新推送模板集合；向该终端发送该更新推送模板集合。

在一些实施例中，该装置设置于第一服务器，还包括：第一融合视频发送单元，被配置成向该终端发送该融合视频，以使得该终端向用户展示该融合视频；使用标记添加单元，被配置成响应于接收到该终端发送的指向该融合视频的确认消息，该确认消息包括该用户的标识信息；为该融合视频添加该用户的标识信息和与该目标推送模板对应的使用标记。

在一些实施例中，该装置设置于第一服务器，还包括：推送模板接收单元，被配置成接收第二服务器发送的至少一个推送模板集合。

在一些实施例中，该装置设置于第一服务器，还包括：第一融合视频发送单元进一步被配置成，向第二服务器发送该融合视频；许可信息转发单元，被配置成接收到该第二服务器发送的使用许可信息；向该终端发送该使用许可信息。

在一些实施例中，该装置设置于第二服务器，还包括：第二融合视频发送单元，被配置成向该终端发送该融合视频。

第四方面，本申请实施例提供了一种视频融合装置，设置于终端包括：源视频发送单元，被配置成向第一服务器或第二服务器发送用户选择的源视频；模板获取单元，被配置成响应于接收到该第一服务器或该第二服务器发送的推送模板集合以及标记信息；其中，该标记信息中至少包括可编辑特征和帧图像信息中的一种；模板呈现单元，被配置成呈现该推送模板集合和该标记信息给该用户；选择信息发送单元，被配置成响应于接收到目标推送模板的选择信息，向该第一服务器或该第二服务器发送该目标推送模板的选择信息。

在一些实施例中，该装置还包括：融合视频接收单元，被配置成响应于接收到该第一服务器发送的融合视频，并呈现该融合视频给该用户；确认信息发送单元，被配置成响应于接收到指向该融合视频的合格信号，获取该用户的标识信息生成确认消息；向该第一服务器发送该确认消息。

在一些实施例中，该装置还包括：该融合视频接收单元进一步被配置成，响应于接收到该第二服务器发送的融合视频，并呈现该融合视频给用户；标识信息添加单元，被配置成响应于接收到指向该融合视频的合格信号，获取该用户的标识信息，为该融合视频添加该用户的标识信息和与该目标推送模板对应的使用标记，生成确认融合视频；该融合视频还可以被配置成，发送该确认融合视频至该第一服务器。

在一些实施例中，该模板获取单元进一步被配置成，获取该第一服务器或该第二服务器发送的匹配推送模板集合；该模板呈现单元进一步被配置成，呈现该匹配推送模板集合和该标记信息给该用户；该选择信息发送单元进一步被配置成，向该第一服务器或该第二服务器发送根据该推送模板集合得到的匹配推送模板的选择信息。

在一些实施例中，该装置还包括：编辑特征请求单元，被配置成向该第一服务器或该第二服务器发送获取可编辑特征集合请求；编辑特征接收单元，被配置成响应于接收到该第一服务器或该第二服务器发送的可编辑特征集合；其中，该可编辑特征集合中包括一个或多个可编辑特征；编辑特征呈现单元，被配置成呈现该可编辑特征集合给该用户；接收到该可编辑特征集合的选择信息；其中，该选择信息用于指示该终端从该一个或多个可编辑特征中选择的至少一个可编辑特征；以及编辑特征选择信息接收单元，被配置成向该第一服务器或该第二服务器发送该可编辑特征集合的选择信息。

在一些实施例中，该装置还包括：推送模板更新请求单元，被配置成响应于接收到更新推送模板指令，生成推送模板更新请求；向该第一服务器或该第二服务器发送该推送模板更新请求；以及更新推送模板接收单元，被配置成接收该第一服务器或该第二服务器发送的更新推送模板集合；以及该模板呈现单元进一步被配置成，该呈现该推送模板集合和该标记信息给该用户，包括：呈现该更新推送模板集合和该标记信息给该用户。

第五方面，本申请实施例提供了一种计算机设备，该计算机设备包括：一个或多个处理器；存储装置，其上存储有一个或多个程序；当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如第一方面中任一实现方式描述的方法，或者实现如第二方面中任一实现方式描述的方法。

第六方面，本申请实施例提供了一种计算机可读介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法，或者实现如第二方面中任一实现方式描述的方法。

本申请实施例提供的视频融合方法和设备，获取终端上传的源视频后，检测该源视频的帧图像中是否存在预先确定的可编辑特征，响应于确定帧图像中存在至少一个可编辑特征，向该终端发送帧图像中所存在的可编辑特征对应的推送模板集合以及标记信息，其中，标记信息中至少包括可编辑特征和帧图像中的一种；响应于从该终端接收到对该推送模板集合中的目标推送模板的选择信息，将对应的目标推送模板融合至该源视频中，以生成融合视频。该实施方式可以结合上传用户和其他用户提供的模板信息对源视频进行二次编辑，丰富源视频中的内容，以提升源视频的质量并发掘源视频的更多价值。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请一些实施例可以应用于其中的示例性系统架构；

图2是根据本申请的视频融合方法的第一个实施例的流程图；

图3是根据本申请的视频融合方法的一个实现方式的流程图；

图4是根据本申请的视频融合方法的另一个实现方式的流程图；

图5是根据本申请的视频融合方法的第二个实施例的流程图；

图6是根据本申请的视频融合方法的一个应用场景的流程图；

图7是根据本申请的视频融合方法的另一个应用场景的流程图；

图8是适于用来实现本申请一些实施例的计算机设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的视频融合方法的实施例的示例性系统架构100。

如图1所示，系统架构100中可以包括设备101、102、103、104和网络105。网络105用以在设备101、102、103、104之间提供通信链路的介质。网络105可以包括各种连接类型，例如有线、无线目标通信链路或者光纤电缆等等。

设备101、102、103、104可以是支持网络连接从而提供各种网络服务的硬件设备或软件。当设备为硬件时，其可以是各种电子设备包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机和服务器等等。这时，作为硬件设备，其可以实现成多个设备组成的分布式设备群，也可以实现成单个设备。当设备为软件时，可以安装在上述所列举的电子设备中。这时，作为软件，其可以实现成例如用来提供分布式服务的多个软件或软件模块，也可以实现成单个软件或软件模块。在此不做具体限定。

在实践中，设备可以通过安装相应的客户端应用或服务端应用来提供相应的网络服务。设备在安装了客户端应用之后，其可以在网络通信中体现为客户端。相应地，在安装了服务端应用之后，其可以在网络通信中体现为服务端。

作为示例，在图1中，设备101、102体现为终端，设备103体现为第一服务器，而设备104体现为第二服务器。具体地，设备101、102可以是安装有视频应用的客户端，设备103可以是为视频应用提供服务的后台服务端，104可以是为视频应用提供服务的后台服务端也可以为支持有模板上传的客户端。

需要说明的是，本申请实施例所提供的视频融合方法可以由设备101、102、103、104执行。

应该理解，图1中的网络和设备的数目仅仅是示意性的。根据实现需要，可以具有任意数目的网络和设备。

继续参考图2，其示出了根据本申请的视频融合方法的第一个实施例的流程200。应用于第一服务器或第二服务器，该视频融合方法可以包括以下步骤：

步骤201，获取终端上传的源视频。

在本实施例中，终端(例如图1所示的设备101、102)可以向第一服务器(例如图1所示的服务器104)、第二服务器(例如图1所示的服务器103)发送源视频。

实践中，第一服务器虽然可以为用户安装了视频应用的终端设备，但第一服务器通常指的是提供视频播放服务的视频播放平台侧所使用的服务器，第二服务器通常指的是模板提供方所使用的可用于实现本申请视频融合方法的设备或模板提供方所使用的用于上传推送模板的设备，终端通常表现为安装了视频应用的用户终端设备。视频的制作用户在社交应用上注册有视频账号。

通常，由终端上传的源视频是为了通过第一服务器向其他用户进行播放的源视频，源视频中包含有各种各样的用户创作的内容，不限于用户是针对现实生活中的内容进行拍摄的，还是使用工具合成的动画类视频，用户也可以根据拍摄的内容进行二次加工生成上述源视频，对此本申请不做限定。

步骤202，检测源视频的帧图像中是否存在预先确定的可编辑特征。

在本实施例中，在获取到终端上传的源视频后，例如第一服务器或第二服务器的用于执行视频融合方法的执行主体(简称融合执行主体)，开始对源视频的图像中的帧图像进行提取，在提取过程中，可以对源视频中的所有帧图像进行提取，也可以按照一定的规则进行提取。

示例性的，在融合执行主体对源视频中的帧图像进行提取时，对源视频中的帧图像检测，确定带有可编辑标记的帧图像的范围，并对该范围内的帧图像进行检测。

其中，可编辑标记，可以由用户在制作源视频时进行添加，也可以在上传过程中对源视频进行标记，或者未融合执行主体发送各种形式的备注，例如在文件代码中进行标记或者发送单独的识别字段，用户通过添加可编辑标记，实现对允许融合执行主体进行提取的帧图像的范围进行设置，以标记用户希望和/或不希望被扩展的帧图像的范围，更加贴近用户的需求。

在确定源视频的可编辑帧图像的范围后，对其中的内容进行检测，检测帧图像中是否存在预先确定的可编辑特征。

其中，可编辑特征包括但不限于文本、图像、动画、声音、视频及其组合，在融合执行主体检测到该可编辑特征时，可以确定该帧图像可编辑，为该帧图像中插入其他的文字、图像、动画、声音等内容。可编辑特征，由融合执行主体预先进行确定，以便于可以根据识别特征对应的内容对源视频的帧图像进行筛选，确定可用于编辑的帧图像。

应当理解的是，确定可编辑的特征时，通常基于推送模板、推送模板的集合来确定。在确定过程中，可以在融合执行主体预先确定了常见模板类型后，再确定基础的可编辑特征，并为这些可编辑特征添加对应的模板信息。也可以在获取到一定的推送模板或者获取到模板集合的类别信息后，根据推送模板或者类别信息生成对应的可编辑特征，以便于这些可编辑特征与推送模板或者推送模板集合之间存在对应的查找关系。

在一些实施例中，可编辑特征的确定方式包括：获取不同类型的推送模板集合，根据推送模板集合的类型确定对应的匹配可编辑特征。

具体的，预先获取不同类型的推送模板集合，基于推送模板集合的类型来确定不同的可匹配特征，模板类型可以与推送模板的内容有关，也可以与推送模板即将插入、替换的内容有关，也可以与推送模板的作用有关，例如在确定推送模板集合可以分为碳酸饮料分为、果汁饮料分类、功能性饮料分类等时，可以确定可编辑特征为视频帧中的饮料瓶图像或者文字标记的“饮料”，通过这种方式，可以根据预先获取到的推送模板集合，即希望扩展的视频内容的具体信息来确定合适的可编辑特征，在确定存在这些特征时进行内容扩充、替换，不仅提高了扩充、替换内容的相关性和质量，还提高了编辑的效率。

步骤203，响应于确定该帧图像中存在至少一个可编辑特征，向该终端发送该帧图像中所存在的可编辑特征对应的推送模板集合以及标记信息。

在本实施例中，在确定检测到上述步骤202中确定的可编辑特征后，根据该可编辑特征确定对应的推送模板集合和标记信息，然后将这些信息发送给用户用于上传源视频的终端，以便于使用该终端的用户根据推送模板集合和标记信息来确定希望使用的推送模板，以便于将该推送模板融合至源视频中，生成融合视频。

其中，在为终端发送可编辑特征的推送模板集合时，发送对应的标记信息，以方便用户了解可编辑特征存在的视频帧的位置及内容或者了解期望添加的内容是针对何种内容进行扩充的，因此，可以理解，标记信息中至少会包括可编辑特征和帧图像信息中至少一种，以实现上述目的。

步骤204，响应于从该终端接收到对该推送模板集合中的目标推送模板的选择信息，将该目标推送模板融合至该源视频中，以生成融合视频。

在本实施例中，融合执行主体在接收到终端基于上述步骤203中发送的目标推送模板集合返回的选择信息后，根据该选择信息中的内容确定用于融合至源视频中的目标推送模板，并将该目标模板融合至源视频中。

在一些实施例中，该视频融合方法还包括：响应于从终端接收到推送模板集合更新请求，重新确定该可编辑特征对应的推送模板集合，得到更新推送模板集合；向该终端发送该更新推送模板集合。

具体的，在融合执行主体接收到推送模板集合更新请求时，响应该请求，重新生成推送模板集合，并将该推送模板集合发送至终端，在用户不满足于当前推送模板集合中内容的时候，对推送模板集合进行更新，以便于终端根据该更新推送模板集合选取合适的推送模板，扩充用户可选择的推送模板的内容。

应当理解的是，根据不同形式的推送模板可以确定不同的融合方式，例如当推送模板是图像形式的时候，可以采用例如人工智能融合、贴图或像素替换等方式进行图像融合。

在一些实施例中，融合推送模板至源视频中生成融合视频包括：采用人工智能图像融合技术将该目标推送模板融合至该源视频对应的帧图像中。

具体的，人工智能图像融合技术(Artificial Intelligence，简称AI)，指的是通过图片语义软分割的深度学习算法实现语义分割，旨在精确表示图像不同区域间的软过渡，类似与磁力套索(magnetic lasso)和魔术棒(magic wand)的功能，因人工智能方式可以实现自动对图像中的特征、内容进行提取，并根据图像深层次的特征进行融合，提供了一种高效率、高质量的图像融合的方式，以节约人力成本。

在一些实施例中，采用人工智能图像融合技术将该目标推送模板融合至该源视频对应的帧图像中的步骤包括：获取该源视频对应的帧图像；采用语义分割神经网络处理该源视频对应的帧图像，确定该源视频对应的帧图像中包括该可编辑特征的图像区域，得到目标融合区域；将该目标推送模板中的内容替换添加至该目标融合区域。

具体的，参考图3，其中示出了一种采用人工智能图像融合技术将推送模板融合至源视频对应的图像中的一个实现方式的流程300，具体包括：

步骤301，获取源视频对应的帧图像。

步骤302，采用语义分割神经网络处理该源视频对应的帧图像，确定该源视频对应的帧图像中包括该可编辑特征的图像区域，得到目标融合区域。

具体的，语义分割神经网络通畅指的基于图像中像素点的类分情况实现对图像中不同内容进行区分的图卷积神经网络，例如全卷积神经网络(Fully convolutional networks，简称FCN)、U-net语义神经分割网络和SegNet卷积神经网络等。

通常语义软分割的的神经网络中首先构建低层次的仿射关系项，以表示基于颜色的像素间较大范围的关联性特征.，然后通过构建高层语义仿射关系项，以使得属于同一场景物体的像素尽可能的接近，不同场景物体的像素间的关系远离，再通过对Laplacian矩阵进行特征分解，提取特征向量，并对特征向量进行两步稀疏处理，来创建图像层，最后基于根据特征向量来实现图像分割，确定可编辑特征的图像区域，即确定目标融合区域。

步骤303，将该目标推送模板中的内容替换添加至该目标融合区域。

具体的，提取该目标推送模板中的内容后，可以基于特征对齐、尺寸对齐等方式，将该目标推送模板中的内容与目标融合区域中的内容进行替换，以实现将目标推送模板中的内容替换添加至目标融合区域的目的。

在本实现方式中，通过语义分割神经网络实现从谱分割角度来解决模块划分问题，并且考虑了图片的纹理和颜色特征，使用图结构由深度神经网络生成的更高层的语义信息实现对推送模板中的内容进行提取，并将提取到的内容对应添加至源视频的帧图像中，以提升融合视频中推送模板与帧图像的融合效果。

本申请实施例提供的视频融合方法，获取终端上传的源视频后，检测该源视频的帧图像中是否存在预先确定的可编辑特征，响应于确定帧图像中存在至少一个可编辑特征，向该终端发送帧图像中所存在的可编辑特征对应的推送模板集合以及标记信息，其中，标记信息中至少包括可编辑特征和帧图像中的一种；响应于从该终端接收到对该推送模板集合中的目标推送模板的选择信息，将对应的目标推送模板融合至该源视频中，以生成融合视频。该实施方式可以结合上传用户和其他用户提供的模板信息对源视频进行二次编辑，丰富源视频中的内容，以提升源视频的质量并发掘源视频的更多价值。

具体的，为了更好的说明匹配可编辑特征的确定方式以及后续根据该匹配可编辑特征确定推送模板的流程，继续参考图4，其示出了根据本申请的视频融合方法一种实现方式的流程400，具体包括以下步骤：

步骤401，获取不同类型的推送模板集合，根据推送模板集合的类型确定对应的匹配可编辑特征。

具体的，融合执行主体可以从本地或者非本地的设备预先获取多个推送模板，并对这些推送模板进行分类，确定不同类型的推送模板集合，然后根据确定的推送模板集合的类型不同选取合适的可编辑特征进行对应，例如获取的推送模板分别为不同品牌、型号的手机，则可以确定推送模板集合的类型为手机类型，自动匹配手机图像作为对应的可编辑特征，并确定该匹配可编辑特征，基于推送模板来确定匹配可编辑特征，以保证确定到的匹配可编辑特征都有足够的匹配推送模板来对应，提升可编辑特征的质量。

在一些实施例中，在融合执行主体为第一服务器时，可以从第二服务器处接收推送模板集合，以便于了解第二服务器的使用用户的具体需求，以提升获取到的推送模板集合的质量。

步骤402，检测源视频的帧图像中是否存在该匹配可编辑特征。

具体的，可以根据图像相似度算法或者深度学习的方式，对获取到的源视频的帧图像进行检测，检测帧图像中是否与可编辑特征相同或相近似的图像内容，在帧图像中存在与可编辑特征相同或相近似的图像内容时，认为该帧图像中存在可编辑特征，即后续可以根据该可编辑特征选取对应的推送模板对该帧图像进行编辑，对存在可编辑特征的帧进行提取，或者根据帧序列中存在可编辑特征的帧图像的序号进行标记、记录，以便于后续可以查找到存在可编辑特征的帧图像。

步骤403，响应于确定该帧图像中存在至少一个该匹配可编辑特征，得到与该匹配可编辑特征对应的匹配推送模板集合。

具体的，在检测到帧图像中存在至少一个匹配可编辑特征时，基于检测到的匹配可编辑特征确定对应的匹配推送模板集合，例如在检测到帧图像中存在手机图像时，确定手机类型待推送模板集合作为匹配推送模板集合，因匹配可编辑特征具有明确的匹配推送模板集合，通过匹配可编辑特征可以快速的确定对应的匹配推送集合，以提升推送模板的确认效率。

步骤404，向终端发送该匹配推送模板集合。

步骤405，响应于从终端接收到对匹配推送模板集合中的匹配推送模板的选择信息，将该匹配推送模板融合至源视频中，以生成融合视频。

通过该实现方式，可以看出在融合执行主体获取到推送模板后，根据获取到的推送模板的类型和内容来确定推送模板集合，在确定推送模板集合后，基于推送模板的类型信息确定匹配可编辑特征，即由融合执行主体主动进行匹配的可编辑特征，后续在对源视频的帧图像进行检测时，根据可编辑特征进行匹配，实现自动对源视频进行检测、发送推送模板集合的功能，以根据推送模板集合确定对应的可编辑特征，在提高可编辑特征确定效率的同时，也便于用户根据融合执行主体的匹配结果选取合适的扩展内容。

在一些实施例中，在融合执行主体为上述第一服务器时，该视频融合方法还包括：向该终端发送该融合视频，以使得该终端向用户展示该融合视频；响应于接收到该终端发送的指向该融合视频的确认消息，该确认消息包括该用户的标识信息；为该融合视频添加该用户的标识信息和与该目标推送模板对应的使用标记。

具体的，在融合执行主体为上述第一服务器时，向终端发送融合视频进行确认，在融合执行主体接收到终端发送的指向该融合视频的包括该用户的标识信息的确认消息后，可认为用户同意使用该融合视频，则为该融合视频添该用户的标识信息和目标推送模板的使用标记，可以在为用户呈现融合效果的技术上，更多的考虑用户的制作意见，并且后续可以根据目标推送模板的使用标记来确定使用的模板，了解融合视频的生成情况。

在一些实施例中，在融合执行主体为上述第一服务器时，该视频融合方法还包括：向第二服务器发送该融合视频；接收到该第二服务器发送的使用许可信息；向该终端发送该使用许可信息。

具体的，在融合执行主体为上述第一服务器时，同样可以向第二服务器发送该融合视频，在接收到第二服务器发送的使用许可信息时，则可认为第二服务器的使用用户允许使用该融合视频，即确认基于目标推送模板生成的融合视频中的内容可以满足第二服务器的使用用户的需求，然后将该许可信息发送给上传源视频的终端，以实现使用终端的用户和使用第二服务器的用户之间的信息互通，以便平衡双方需求，提升融合视频的质量。

在一些实施例中，在融合执行主体为上述第二服务器时，还包括：向该终端发送该融合视频。

具体的，在融合执行主体为上述第二服务器时，在生成融合视频后，向终端发送该融合视频，以便于后续在终端的用户认为生成的融合视频可以满足要求时，直接使用该融合视频，避免因融合视频反复传输造成的资源浪费。

在一些实施例中，在响应于确定该帧图像中存在至少一个可编辑特征，向该终端发送该帧图像中所存在的可编辑特征对应的推送模板集合以及标记信息之前，还包括：响应于接收到该终端发送的可编辑特征集合获取请求，向该终端发送可编辑特征集合，其中，该可编辑特征集合中包括一个或多个可编辑特征；接收该终端发送的关于该可编辑特征集合的选择信息，该选择信息用于指示该终端从该一个或多个可编辑特征中选择的至少一个可编辑特征；以及该确定该帧图像中存在至少一个可编辑特征，包括：根据该选择信息确定该帧图像中存在至少一个可编辑特征。

具体的，在向终端发送推送模板和标记信息之前，接收到终端发送的可编辑特征集合获取请求，向该终端发送包括一个或者多个可编辑特征的可编辑特征集合，然后接收到终端发送的基于该可编辑特征集合确定的选择信息，从该选择信息中读取使用终端的用户指定的可编辑特征，然后根据该用户指定的可编辑特征后续确定推送模板集合，通过预先为用户呈现可编辑特征的方式，实现用户可以根据自身需求选取合适的可编辑特征，并得到对应的推送模板集合，以更好的满足用户的使用需求。

继续参考图5，其示出了根据本申请的视频融合方法的第二个实施例的流程500。应用于终端，该视频融合方法可以包括以下步骤：

步骤501，向第一服务器或第二服务器发送源视频。

在本实施例中，终端(例如图1所示的设备101、102)可以向第一服务器(例如图1所示的服务器103)或第二服务器(例如图1所示的服务器104)发送源视频。

实践中，第一服务器或第二服务器虽然可以为用户安装了视频应用的终端设备，但通常表现为视频应用的后台服务器，终端通对应的，通常表现为安装了视频应用的用户终端设备。视频的制作用户在社交应用上注册有视频账号。

通常，由终端上传的源视频是为了通过服务器向其他用户进行播放的源视频，源视频中包含有各种各样的用户创作的内容，不限于用户是针对现实生活中的内容进行拍摄的，还是使用工具合成的动画类视频，用户也可以根据拍摄的内容进行二次加工生成上述源视频，对此本申请不做限定。

其中，用户使用用于终端的视频融合方法的执行主体(简称用户执行主体)，向第一服务器或第二服务器发送源视频，源视频中包含有各种各样的用户创作的内容，不限于用户是针对现实生活中的内容进行拍摄的，还是使用工具合成的动画类视频，用户也可以根据拍摄的内容进行二次加工生成上述源视频，对此本申请不做限定。

其中，该用户还可以在发送的源视频中添加可编辑标记，例如在用户在制作源视频时添加可编辑标记，或在上传过程中对源视频进行标记，或者未融合执行主体发送各种形式的备注，例如在文件代码中进行标记或者发送单独的识别字段，用户通过添加可编辑标记，实现对允许融合执行主体进行提取的帧图像的范围进行设置，以标记用户希望和/或不希望被扩展的帧图像的范围，更加贴近用户的需求。

步骤502，响应于接收到第一服务器或第二服务器发送的推送模板集合以及标记信息。

在本实施例中，推送模板集合中有一个或者多个推送模板，标记信息中至少包括可编辑特征和帧图像信息中的一种，推送模板可在存在可编辑特征的帧图像中，对可编辑特征进行替换的内容。

步骤503，呈现推送模板集合和标记信息给用户。

在本实施例中，用户执行主体在获取到推送模板集合和标记信息后，可通过本地的显示设备将推送模板集合和标记信息呈现给用户，以便于用户根据标记信息确定可编辑特征和/或帧图像信息和显示出的推送模板集合中的推送，确定期望选用的推送模板。

步骤504，响应于接收到目标推送模板的选择信息，向第一服务器或第二服务器发送目标推送模板的选择信息。

在本实施例中，在用户确定了期望选用的推送模板后，会对用户执行主体进行指示，以电信号等形式告知用户执行主体用户选择的推送模板，即确定了目标推送模板的选择信息，因此，用户执行主体接收到该信号后，确定了用户选择的目标推送模板的选择信息，向发送该推送模板集合的第一服务器或第二服务器发送目标推送模板的选择信息。

其中，选择信息中还可以包括用户期望添加推送模板的帧数，以便于融合执行主体更好的了解用户的期望，并根据该期望添加推送模板中的内容。

本申请实施例提供的视频融合方法，在向第一服务器或第二服务器发送用户选择的源视频后，响应于接收到该第一服务器或该第二服务器发送的推送模板集合以及标记信息；其中，该标记信息中至少包括可编辑特征和帧图像信息中的一种；呈现该推送模板集合和该标记信息给该用户，响应于接收到目标推送模板的选择信息，向该第一服务器或该第二服务器发送该目标推送模板的选择信息。该实施方式可以通过第一服务器或者第二服务器实现对源视频内容的二次编辑，丰富源视频中的内容，以提升源视频的质量并发掘源视频的更多价值。

具体的，在接收到第一服务器发送的融合视频后，将该融合视频呈现给用户，以便于向用户反馈将目标推送模板融合进源视频后，生成的融合视频，如用户同意使用该融合视频则向用户执行主体发出指示可使用该融合视频的合格信号，在此之后用户执行主体会根据用户的标识信息生成对应的确认信息，发送给第一服务器，以便于第一服务器根据该确认信息了解可使用该融合视频，并根据其中的用户标识对融合视频进行标记，以便于建立融合视频和用户之间的联系，后续可根据该融合视频为其他用户提供源视频上传的用户信息，在保护用户著作权的同时，发掘更多潜在价值。

在一些实施例中，该方法还包括：响应于接收到该第二服务器发送的融合视频，并呈现该融合视频给该用户；响应于接收到指向该融合视频的合格信号，获取该用户的标识信息，为该融合视频添加该用户的标识信息和与该目标推送模板对应的使用标记，生成确认融合视频；发送该确认融合视频至该第一服务器。

具体的，在接收到第二服务器发送的融合视频后，将该融合视频呈现给用户，以便于向用户反馈将目标推送模板融合至源视频后，生成的融合视频，如用户同意使用该融合视频则向用户执行主体发出指示可使用该融合视频的合格信号，在此之后用户执行主体会根据用户的标识信息生成对应的确认信息，直接添加至融合视频中，然后将该融合视频发送给第一服务器进行展示，在上述实现方式中以便于第一服务器根据该确认信息了解可使用该融合视频，并根据其中的用户标识对融合视频进行标记，以便于建立融合视频和用户之间的联系，后续可根据该融合视频为其他用户提供源视频上传的用户信息，在保护用户著作权的同时，发掘更多潜在价值的基础上，还减少了将融合视频重复发送至第二服务器中再进行上传的过程，节约了传输资源。

应当理解的是，因可能同时接收到多个可编辑特征及他们对应的推送模板集合，选择信息中可能存在选择有多个推送模板。

在一些实施例中，获取该推送模板选择请求中的推送模板集合包括：获取该第一服务器或第二服务器发送的匹配推送模板集合。

具体的，该匹配推送模板集合的确定方式及后续根据该匹配推送模板集合得到匹配推送模板的选择信息的方式与上述图4中所示的实现方式相似，重复内容不再赘述，因匹配推送模板集合是基于推送模板集合分类信息得到的可编辑特征得到的，通过发送匹配推送模板集合的方式可以提升推送模板集合的质量，以及提升用户确定目标推送模板(匹配推送模板)的效率。

在一些实施例中，获取基于该推送模板集合选择的推送模板，得到对应的推送模板的选择信息，向第一服务器或第二服务器发送该选择信息包括：响应于接收到获取可编辑特征集合指令，向该第一服务器或第二服务器发送获取可编辑特征集合请求；其中，该可编辑特征集合中包括至少一个可编辑特征；响应于接收到该第一服务器或第二服务器发送的可编辑特征集合，得到该用户基于该可编辑特征确定的自选推送模板；向该第一服务器或第二服务器发送该自选推送模板。

在一些实施例中，该方法还包括：向该第一服务器或该第二服务器发送获取可编辑特征集合请求；响应于接收到该第一服务器或该第二服务器发送的可编辑特征集合；其中，该可编辑特征集合中包括一个或多个可编辑特征；接收到该可编辑特征集合的选择信息；其中，该选择信息用于指示该终端从该一个或多个可编辑特征中选择的至少一个可编辑特征；呈现该可编辑特征集合给该用户；向该第一服务器或该第二服务器发送该可编辑特征集合的选择信息。

具体的，还可以在用户执行主体接收到源视频上传用户的获取可编辑特征的指示后，向具体接收到该源视频的第一服务器或第二服务器发送获取可编辑特征集合请求，然后接收到基于该请求由该第一服务器或该第二服务器返回的可编辑特征集合，该可编辑特征集合中包括一个或多个可编辑特征；然后将该可编辑特征集合呈现给用户，在用户确定可编辑特征后，向用户执行主体发送可编辑特征集合的选择信息，选择信息用于指示该终端从该一个或多个可编辑特征中选择的至少一个可编辑特征，确定用户执行主体响应于收到该选择信息，向具体接收到该源视频的第一服务器或第二服务器发送该可编辑特征集合的选择信息，以便于第一服务器或第二服务器后续根据该可编辑特征集合的选择信息确定对应的推送模板集合，以实现为用户提供可编辑特征后，根据用户对于可编辑特征的内容发送对应的推送模板集合，贴合用户的实际需求，以提升目标推送模板的确定效率和确定到的目标推送模板的质量。

在一些实施例中，还包括：响应于接收到更新推送模板指令，生成推送模板更新请求；向该第一服务器或第二服务器发送该推送模板更新请求。

具体的，在第二执行主体接收到第一服务器或第二服务器发送的推送模板集合后，若该推送模板集合中的推送模板内容无法满足用户的需求，则用户可以向第二执行主体发出推送模板更新指令，在第二执行主体接收到该推送模板更新指令后，可以基于该指令生成模板更新请求，并发送给第一服务器或第二服务器以获取新的推送模板集合，更好的服务于用户，通过推送模板集合进行更新的方式，更好的满足用户的需求，以提高得到的目标推送模板的质量。

为了便于理解，下面提供视频融合方法的一个应用场景。在该应用场景下，智能移动终端D1为用户上传源视频的终端，其中可以安装有视频应用，服务器S1为体现为视频应用的后台服务器的第一服务器，服务器S2为体现为推送提供侧的第二服务器，用户U1利用智能移动终端D1上传源视频A1至服务器S1。

具体地，参见图6所示，服务器S1预先从服务器S2处获取了推送模板结合B、C，以及本地保存的推送模板E。

用户U1利用智能移动终端D1的向服务器S1上传源视频A1，服务器S1对该源视频A1进行解析后确定其中第30-35帧和第40-45帧中存在可编辑特征A11、A12，生成对应的标记信息，将根据A11、A12确定的推送模板集合B、C和该标记信息一起发送至智能移动终端D1给用户U1进行选择。

智能移动终端D1，即用户U1接收到该信息后，允许使用A11对应的推送模板集合中的推送模板B11对第30-35帧的图像帧进行编辑，不允许使用推送模板集合C中的推送模板对A12进行编辑，然后用户U1使用智能移动终端D1将该选择信息给服务器S1，并向服务器S1发出更新推送模板请求，以得到针对编辑特征A12的更新推送模板集合E。

用户U1接收到该推送更新推送模板集合E后，允许使用更新推送模板集合E中的E11对第40-45帧的图像帧进行编辑，并使用智能移动终端D1将该选择信息发送给服务器S1。

服务器S1，在采用语义分割神经网络对第30-35帧和第40-45帧图像进行处理，确定图像中的目标融合区域，然后分别将模板B11融入第30-35帧图像，模板E11融入第40-45帧图像，并生成融合视频R1。

服务器S1将该融合视频R1发送至智能移动终端D1后，智能移动终端D1将该融合视频R1展示给用户U1，用户U1对该融合视频进行确认，允许使用该融合视频R1，则使用移动终端智能移动终端D1向服务器发送包含用户U1的标识信息的确认信息。

服务器S1在接收到移动终端智能移动终端D1发送的确认信息，在该融合视频R1中添加使用的模板B11和E11对应的使用标记，并发送给服务器S2进行确认。

接收到服务器S2发送的许可使用信息，最终完成视频融合工作，并将生成的融合视频R1保存至本地。

为了便于理解，下面提供视频融合方法的另一个应用场景。在该应用场景下，智能移动终端D2为用户U2上传源视频的终端，其中可以安装有视频应用。服务器S1为体现为视频应用后台的第一服务器，服务器S2为体现为模板提供侧的第二服务器。用户U2利用智能移动终端D2上传源视频A2至服务器S2。

具体地，参见图7所示，用户U1利用智能移动终端D2的向服务器S2上传源视频A2，服务器S2对该源视频A2进行解析后确定其中第10-15帧存在可编辑特征A21，生成对应的标记信息，将根据A21确定的推送模板集合F和该标记信息一起发送至智能移动终端D2给用户U2进行选择。

智能移动终端D2，即用户U2接收到该信息后，允许使用A21对应的推送模板集合中的推送模板F11对第10-15帧的图像帧进行编辑，并使用D2将该选择信息发送给服务器S2。

服务器S2，在采用语义分割神经网络对第10-15帧图像进行处理，确定图像中的目标融合区域，推送模板F11融入第10-15帧图像，并生成融合视频R2。

服务器S2将该融合视频R2发送至智能移动终端D2后，智能移动终端D2将该融合视频R2展示给用户U2，用户U2对该融合视频进行确认，允许使用该融合视频，则智能移动终端D2获取用户U2的标识信息后，为融合视频R2添加用户U2的标识信息和使用的推送模板F11的使用标记，并发送添加了添加用户U2的标识信息和使用的推送模板F11的使用标记的融合视频R2至服务器S1，以保存至服务器S1本地。

下面参考图8，其示出了适于用来实现本申请实施例的计算机设备(例如图1所示的设备101、102、103、104)的计算机系统800的结构示意图。图8示出的计算机设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图8所示，计算机系统800包括中央处理单元(CPU)801，其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中，还存储有系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

以下部件连接至I/O接口805：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分805；包括硬盘等的存储部分807；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便于从其上读出的计算机程序根据需要被安装入存储部分807。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分809从网络上被下载和安装，和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时，执行本申请的方法中限定的上述功能。

需要说明的是，本申请该的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码，该程序设计语言包括面向目标的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或电子设备上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这根据所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以采用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括源视频获取单元、源视频检测单元、推送模板发送单元和融合视频生成单元。其中，这些单元的名称在种情况下并不构成对该单元本身的限定，例如，源视频获取单元还可以被描述为“获取终端上传的源视频”。又例如，可以描述为：一种处理器包括源视频发送单元、模板获取单元、模板呈现单元和选择信息发送单元。其中，这些单元的名称在种情况下并不构成对该单元本身的限定，例如，源视频发送单元还可以被描述为“向第一服务器或第二服务器发送用户选择的源视频”。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的计算机设备中所包含的；也可以是单独存在，而未装配入该计算机设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该计算机设备执行时，使得该计算机设备：获取终端上传的源视频后，检测该源视频的帧图像中是否存在预先确定的可编辑特征，响应于确定帧图像中存在至少一个可编辑特征，向该终端发送帧图像中所存在的可编辑特征对应的推送模板集合以及标记信息，其中，标记信息中至少包括可编辑特征和帧图像中的一种；响应于从该终端接收到对该推送模板集合中的目标推送模板的选择信息，将对应的目标推送模板融合至该源视频中，以生成融合视频。以及在向第一服务器或第二服务器发送用户选择的源视频后，响应于接收到该第一服务器或该第二服务器发送的推送模板集合以及标记信息；其中，该标记信息中至少包括可编辑特征和帧图像信息中的一种；呈现该推送模板集合和该标记信息给该用户，响应于接收到目标推送模板的选择信息，向该第一服务器或该第二服务器发送该目标推送模板的选择信息。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

一种视频融合方法，包括：

获取终端上传的源视频；

检测所述源视频的帧图像中是否存在预先确定的可编辑特征；

响应于确定所述帧图像中存在至少一个可编辑特征，向所述终端发送所述帧图像中所存在的可编辑特征对应的推送模板集合以及标记信息，其中，所述标记信息中至少包括所述可编辑特征和所述帧图像中的一种；

响应于从所述终端接收到对所述推送模板集合中的目标推送模板的选择信息，将所述目标推送模板融合至所述源视频中，以生成融合视频。
根据权利要求1中所述的方法，其中，所述将所述推送模板融合至所述源视频中，以生成融合视频，包括：

采用人工智能图像融合技术将所述目标推送模板融合至所述源视频对应的帧图像中。
根据权利要求2所述的方法，所述采用人工智能图像融合技术将所述目标推送模板融合至所述源视频对应的帧图像中的步骤包括：

获取所述源视频对应的帧图像；

采用语义分割神经网络处理所述源视频对应的帧图像，确定所述源视频对应的帧图像中包括所述可编辑特征的图像区域，得到目标融合区域；

将所述目标推送模板中的内容替换添加至所述目标融合区域。
根据权利要求1中所述的方法，其中，所述检测所述源视频的帧图像中是否存在预先确定的可编辑特征包括：

获取不同类型的推送模板集合，根据所述推送模板集合的类型确定对应的匹配可编辑特征；

检测所述源视频的帧图像中是否存在所述匹配可编辑特征。
根据权利要求4中所述的方法，其中，所述响应于确定所述帧图像中存在至少一个可编辑特征，向所述终端发送所述帧图像中所存在的可编辑特征对应的推送模板集合，包括：

响应于确定所述帧图像中存在至少一个所述匹配可编辑特征，得到与所述匹配可编辑特征对应的匹配推送模板集合；

向所述终端发送所述匹配推送模板集合。
根据权利要求5中所述的方法，其中，所述目标推送模板的选择信息，包括：

根据所述匹配推送模板集合得到的匹配推送模板的选择信息；以及

所述将所述目标推送模板融合至所述源视频中，以生成融合视频包括：

将所述匹配推送模板融合至所述源视频中，以生成融合视频。
根据权利要求1中所述的方法，所述响应于确定所述帧图像中存在至少一个可编辑特征，向所述终端发送所述帧图像中所存在的可编辑特征对应的推送模板集合以及标记信息之前，还包括：

响应于接收到所述终端发送的可编辑特征集合获取请求，向所述终端发送可编辑特征集合，其中，所述可编辑特征集合中包括一个或多个可编辑特征；接收所述终端发送的关于所述可编辑特征集合的选择信息，所述选择信息用于指示所述终端从所述一个或多个可编辑特征中选择的至少一个可编辑特征；以及

所述确定所述帧图像中存在至少一个可编辑特征，包括：

根据所述选择信息确定所述帧图像中存在至少一个可编辑特征。
根据权利要求1所述的方法，还包括：

响应于从所述终端接收到推送模板集合更新请求，重新确定所述可编辑特征对应的推送模板集合，得到更新推送模板集合；

向所述终端发送所述更新推送模板集合。
根据权利要求1至8中任一项所述的方法，所述方法应用于第一服务器，还包括：

向所述终端发送所述融合视频，以使得所述终端向用户展示所述融合视频；

响应于接收到所述终端发送的指向所述融合视频的确认消息，所述确认消息包括所述用户的标识信息；

为所述融合视频添加所述用户的标识信息和与所述目标推送模板对应的使用标记。
根据权利要求9所述的方法，还包括：

接收第二服务器发送的至少一个推送模板集合。
根据权利要求9或10所述的方法，还包括：

向第二服务器发送所述融合视频；

接收到所述第二服务器发送的使用许可信息；

向所述终端发送所述使用许可信息。
根据权利要求1至8中任一项所述的方法，所述方法应用于第二服务器时，还包括：

向所述终端发送所述融合视频。
一种视频融合方法，应用于终端，包括：

向第一服务器或第二服务器发送用户选择的源视频；

响应于接收到所述第一服务器或所述第二服务器发送的推送模板集合以及标记信息；其中，所述标记信息中至少包括可编辑特征和帧图像信息中的一种；

呈现所述推送模板集合和所述标记信息给所述用户；

响应于接收到目标推送模板的选择信息，向所述第一服务器或所述第二服务器发送所述目标推送模板的选择信息。
根据权利要求13的所述方法，还包括：

响应于接收到所述第一服务器发送的融合视频，并呈现所述融合视频给所述用户；

响应于接收到指向所述融合视频的合格信号，获取所述用户的标识信息生成确认消息；

向所述第一服务器发送所述确认消息。
根据权利要求13所述的方法，还包括：

响应于接收到所述第二服务器发送的融合视频，并呈现所述融合视频给用户；

响应于接收到指向所述融合视频的合格信号，获取所述用户的标识信息，为所述融合视频添加所述用户的标识信息和与所述目标推送模板对应的使用标记，生成确认融合视频；发送所述确认融合视频至所述第一服务器。
根据权利要求13所述的方法，其中，所述推送模板集合包括：

获取所述第一服务器或所述第二服务器发送的匹配推送模板集合；以及

所述呈现所述推送模板集合和所述标记信息给所述用户，包括：

呈现所述匹配推送模板集合和所述标记信息给所述用户；以及

所述目标推送模板的选择信息，包括：

根据所述推送模板集合得到的匹配推送模板的选择信息。
根据权利要求13所述的方法，其中，还包括：

向所述第一服务器或所述第二服务器发送获取可编辑特征集合请求；

响应于接收到所述第一服务器或所述第二服务器发送的可编辑特征集合；其中，所述可编辑特征集合中包括一个或多个可编辑特征；

呈现所述可编辑特征集合给所述用户；

接收到所述可编辑特征集合的选择信息；其中，所述选择信息用于指示所述终端从所述一个或多个可编辑特征中选择的至少一个可编辑特征；

向所述第一服务器或所述第二服务器发送所述可编辑特征集合的选择信息。
根据权利要求13所述的方法，还包括：

响应于接收到更新推送模板指令，生成推送模板更新请求；

向所述第一服务器或所述第二服务器发送所述推送模板更新请求；

接收所述第一服务器或所述第二服务器发送的更新推送模板集合；

以及

所述呈现所述推送模板集合和所述标记信息给所述用户，包括：

呈现所述更新推送模板集合和所述标记信息给所述用户。
一种计算机设备包括：

一个或多个处理器；

存储装置，其上存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-12中任一所述的方法，或者实现如权利要求13-18中任一所述的方法。
一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-12中任一所述的方法，或者实现如权利要求13-18中任一所述的方法。