CN112312189A

CN112312189A - 一种视频生成方法及视频生成系统

Info

Publication number: CN112312189A
Application number: CN201910713181.5A
Authority: CN
Inventors: 李�一; 杨羿; 王建国; 王璐; 陈晓冬; 郭佳骋; 刘林; 朱延峰
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-08-02
Filing date: 2019-08-02
Publication date: 2021-02-02
Anticipated expiration: 2039-08-02
Also published as: CN112312189B

Abstract

本发明提供一种视频生成方法及视频生成系统，该方法包括：基于超文本标记语言HTML的落地页获取第一富媒体素材，所述第一富媒体素材包括基于所述落地页生成的第一图片集合；对所述第一富媒体素材进行处理，生成目标富媒体素材；将所述目标富媒体素材与匹配模板进行匹配，确定所述目标富媒体素材中各素材的填充信息，所述填充信息包括：素材填充的匹配模板、素材与匹配模板的填充关系；根据所述目标富媒体素材和所述填充信息，渲染生成视频。本发明可以提高生成视频的内容丰富度。

Description

一种视频生成方法及视频生成系统

技术领域

本发明实施例涉及通信技术领域，尤其涉及一种视频生成方法及视频生成系统。

背景技术

随着短视频的兴起，基于视频的内容传递方式越来越得到大家的认可。在商业侧，与商家卖点相关的商业视频需求量也越来越来大。

目前，商业视频生成系统直接通过堆积商家提供的素材生成商业视频，造成商业视频内容的丰富度较低。

发明内容

本发明实施例提供一种视频生成方法及视频生成系统，以解决现有商业视频内容丰富度较低的问题。

为解决上述问题，本发明是这样实现的：

第一方面，本发明实施例提供了一种视频生成方法，该方法包括：

基于超文本标记语言HTML的落地页获取第一富媒体素材，所述第一富媒体素材包括基于所述落地页生成的第一图片集合；

对所述第一富媒体素材进行处理，生成目标富媒体素材；

将所述目标富媒体素材与匹配模板进行匹配，确定所述目标富媒体素材中各素材的填充信息，所述填充信息包括：素材填充的匹配模板、素材与匹配模板的填充关系；

根据所述目标富媒体素材和所述填充信息，渲染生成视频。

第二方面，本发明实施例还提供一种视频生成系统，该视频生成系统包括：

获取模块，用于基于超文本标记语言HTML的落地页获取第一富媒体素材，所述第一富媒体素材包括基于所述落地页生成的第一图片集合；

第一生成模块，用于对所述第一富媒体素材进行处理，生成目标富媒体素材；

确定模块，用于将所述目标富媒体素材与匹配模板进行匹配，确定所述目标富媒体素材中各素材的填充信息，所述填充信息包括：素材填充的匹配模板、素材与匹配模板的填充关系；

第二生成模块，用于根据所述目标富媒体素材和所述填充信息，渲染生成视频。

第三方面，本发明实施例还提供一种视频生成系统，该视频生成系统包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的视频生成方法的步骤。

第四方面，本发明实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的视频生成方法的步骤。

在本发明实施例中，通过对基于HTML的落地页获取的第一富媒体素材进行处理，生成目标富媒体素材，其中，第一富媒体素材包括基于所述落地页生成的第一图片集合，并根据目标富媒体素材以及其各素材的填充信息，渲染生成视频。可见，相比于现有技术中直接通过堆积商家提供的素材生成商业视频，本发明实施例可以基于HTML的落地页生成富媒体素材，从而可以提高生成视频的内容丰富度。

附图说明

图1是本发明实施例提供的一种视频生成方法的流程示意图；

图2是本发明实施例提供的一种落地页的截图的示意图；

图3a是本发明实施例提供的一种元素初提取图的示意图；

图3b是本发明实施例提供的一种行合并图的示意图；

图3c是本发明实施例提供的一种行切分图的示意图；

图4a是本发明实施例提供的一种Block合并图的示意图；

图4b是本发明实施例提供的一种Block初过滤图的示意图；

图5是本发明实施例提供的一种Conditional Seq2Seq模型的工作示意图；

图6是本发明实施例提供的另一种视频生成方法的流程示意图；

图7是本发明实施例提供的一种视频生成系统的结构示意图；

图8是本发明实施例提供的另一种视频生成系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。此外，本申请中使用“和/或”表示所连接对象的至少其中之一，例如A和/或B和/或C，表示包含单独A，单独B，单独C，以及A和B都存在，B和C都存在，A和C都存在，以及A、B和C都存在的7种情况。

本发明实施例提供一种视频生成方法，应用于视频生成系统，该视频生成系统能够对基于HTML的落地页获取的第一富媒体素材进行处理，生成目标富媒体素材，其中，第一富媒体素材包括基于所述落地页生成的第一图片集合，并根据目标富媒体素材以及其各素材的填充信息，渲染生成视频，可以提高生成视频的内容丰富度。

以下对本发明实施例的视频生成方法进行说明。

如图1所示，一种视频生成方法，可以包括以下步骤：

步骤101：基于超文本标记语言HTML的落地页获取第一富媒体素材，所述第一富媒体素材包括基于所述落地页生成的第一图片集合。

其中，超文本标记语言(Hyper Text Markup Language，HTML)的落地页可以是广告主的营销落地页。

应理解的是，在本发明实施例中，富媒体素材可以包括文本和图片。具体实现时，第一富媒体素材可以包括：基于所述落地页生成的图片集合(即上述第一图片集合)；从所述落地页中提取的图片集合；从广告主的广告库中提取的与所述落地页关联的文本集合(如买词、卖点片段等)；广告主的基本信息(如：广告主名称、品牌名、LOGO等)。

需要说明的是，在本发明实施例中，从落地页提取图片集合，与基于落地页生成图片集合，是两种完全不同的获取图片集合的方式，且获取到的图片集合中包括的图片不同。

具体地，对于从落地页提取图片集合的获取方式，其是通过HTML中的文件，进行图片的获取，因此，其仅能获取落地页中的图片，网页布局、空间结构等信息无法进行捕捉。而对于基于落地页生成图片集合的获取方式，其是基于HTML呈现出的网页结果，进行图片的获取，因此，其获取的图片极大的保留了落地页中素材间的关系，一定程度上可以体现出网站的布局设计。

步骤102：对所述第一富媒体素材进行处理，生成目标富媒体素材。

具体实现时，视频生成系统可对第一富媒体素材进行筛选、创意拓展等处理，以生成高质量的目标富媒体素材，使得目标富媒体素材符合广告主的需求。

步骤103：将所述目标富媒体素材与匹配模板进行匹配，确定所述目标富媒体素材中各素材的填充信息，所述填充信息包括：素材填充的匹配模板、素材与匹配模板的填充关系。

具体实现时，视频生成系统可以预存有多个匹配模板，以及与每个匹配模板对应的匹配得分公式。其中，匹配得分公式可以表现如下：

Score＝α×Gs+β×Cs+γ×Ls

其中，Gs为总体美观得分，Gs＝σ(z^L)，

Cs用于评价多图模板风格一致性，可以根据图像直方图计算美观度：

Ls为小图模板惩罚；

α、β和γ为权重系数，应理解的是，在实际应用中，不同匹配模板的α、β和γ的取值可以不同。

具体实现时，将所述目标富媒体素材与匹配模板进行匹配，并通过匹配得分公式进行打分，根据打分结果确定目标富媒体素材中各素材的填充信息。

为方便理解，以一个匹配模板为例进行说明，不难理解的而是，不同素材填充该匹配模板，可以得到多个匹配结果。之后，可以基于该匹配模板的匹配得分公司对各匹配结果进行打分，并将分数最高的匹配结果确定为该匹配模板的最终匹配结果。

需要说明的是，在本发明实施例中，匹配模板可以是静态匹配模板，也可以是动态匹配模板。

对于静态匹配模板，其可以用于确定各素材的显示位置。对于动态匹配模板，其可以包括动态特效信息，所述动态特效信息用于确定素材的动态特效，可见，动态匹配模板不仅可以用于确定各素材的显示位置，还可以确定各素材在其对应的显示位置的动态特效。这样，相比于根据静态匹配模板生成视频，根据动态匹配模板生成视频，可以提高视频内容显示的灵活度。

步骤104：根据所述目标富媒体素材和所述填充信息，渲染生成视频。

本实施例的视频生成方法，可以基于HTML的落地页生成目标富媒体素材，并根据目标富媒体素材及其素材的填充信息，渲染生成视频，从而可以提高视频的内容丰富度。

本实施例的方法，通过对基于HTML的落地页获取的第一富媒体素材进行处理，生成目标富媒体素材，其中，第一富媒体素材包括基于所述落地页生成的第一图片集合，并根据目标富媒体素材以及其各素材的填充信息，渲染生成视频。可见，相比于现有技术中直接通过堆积商家提供的素材生成商业视频，本发明实施例可以基于HTML的落地页生成富媒体素材，从而可以提高生成视频的内容丰富度。

在本发明实施例中，对于第一图片集合的获取，首先，视频生成系统可以使用快照(Snapshot)技术，将HTML展现出的落地页进行全屏幕截图，之后，可以将全屏幕截图作为图片进行布局分析，得到第一图片集合。具体说明如下：

可选的，所述基于超文本标记语言HTML的落地页获取第一富媒体素材，包括：

获取所述落地页的截图；

对所述截图进行分析，生成所述第一图片集合。

具体实现时，首先，可以基于广告主上传的落地页素材进行落地页解析，运用Snapshot技术，将预加载的落地页进行网站“拍照”，形成待处理的图片，将HTML可视化。之后，可以对截图进行布局(Layout)分析，生成第一图片集合。

可选的，所述对所述截图进行分析，生成所述第一图片集合，包括：

在横向上行切分所述截图；

识别行切分后的截图中的联通域，得到第一联通域集合；

识别所述第一联通域集合中各联通域的最小外接矩形，得到第一矩形集合；

根据所述第一矩形集合，生成所述第一图片集合。

为方便理解，以图2所示的截图20进行说明。

首先，如图3a所示，视频生成系统可以对截图20进行元素初提取，主要用于识别落地页中各素材的位置，得到元素初提取图21。其次，如图3b所示，可以对元素初提取图21进行行(Line)合并，得到行合并图22。之后，如图3c所示，在横向上行切分行合并图22，得到行切分图23。

识别行切分图23中的联通域，得到第一联通域组合，也就是说，第一联通域组合包括切分图23中识别到的联通域。再利用图像处理算法，识别第一联通域集合中各联通域的最小外接矩形，得到第一矩形集合，如图3a所示，第一矩形集合中各矩形标识为201至213。

需要说明的是，一个矩形(Rect)对应一张图片，具体地，一个矩形所圈住的内容可作为一张单独的图片。应理解的是，第一图片集合中至少包括第一矩形集合中各矩形对应的图片。

进一步地，所述根据所述第一矩形集合，生成所述第一图片集合，包括：

根据所述第一联通域集合中各联通域之间的位置关系，在第一方向上对所述第一联通域集合中的联通域进行合并，生成第二联通域集合；

识别所述第二联通域集合中各联通域的最小外接矩形，得到第二矩形集合；

根据所述第一矩形集合和所述第二矩形集合，生成所述第一图片集合；

其中，所述第一方向为纵向或横向。

具体实现时，可以将第一联通域集合中在第一方向上靠近的第一联通域进行融合，可以理解为块(Block)合并。具体地，视频生成系统可以获取第一联通域集合中各第一联通域在第一方向上的排列位置，并根据排列位置，判断相邻的两个第一联通域之间的间距是否小于第一阈值，以对第一联通域集合中的第一联通域进行合并划分，得到第二联通域集合。应理解的是，第二联通域集合中的各第二联通域至少包括一个第一联通域；相邻的第二联通域之间的间距大于或等于第一阈值；另外，在第二联通域包括两个或两个以上第一联通域时，该第二联通域中相邻的第一联通域之间的间距小于第一阈值。

为方便理解，请一并参阅图4a和图4b，其对应纵向上合并第一联通域的实施方式。图4a示有第一联通域合并图(也可以称为Block合并图)24，图4b示有Block初过滤图25，在图4b中，第二矩形集合中各矩形标识为221至223。

参见图3c和图4b可知，图4b中标示为221的矩形包含有图3c中标示为201的矩形；图4b标示为222的矩形包含有图3c中标示为202-207的矩形；图4b标示为223的矩形包含有图3c中标示为208至213的矩形。

需要说明的是，第一阈值可以根据实际需求设置或调整。进一步地，在联通域a1和联通域a2中的内容为相同元素的情况下，第一阈值可以为F1；在联通域a1和联通域a2的内容为不同元素的情况下，第一阈值可以为F2，其中，F1可以小于F2。其中，联通域a1和联通域a2为所述第一联通域集合中任意两个相邻的第一联通域；元素可表现为图片或文字。

应理解的是，在该实施方式中，第一图片集合中至少包括第一矩形集合中各矩形集合对应的图片，以及第二矩形集合中各矩形集合对应的图片，从而可以提升第一图片集合的丰富度，即丰富了视频素材来源，进而可以提高视频内容的丰富度。

进一步地，视频生成系统在第一方向上合并联通域之后，还可以在第二方向上合并联通域，从而可以生成更多图片，进而提升第一图片集合的丰富度。

可选的，所述根据所述第一矩形集合和所述第二矩形集合，生成所述第一图片集合，包括：

根据所述第二联通域集合中各联通域集合之间的位置关系，在第二方向上对所述第二联通域集合的联通域进行合并，生成第三联通域集合；

识别所述第三联通域集合中各联通域的最小外接矩形，得到第三矩形集合；

根据所述第一矩形集合、所述第二矩形集合和所述第三矩形集合，生成所述第一图片集合；

其中，所述第二方向为纵向或横向，且所述第二方向与所述第一方向不同。

具体实现时，可以将第二联通域集合中在第二方向上靠近的第二联通域进行融合，可以理解为Block重组。具体地，视频生成系统可以获取第二联通域集合中各第二联通域在第二方向上的排列位置，并根据排列位置，判断相邻的两个第二联通域之间的间距是否小于第二阈值，以对第二联通域集合中的第二联通域进行合并划分，得到第三联通域集合。应理解的是，第三联通域集合中的各第三联通域至少包括一个第二联通域；相邻的第三联通域之间的间距大于或等于第二阈值；另外，在第三联通域包括两个或两个以上第二联通域时，该第三联通域中相邻的第二联通域之间的间距小于第二阈值。

进一步地，视频生成系统还可以根据切分的Block尺寸、横纵比、构成(图像区域、文字区域)，对第二联通域集合中的第二联通域进行聚合，得到第三联通域集合。

需要说明的是，第二阈值可以根据实际需求设置或调整。进二步地，在联通域b1和联通域b2中的内容为相同元素的情况下，第二阈值可以为F3；在联通域集合b1和联通域集合b2的内容为不同元素的情况下，第二阈值可以为F4，其中，F3可以小于F4。其中，联通域b1和联通域b2为所述第三联通域集合中任意两个相邻的第三联通域；元素可表现为图片或文字。

应理解的是，在该实施方式中，第一图片集合中至少包括第一矩形集合中各矩形集合对应的图片、第二矩形集合中各矩形集合对应的图片，以及第三矩形集合中各矩形集合对应的图片，从而可以提升第一图片集合的丰富度，即丰富了视频素材来源，进而可以提高视频内容的丰富度。

另外，在本发明实施例中，可选的，所述根据所述第一矩形集合，生成所述第一图片集合，包括：

根据预设的图片尺寸信息，切分所述第一矩形集合中各矩形对应的图片；

根据切分后的图片，生成所述第一图片集合。

具体实现时，可以使得切分后的图片的尺寸信息与预设的图片尺寸信息匹配，从而可以提高图片的美观度和使用几率。

应理解的是，视频生成系统可以预设多个图片尺寸信息，在切分某图片的过程中，可以根据该图片匹配度最高的预设图片尺寸信息，切分该图片。具体地，可以将与该图片的尺寸信息最接近预设图片尺寸信息，确定为与该图片匹配度最高的预设图片尺寸信息。

为避免裁剪掉有效文本内容，进一步地，所述根据预设的图片尺寸信息，切分所述第一矩形集合中各矩形对应的图片，包括：

识别所述第一矩形集合中各矩形对应的图片中的文本区域和图像区域；

根据预设的图片尺寸信息，切分所述图像区域。

具体实现时，视频生成系统可以切分图片的周边文本区域，运用显著性检测算法识别图片中的核心区域，再基于图片尺寸信息，如裁剪比例、尺寸要求进行图片切分。具体地，可以切分掉除文本区域和核心区域之外的其它图像区域，这样，既可以使得图片的尺寸信息与预设图片尺寸信息匹配，也可以保留图片中的关键内容。

在本发明实施例中，可选的，所述对所述第一富媒体素材进行处理，生成目标富媒体素材，包括：

利用第一模型，从所述第一富媒体素材中筛选得到第二富媒体素材，所述第二富媒体素材包括第二图片集合和第一文本集合；

根据所述第一文本集合，生成第二文本集合；

从所述第二图片集合中检索得到第三图片集合，所述第三图片集合与所述第二文本集合关联；

将所述第三图片集合和所述第二文本集合确定为目标富媒体素材。

由前述内容可知，第一富媒体素材中可以包括图片集合和文本集合。为提高视频质量，在本发明实施例中，可以利用第一模型，筛选掉第一富媒体素材中的部分素材。

具体实现时，可以利用文本情感度二分类模型，从第一富媒体素材中筛选得到第一文本集合；利用图片美观度模型，从第一富媒体素材中筛选得到第二图片集合。

之后，可以基于筛选得到的第一文本集合，进行创意拓展，生成宣传排句。具体实现时，视频生成系统至少可以通过以下两种方式根据所述第一文本集合，生成第二文本集合。

方式一、可选的，所述根据所述第一文本集合，生成第二文本集合，包括：

利用第二模型，生成第二文本集合，所述第二模型的输入包括所述第二图片集合中的图片和所述第二文本集合中的文字中的至少一项。

具体实现时，视频生成系统可以利用Conditional Seq2Seq模型，利用优势文字片段，扩展生成高质量优质排比句。

需要说明的是，Conditional Seq2Seq模型与传统的Seq2Seq模型不同，具体说明如下：

传统的Seq2Seq模型为机器翻译模型，其输入和输出均为文本，即文本生成文本。而Conditional Seq2Seq模型为多模态生成模型，其输入可以包括文本和图片，输出为图片，这样利用Conditional Seq2Seq模型生成的文本可以与图片相关，从而可以提高生成文本与广告主需求的匹配度。为方便理解Conditional Seq2Seq模型的工作原理，请参阅图5。

方式二、视频生成系统可以利用语义近似检索，句式聚类的方式，将第一文本集合中的短文本生成语义相关、句式一致的排比句，作为视频中文本创意。

视频生成系统在生成第二文本集合后，进一步地，从所述第二图片集合中检索得到第三图片集合，所述第三图片集合与所述第二文本集合关联。这样，利用包括所述第三图片集合和所述第二文本集合的目标富媒体素材生成视频，可以提高视频与广告主需求的匹配度。

在本发明实施例中，所述生成目标富媒体素材之后，所述将所述目标富媒体素材与匹配模板进行匹配之前，所述方法还包括：

确定所述目标富媒体素材中各图片的类型；

确定所述目标富媒体素材中各图片的层次关系，其中，同一矩形集合中各矩形对应的图片属于同一层级；

所述将所述目标富媒体素材与匹配模板进行匹配，包括：

根据所述类型和所述层次关系，将所述目标富媒体素材与匹配模板进行匹配。

具体实现时，可以判断图片是否为LOGO图、文字图、按钮(Button)图。具体地，对于LOGO图，可以将该图放置在视频的开头或结尾；对于文字图，其填充的匹配模板中，可以不填充文本信息；对于Button图，可以舍弃不用于生成视频。

同一矩形集合中各矩形对应的图片属于同一层级。具体实现时，可以将矩形列表中最外层矩形作为父节点，将嵌套关系的矩形形成树状结构。为方便理解，请一并参阅图3c和图4b。其中，图3c中标示的矩形属于同一层级，图4b中标示的矩形属于同一层级，且图4b中的矩形集合相对于图3c中标示的矩形为树状结构中的父节点。具体地，在将所述目标富媒体素材与匹配模板进行匹配的过程中，同一匹配模板中可以填充同一层级的图片，从而可以避免匹配模板中填充的内容重复。

需要说明的是，本发明实施例中介绍的多种可选的实施方式，彼此可以相互结合实现，也可以单独实现，对此本发明实施例不作限定。具体实现时，视频生成方法可以参见图6。在图6中，目标(Target)统一资源定位器(Uniform Resource Locator，URL)。

本发明实施例基于广告主的图文素材，利用文本规划、扩展能力，丰富视频的文字内容，生成视频，使得视频不仅仅是枯燥的图片展示，更富有内容性。同时，优质图片文本的组合，也是基于模型进行质量保障。

另外，本发明实施例充分利用了网站的文本、图片素材，同时还将网站的布局设计考虑其中，极大保留了素材间的关系，保证了素材组合的合理性与精美程度。

参见图7，图7是本发明实施例提供的一种视频生成系统的结构示意图。如图7所示，视频生成系统700包括：

获取模块701，用于基于超文本标记语言HTML的落地页获取第一富媒体素材，所述第一富媒体素材包括基于所述落地页生成的第一图片集合；

第一生成模块702，用于对所述第一富媒体素材进行处理，生成目标富媒体素材；

确定模块703，用于将所述目标富媒体素材与匹配模板进行匹配，确定所述目标富媒体素材中各素材的填充信息，所述填充信息包括：素材填充的匹配模板、素材与匹配模板的填充关系；

第二生成模块704，用于根据所述目标富媒体素材和所述填充信息，渲染生成视频。

可选的，所述获取模块701具体用于：

获取所述落地页的截图；

对所述截图进行分析，生成所述第一图片集合。

可选的，所述获取模块701具体用于：

在横向上行切分所述截图；

识别行切分后的截图中的联通域，得到第一联通域集合；

根据所述第一矩形集合，生成所述第一图片集合。

可选的，所述获取模块701具体用于：

其中，所述第一方向为纵向或横向。

可选的，所述获取模块701具体用于：

根据切分后的图片，生成所述第一图片集合。

可选的，所述获取模块701具体用于：

根据预设的图片尺寸信息，切分所述图像区域。

可选的，所述第一生成模块702具体用于：

根据所述第一文本集合，生成第二文本集合；

可选的，所述第一生成模块702具体用于：

可选的，所述视频生成系统700还包括：

确定模块，用于在生成目标富媒体素材之后，将所述目标富媒体素材与匹配模板进行匹配之前：

确定所述目标富媒体素材中各图片的类型；

所述确定模块703，具体用于：

视频生成系统700能够实现本发明方法实施例中的各个过程，以及达到相同的有益效果，为避免重复，这里不再赘述。

如图8所示，本发明实施例还提供的一种视频生成系统，视频生成系统800包括存储器801、处理器802及存储在存储器801上并可在处理器802上运行的计算机程序；处理器802执行所述计算机程序时，实现如下步骤：

对所述第一富媒体素材进行处理，生成目标富媒体素材；

根据所述目标富媒体素材和所述填充信息，渲染生成视频。

在图8中，总线架构可以包括任意数量的互联的总线和桥，具体由处理器802代表的一个或多个处理器和存储器801代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口提供接口。处理器802负责管理总线架构和通常的处理，存储器801可以存储处理器802在执行操作时所使用的数据。

可选的，处理器802执行所述程序时，还实现：

获取所述落地页的截图；

对所述截图进行分析，生成所述第一图片集合。

可选的，处理器802执行所述程序时，还实现：

在横向上行切分所述截图；

识别行切分后的截图中的联通域，得到第一联通域集合；

根据所述第一矩形集合，生成所述第一图片集合。

可选的，处理器802执行所述程序时，还实现：

其中，所述第一方向为纵向或横向。

可选的，处理器802执行所述程序时，还实现：

根据切分后的图片，生成所述第一图片集合。

可选的，处理器802执行所述程序时，还实现：

根据预设的图片尺寸信息，切分所述图像区域。

可选的，处理器802执行所述程序时，还实现：

根据所述第一文本集合，生成第二文本集合；

可选的，处理器802执行所述程序时，还实现：

确定所述目标富媒体素材中各图片的类型；

需要说明的是，本发明实施例中上述视频生成系统800可以是方法实施例中任意实施方式的视频生成系统，方法实施例中任意实施方式都可以被本实施例中的视频生成系统800所实现，以及达到相同的有益效果，此处不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述视频生成方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本发明的保护之内。

Claims

1.一种视频生成方法，其特征在于，所述方法包括：

对所述第一富媒体素材进行处理，生成目标富媒体素材；

根据所述目标富媒体素材和所述填充信息，渲染生成视频。

2.根据权利要求1所述的方法，其特征在于，所述基于超文本标记语言HTML的落地页获取第一富媒体素材，包括：

获取所述落地页的截图；

对所述截图进行分析，生成所述第一图片集合。

3.根据权利要求2所述的方法，其特征在于，所述对所述截图进行分析，生成所述第一图片集合，包括：

在横向上行切分所述截图；

识别行切分后的截图中的联通域，得到第一联通域集合；

根据所述第一矩形集合，生成所述第一图片集合。

4.根据权利要求3所述的方法，其特征在于，所述根据所述第一矩形集合，生成所述第一图片集合，包括：

其中，所述第一方向为纵向或横向。

5.根据权利要求4所述的方法，其特征在于，所述根据所述第一矩形集合和所述第二矩形集合，生成所述第一图片集合，包括：

6.根据权利要求3至5中任一项所述的方法，其特征在于，所述根据所述第一矩形集合，生成所述第一图片集合，包括：

根据切分后的图片，生成所述第一图片集合。

7.根据权利要求6所述的方法，其特征在于，所述根据预设的图片尺寸信息，切分所述第一矩形集合中各矩形对应的图片，包括：

根据预设的图片尺寸信息，切分所述图像区域。

8.根据权利要求1所述的方法，其特征在于，所述对所述第一富媒体素材进行处理，生成目标富媒体素材，包括：

根据所述第一文本集合，生成第二文本集合；

9.根据权利要求8所述的方法，其特征在于，所述根据所述第一文本集合，生成第二文本集合，包括：

10.根据权利要求1所述的方法，其特征在于，所述生成目标富媒体素材之后，所述将所述目标富媒体素材与匹配模板进行匹配之前，所述方法还包括：

确定所述目标富媒体素材中各图片的类型；

所述将所述目标富媒体素材与匹配模板进行匹配，包括：

11.一种视频生成系统，其特征在于，所述视频生成系统包括：

12.根据权利要求11所述的视频生成系统，其特征在于，所述获取模块具体用于：

获取所述落地页的截图；

对所述截图进行分析，生成所述第一图片集合。

13.根据权利要求12所述的视频生成系统，其特征在于，所述获取模块具体用于：

在横向上行切分所述截图；

识别行切分后的截图中的联通域，得到第一联通域集合；

根据所述第一矩形集合，生成所述第一图片集合。

14.根据权利要求13所述的视频生成系统，其特征在于，所述获取模块具体用于：

其中，所述第一方向为纵向或横向。

15.根据权利要求14所述的视频生成系统，其特征在于，所述获取模块具体用于：

16.根据权利要求13至15中任一项所述的视频生成系统，其特征在于，所述获取模块具体用于：

根据切分后的图片，生成所述第一图片集合。

17.根据权利要求16所述的视频生成系统，其特征在于，所述获取模块具体用于：

根据预设的图片尺寸信息，切分所述图像区域。

18.根据权利要求11所述的视频生成系统，其特征在于，所述第一生成模块具体用于：

根据所述第一文本集合，生成第二文本集合；

19.根据权利要求18所述的视频生成系统，其特征在于，所述第一生成模块具体用于：

20.根据权利要求11所述的视频生成系统，其特征在于，所述视频生成系统还包括：

确定所述目标富媒体素材中各图片的类型；

所述确定模块，具体用于：

21.一种视频生成系统，其特征在于，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至10中任一项所述的视频生成方法的步骤。

22.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至10中任一项所述的视频生成方法的步骤。