CN110611840B

CN110611840B - 一种视频生成方法、装置、电子设备及存储介质

Info

Publication number: CN110611840B
Application number: CN201910829004.3A
Authority: CN
Inventors: 陆瀛海
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2019-09-03
Filing date: 2019-09-03
Publication date: 2021-11-09
Anticipated expiration: 2039-09-03
Also published as: CN110611840A

Abstract

本申请涉及一种视频生成方法、装置、电子设备及存储介质，该方法包括：根据文本解析得到关键词；根据所述关键词从视频库中筛选得到候选视频集合，所述候选视频集合中包括第一视频片段；将所述第一视频片段转换为第一图形，将目标的第二视频片段转换为第二图形；计算所述第一图形与所述第二图形进行拼接的平滑度，根据所述平滑度确定所述第二视频片段与所述第一视频片段之间的匹配度；当所述匹配度符合预设条件时，将所述第一视频片段和所述第二视频片段进行拼接。该技术方案无需用户手动筛选拼接，用户仅需写好文本就可获得自动生成的视频，提高视频制作的效率，减少耗时。另外，保证视频片段的平滑地拼接，提高拼接得到视频的效果。

Description

一种视频生成方法、装置、电子设备及存储介质

技术领域

本申请涉及图像处理领域，尤其涉及一种视频生成方法、装置、电子设备及存储介质。

背景技术

随着互联网的发展，用户对互联网内容要求越来越高，希望能够制作出个性化的视频。目前，主要由用户自己拍摄视频，或手动从已有视频中筛选提取并拼接为所需视频。这样，视频制作效率低，耗时长。

另外，两个已有视频之间是否能够拼接完全由用户人工进行判断，或者不进行判断直接进行拼接，这样，拼接生成视频效果较差。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本申请提供了一种视频生成方法、装置、电子设备及存储介质。

第一方面，本申请提供了一种视频生成方法，包括：

根据文本解析得到关键词；

根据所述关键词从视频库中筛选得到候选视频集合，所述候选视频集合中包括第一视频片段；

将所述第一视频片段转换为第一图形，将目标的第二视频片段转换为第二图形；

计算所述第一图形与所述第二图形进行拼接的平滑度，根据所述平滑度确定所述第二视频片段与所述第一视频片段之间的匹配度；

当所述匹配度符合预设条件时，将所述第一视频片段和所述第二视频片段进行拼接。

可选的，所述将所述第一视频片段转换为第一图形，将目标的第二视频片段转换为第二图形，包括：

分别获取所述第一视频片段的第一特征值序列和所述第二视频片段的第二特征值序列，所述特征值序列包括视频片段每个单位时间对应的至少一个特征维度的特征值；

根据所述第一特征值序列和第二特征值序列分别生成所述第一图形和第二图形。

可选的，根据所述第一特征值序列和第二特征值序列分别生成第一图形和第二图形，包括：

以所述单位时间为采样点，根据所述单位时间对应的特征值确定所述采样点的坐标；

根据所述采样点及其坐标分别生成所述第一图形和第二图形；

或，

根据预设拟合算法及所述采样点的坐标将所述采样点分别拟合为预设类型的第一图形和第二图形。

可选的，所述计算所述第一图形与所述第二图形进行拼接的平滑度，包括：

确定所述第一图形和所述第二图形的公共连接点；

获取在所述第一图形中与所述公共连接点距离最近的第一采样点，以及在所述第二图形中与所述公共连接点距离最近的第二采样点；

根据所述第一采样点的坐标计算所述第一图形在所述公共连接点处的第一切线角度或第一切平面角度，根据所述第二采样点的坐标计算所述第二图形在所述公共连接点处的第二切线角度或第二切平面角度；

计算所述第一切线角度和所述第二切线角度的切线角度之差，或所述第一切平面角度和所述第二切平面角度的切平面角度之差；

对所有所述切线角度之差或切平面角度之差进行累加，得到第一累加值，根据所述第一累加值确定所述平滑度。

确定所述第一图形和所述第二图形的公共连接点；

计算所述第一图形和所述第二图形在所述公共连接点处的n阶导数之差，其中，n为大于或等于1且小于或等于N的整数，N为所述特征值序列中特征维度的个数；

对所有所述n阶导数之差进行累加，得到第二累加值，根据所述第二累加值确定所述平滑度。

可选的，所述将所述第一视频片段转换为第一图形，将已拼接生成的第二视频片段转换为第二图形之前，所述方法还包括：

判断所述第二视频片段中是否包括所述第一视频片段；

当所述第二视频片段中包括所述第一视频片段时，将所述第一视频片段从所述候选视频集合中删除；

和/或，

将所述第一视频片段和所述第二视频片段进行拼接之前，所述方法还包括：

判断所述第二视频片段中是否包括所述第一视频片段；

对所述第二视频片段中是否包括所述第一视频片段进行提示。

可选的，所述方法还包括：

解析所述视频库中视频片段，识别所述视频片段中物体；

根据识别到的所述物体为所述视频片段生成物体标签，和/或根据识别到的所述物体以及所述物体与剧情的对应关系为所述视频片段生成剧情标签；

根据所述剧情标签和/或物体标签得到视频标签；

所述根据所述关键词从视频库中筛选得到候选视频集合，所述候选视频集合中包括第一视频片段，包括：

当查询所述关键词与所述视频标签匹配的第一视频片段时，将所述第一视频片段加入到所述候选视频集合中。

可选的，所述方法还包括：

获取拼接后视频中每个视频片段的视频标签；

根据所述视频标签为所述拼接后视频生成相应的字幕和/或解说；

和/或，所述方法还包括：

获取拼接后视频中每个视频片段对应的源视频；

根据所述源视频的视频介绍以及所述视频片段在所述源视频中的位置，生成所述拼接后视频对应的字幕和/或解说。

第二方面，本申请提供了一种视频生成装置，包括：

解析模块，用于根据文本解析得到关键词；

筛选模块，用于根据所述关键词从视频库中筛选得到候选视频集合，所述候选视频集合中包括第一视频片段；

转换模块，用于将所述第一视频片段转换为第一图形，将目标的第二视频片段转换为第二图形；

计算模块，用于计算所述第一图形与所述第二图形进行拼接的平滑度，根据所述平滑度确定所述第二视频片段与所述第一视频片段之间的匹配度；

拼接模块，用于当所述匹配度符合预设条件时，将所述第一视频片段和所述第二视频片段进行拼接。

第三方面，本申请提供了一种电子设备，包括：处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

所述存储器，用于存放计算机程序；

所述处理器，用于执行计算机程序时，实现上述方法步骤。

第四方面，本申请提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述方法步骤。

本申请实施例提供的上述技术方案与现有技术相比具有如下优点：

本实施例中，自动根据文本解析得到的关键词筛选视频片段，将筛选得到的视频片段拼接为视频，无需用户手动筛选拼接，用户仅需写好文本就可获得自动生成的视频，提高视频制作的效率，减少耗时。另外，将筛选得到的视频片段与已拼接生成的视频片段转换为图形，通过图形拼接的平滑度确定视频片段之间的匹配度，只有匹配度较高的两个视频片段才能够进行拼接，从而保证视频片段的平滑地拼接，提高拼接得到视频的效果。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种视频生成方法的流程图；

图2为本申请另一实施例提供的一种视频生成方法的流程图；

图3为本申请实施例提供的视频片段对应的图形示意图；

图4为本申请实施例提供的一种视频生成装置的框图；

图5为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

下面首先对本发明实施例所提供的一种视频生成方法进行介绍。

图1为本申请实施例提供的一种视频生成方法的流程图。如图1所示，该方法包括以下步骤：

步骤S11，根据文本解析得到关键词。

步骤S12，根据关键词从视频库中筛选得到候选视频集合，候选视频集合中包括第一视频片段。其中，视频库中包括预先存储的视频片段。

步骤S13，将第一视频片段转换为第一图形，将目标的第二视频片段转换为第二图形。其中，由于本实施例中视频生成方法中可能包括两次或两次以上的视频拼接，因此，目标的第二视频片段可以包括前一次筛选得到的视频片段或前一次拼接得到的视频片段。

步骤S14，计算第一图形与第二图形进行拼接的平滑度，根据平滑度确定第二视频片段与第一视频片段之间的匹配度。

步骤S15，当匹配度符合预设条件时，将第一视频片段和第二视频片段进行拼接。

例如，第一次通过文本关键词选择视频片段A。第二次通过文本关键词选择视频片段B，若通过分析确定视频片段A和B之间的匹配度符合要求，则将视频片段A和视频片段B拼接后得到视频片段ab。第三次通过文本关键词选择到视频片段C，若通过分析确定视频片段C和ab之间的匹配度符合要求，则将视频片段C与视频片段ab进行拼接，得到视频片段abc。……

本实施例中，自动根据文本解析得到的关键词筛选视频片段，将筛选得到的视频片段拼接为视频，无需用户手动筛选拼接，用户仅需写好文本就可获得自动生成的视频，提高视频制作的效率，减少耗时。另外，将筛选得到的视频片段与目标的视频片段转换为图形，通过图形拼接的平滑度确定视频片段之间的匹配度，只有匹配度较高的两个视频片段才能够进行拼接，从而保证视频片段的平滑地拼接，提高拼接得到视频的效果。

步骤S11中，该文本可以为用户以文字形式输入，也可以由用户通过语音方式输入后转换为文字形式。例如，该文本为用户编写的文本。文本的长短不受限制，对于较长的文本，如包括多个句子或多个段落的文本，可以将全部文本内容按照句子或段落进行拆分处理，得到多个文本片段，分别为每个文本片段进行关键词的提取。对每个文本片段分别选择视频片段，将这些视频片段按文本片段顺序拼接后即可得到完整文本所对应的视频。

为了实现本申请的技术方案，需要建立包括大量视频片段的视频库。通过将源视频进行视频拆条等方式处理后，得到视频片段，这些视频片段可以作为后续视频拼接的素材存储在视频库中。并且，可以通过限定源视频的分辨率，例如选择分辨率为高清以上，即分辨率在1280×720以上的源视频作为视频库中视频片段的来源，这样，使得视频库中视频片段的分辨率较高，也提高后续拼接后得到视频的分辨率。

本实施例的方法，可以基于大段的文本，选择多个视频片段进行拼接而生成时长较长的视频，视频长短不受限制。并且，拼接得到视频的分辨率实际上就是视频片段的分辨率，可以通过预先建立高分辨率的视频库以使得最终能够生成符合分辨率要求的视频。

具体地，步骤S11根据文本解析得到关键词，可以包括直接从文本文字中提取出的关键词，还可以包括根据文本内容分析得到的有关剧情、视频类型等关键词。

例如，文本片段为“xxx驾驶宇宙飞船飞往A星球，A星球位于距离地球10.45亿光年的IC1101星系，这是人类首次到达该星系”。从该文本片段中，可以提取出关键词“宇宙飞船”和“星球”。另外，根据文本内容分析出剧情关键词可能为“探索未知宇宙”、“星际旅行”等等，视频类型关键词可能为“科幻”。

因此，根据该文本片段，解析得到的关键词可以包括：“宇宙飞船”、“星球”、“探索未知宇宙”、“星际旅行”和“科幻”等。

为了使得在步骤S12中可以根据关键词查询到匹配的视频片段，本申请实施例中，需要预先为视频库中每个视频片段建立视频标签。因此，该方法还包括：解析视频库中视频片段，识别视频片段中物体；根据识别到的物体为视频片段生成物体标签，和/或根据识别到的所述物体以及所述物体与剧情的对应关系为所述视频片段生成剧情标签；根据所述剧情标签和/或物体标签得到视频标签。

本实施例中，通过为视频库中每个视频片段建立视频标签，使得后续可以准确地通过关键词比对视频标签选择用于拼接的视频片段，无需用户手动查询选择视频片段，用户仅需写好文本就可获得自动生成的视频，提高视频制作的效率，减少耗时。

具体地，可以通过现有的图像识别算法对视频片段每一帧图像进行识别，识别到物体。例如，从视频片段中识别到星球和宇宙飞船。因此，基于这些物体可以为该视频片段生成物体标签为“星球”、“宇宙飞船”，同时可以根据预先建立物体与剧情的对应关系，基于这些物体确定对应的剧情标签为“科幻”、“探索未知宇宙”，“星际旅行”等等。

对视频库中所有视频片段打上视频标签后，就可以根据从文本中提取的关键词进行匹配。步骤S12包括：当查询关键词与视频标签匹配的第一视频片段时，将第一视频片段加入到候选视频集合中。

其中，关键词与视频标签匹配包括：关键词与视频标签文字相同，或者虽然文字不同但语义相同或近似。当存在多个关键词和多个视频标签时，筛选视频片段时，还可以限定与关键词匹配的视频标签个数。

例如，从文本中提取的关键词为“星球”，视频片段的视频标签包括“恒星”、“行星”或“星体”等，通过语义分析可以认为该视频标签与关键词语义近似，则可确定该关键词与该视频标签匹配。

又例如，文本包括5个关键词，“宇宙飞船”、“星球”、“探索未知宇宙”、“星际旅行”和“科幻”。可以限定视频片段至少包括分别与其中3个关键词匹配的视频标签，才可被选入候选视频集合。如，视频片段包括：“飞船”、“星球大战”、“科幻”、“舰队”、“超光速飞行”等视频标签。通过比对，匹配的关键词和视频标签包括：“宇宙飞船”和“飞船”，“科幻”，“星际旅行”和“超光速飞行”。因此，可确定该视频片段与该文本匹配。

再例如，为了增加候选视频集合中视频片段的数量，也可限定第一视频片段的视频标签中只要包括1个关键词即可。或者，如果视频库中视频片段数量庞大，为了提高匹配度，限定第一视频片段的视频标签中必须包括所有关键词。

在另一实施例中，在将视频片段转换为图形之前，该方法还包括对候选视频集合中的视频片段进行进一步的筛选，在步骤S13之前，该方法包括：判断第二视频片段中是否包括第一视频片段；当第二视频片段中包括第一视频片段时，将第一视频片段从候选视频集合中删除。

例如，第二视频片段可能是由A、B、C、D四个视频片段拼接而成的，若候选视频集合中包括视频片段A。在将视频片段转换为图形之前，可以将视频片段A从候选视频集合中删除。

或者，也可不删除该重复视频片段，而是在候选视频集合中对其进行标注，如“已拼接”，以提醒用户。

当然，也可以仍然将视频片段转换为图形，通过计算图形拼接的平滑度确定视频片段之间的匹配度，只有在确定拼接时提示用户第一视频片段是否为已拼接过的视频片段，根据用户选择确定是否执行后续的拼接操作，用户可以根据自身需要选择是否拼接该已拼接过的视频片段。因此，在步骤S15之前，该方法还包括：判断第二视频片段中是否包括第一视频片段；对第二视频片段中是否包括第一视频片段进行提示。

例如，在拼接之前弹出窗口，“视频片段A已拼接过，是否进行拼接”，窗口中包括“是”和“否”按钮，用户通过点击按钮可以选择是否进行视频拼接。

通过上述两种方式，可以避免相同视频片段被重复多次拼接，提高基于文本生成视频的准确性。

本申请实施例中，步骤S13将视频片段转换为图形，该图形可以为如曲线或曲面，通过判断曲线或曲面之间是否能够平滑拼接来确定视频片段之间是否匹配。

图2为本申请另一实施例提供的一种视频生成方法的流程图。如图2所示，步骤S13包括以下步骤：

步骤S21，分别获取第一视频片段的第一特征值序列和第二视频片段的第二特征值序列，特征值序列包括视频片段每个单位时间对应的至少一个特征维度的特征值。

步骤S22，根据第一特征值序列和第二特征值序列分别生成第一视频片段和第二视频片段对应的第一图形和第二图形。

本实施例中，通过提取视频片段的一个或多个特征维度的特征值，可以准确获得视频片段的特征，以便后续可以准确分析两个视频片段拼接的平滑、流畅程度。

其中，步骤S21包括：根据预先训练的视频特征打分模型对第一视频片段和第二视频片段的每个单位时间进行特征维度打分，分别得到第一特征值序列和第二特征值序列。

视频片段中单位时间的个数为M，特征维度的个数为N，M和N均为大于或等于1的整数。

可以以每秒为单位时间，对于一段10秒的视频片段，单位时间有10个，则每个特征维度内包括10个特征值。

特征维度包括以下至少一个维度：剧情、场景规模、画面色调、音乐、镜头类型、人物数量、场景类型和画面移动方向。

将视频片段的每个单位时间建立至少一个特征维度的打分序列。对于每个特征维度，可以基于特征维度的分级进行打分，得到相应的特征值。

例如，剧情按照紧张程度，对应的特征值范围在[-100，100]；场景规模根据规模从小到大，对应的特征值范围在[-100，100]；色调按照明暗程度，对应的特征值范围在[-10，10]；音乐可以根据节奏快慢，对应的特征值范围在[0，20]；镜头分为：长镜头、短镜头、特写、蒙太奇等等，各种类型分别对应不同的特征值；人物数量按照从少到多，对应的特征值范围在[0，50]；场景类型包括人物、科幻、静物等类型，每个类型对应不同的特征值；画面移动方向包括：向左、向右、向上等等，每个移动方向对应不同的特征值。

在实际操作中，如果取值范围有正有负,可以对取值范围做平移,如把-100平移到0，则[-100～100]取值范围变为[0～200],对特征维度分数的平移处理不影响最终的视频拼接的结果。

在步骤S22中，基于特征值序列生成图形的方式可以有以下两种：

方式一，基于采样点生成图形。

以所述单位时间为采样点，根据所述单位时间对应的特征值确定所述采样点的坐标；根据采样点及其坐标分别生成第一图形和第二图形。

以三维特征值序列为例，即视频片段的特征值序列包括三个特征维度a、b、c，视频片段每个单位时间被表示为一个采样点(x，y，z)，x为该单位时间在特征维度a的特征值，y为该单位时间在特征维度b的特征值，z为该单位时间在特征维度c的特征值。

例如，对于40个时间单位的视频片段，特征维度a为剧情，特征值范围是[-2,2]；特征维度b为场景，特征值范围是[-2,2]；特征维度c为色调，特征值范围是[-0.2,0.2]。这样，可以得到如图3所示的一个三维的曲面。

方式二，根据预设拟合算法将采样点拟合为预设类型的图形。

以所述单位时间为采样点，根据所述单位时间对应的特征值确定所述采样点的坐标；根据预设拟合算法及所述采样点的坐标将所述采样点分别拟合为预设类型的第一图形和第二图形。

例如，预设拟合算法可以为参数方程，如Hermite曲线或曲面方程，Bezier曲线或曲面方程，等等，可以将采样点拟合为Hermite曲线或曲面，Bezier曲线或曲面。

通过拟合得到预设类型的图形，后续可以基于拟合得到的图形所对应的图形函数，计算两个图形公共连接点的高阶连续性。

本实施例中，步骤S14中计算两个图形进行拼接的平滑度，首先需要确定两个图形的公共连接点。其中公共连接点即为两个图形的交点。例如，曲线A的终点和曲线B的起点重合，则曲线A的终点和曲线B的起点即为曲线A、B的公共连接点。

在计算两个图形的平滑度过程中，如果两个图形不存在公共连接点，则可直接确定这两个图形不匹配。当两个图形存在公共连接点时，可以通过以下方式计算两个图形进行拼接的平滑度。

方式一，基于公共连接点的切线角度之差或切平面角度之差进行计算。

对于一维或二维图形，可通过计算两个图形在公共连接点处的切线角度之差确定两个图形进行拼接的平滑度；对于三维及以上的高维曲面，则可通过计算两个图形在公共连接点处的切平面角度之差确定两个图形进行拼接的平滑度。

另外，两个图形的公共连接点的个数可能不止一个。若只有一个公共连接点，则可根据两个图形在公共连接点处的切线角度之差或切平面角度之差确定两个图形进行拼接的平滑度。如果存在多个公共连接点，则需要对所有公共连接点对应的切线角度之差或切平面角度之差进行累加，根据得到的第一累加值确定平滑度。本实施例中，可以直接将第一累加值作为平滑度进行后续分析。

具体地，步骤S14中计算所述第一图形与所述第二图形进行拼接的平滑度，包括：

确定第一图形和第二图形的公共连接点；获取在第一图形中与公共连接点距离最近的第一采样点，以及在第二图形中与公共连接点距离最近的第二采样点；根据第一采样点的坐标计算第一图形在公共连接点处的第一切线角度或第一切平面角度，根据第二采样点的坐标计算第二图形在公共连接点处的第二切线角度或第二切平面角度；计算第一切线角度和第二切线角度的切线角度之差，或第一切平面角度和第二切平面角度的切平面角度之差；所有切线角度之差或切平面角度之差进行累加，得到第一累加值，根据第一累加值确定平滑度。

以二维特征值序列为例，第一图形和第二图形分别为第一曲线和第二曲线。

其中，一个公共连接点P1(1，1)，在第一曲线上与该公共连接点P1距离最近的点为(1，0)和(2，2)，第一曲线在该公共连接点P1处的切线角度为arctan(2-0)/(2-1)＝arctan2。

在第二曲线上与该公共连接点P1距离最近的点为(0，1)和(2，2)，第二曲线在该公共连接点P处的切线角度为arctan(2-1)/(2-0)＝arctan0.5。

则第一曲线和第二曲线在该公共连接点P1的切线角度之差D1为:

D1＝arctan2-arctan0.5＝0.6435。

当存在多个特征维度时，在计算两个图形公共连接点的切平面角度之差时，需要计算第一图形和第二图形在公共连接点的每个特征维度的切平面角度；计算相同特征维度的切平面角度之差。

例如，计算第一图形和第二图形在某个公共连接点处剧情的切平面角度之差、场景的切平面角度之差、色调的切平面角度之差等等。对所有公共连接点处所有特征维度的切平面角度之差进行累加。

方式二，基于公共连接点的n阶导数之差进行计算。

同样，两个图形的公共连接点的个数可能不止一个。若只有一个公共连接点，则可根据两个图形在该公共连接点处的n阶导数之差确定两个图形进行拼接的平滑度。如果存在多个公共连接点，则需要对所有公共连接点对应的n阶导数之差进行累加，根据得到的第二累加值确定平滑度。本实施例中，可以直接将第二累加值作为平滑度进行后续分析。

当第一图形和第二图形为拟合得到的预设类型的图形时，确定第一图形和所述第二图形的公共连接点；计算第一图形和第二图形在公共连接点处的n阶导数之差，其中，n为大于或等于1且小于或等于N的整数，N为特征值序列中特征维度的个数；对所有n阶导数之差进行累加，得到第二累加值，根据第二累加值确定平滑度。

基于拟合得到的Hermite、Bezier等图形，根据图形对应的图形函数，可以计算第一图形和第二图形在公共连接点处的高阶连续性，即计算其在公共连接点的高阶导数(n大于1)之差，从而更加精确地分析两个图形拼接的平滑度。

基于上述对平滑度的计算，步骤S15中的匹配度符合预设条件，可以包括：第一累加值小于或等于第一阈值；或，第二累加值小于或等于第二阈值。例如，第一阈值和第二阈值可以设置在(0，5°]范围内。

通过上述两种方式计算图形拼接的平滑度，实际上是计算得到了两个视频是否能够进行平滑拼接的匹配度，通过匹配度数值量化可以准确地分析出两个视频片段是否可以拼接为自然、流畅的视频。这样，视频拼接的准确度更高，拼接效果更好，最终生成的视频更加流畅、平滑。

更进一步地，在视频片段拼接结束后，即基于文本生成视频后，可以对拼接后视频生成字幕和/或解说。字幕和/或解说的生成方式可以包括：

方式一，根据视频片段的视频标签生成字幕和/或解说。

该方法还包括：获取拼接后视频中每个视频片段的视频标签；根据视频标签为拼接后视频生成相应的字幕和/或解说。

例如，视频片段的视频标签如下：“AAA”、“BBB号飞船”、“死星”、“超光速飞行”、“小行星带”。

根据这些视频标签，生成字幕和/或解说为：“AAA驾驶BBB号飞船逃离死星，进行超光速飞行后，到达小行星带”。

方式二，根据视频片段的源视频的信息生成字幕和/或解说。

该方法还包括：获取拼接后视频中每个视频片段对应的源视频；根据源视频的视频介绍以及视频片段在源视频中的位置，生成拼接后视频对应的字幕和/或解说。

例如，一视频片段的源视频为电影，该视频片段位于电影的58分钟17秒到58分18秒。根据该电影的介绍及该视频片段在电影中所在位置，生成字幕和/或解说为：“AAA与CCC突出重围，驾驶BBB号飞船逃离死星，进行超光速飞行后，通过空间跳跃经小行星带到达义军总部所在的DDD行星”。

方式三，方式一和方式二的结合。

结合每个视频片段的视频标签，其源视频的视频介绍及视频片段在源视频中的位置，为该拼接后视频生成字幕和/或解说。

本实施例中，为拼接后视频添加字幕和/或解说，可以提高视频画面表达意义的明确度，便于视频观看者理解视频内容。

下述为本公开装置实施例，可以用于执行本公开方法实施例。

图4为本申请实施例提供的一种视频生成装置的框图，该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图4所示，该视频生成装置包括：

解析模块41，用于根据文本解析得到关键词。

筛选模块42，用于根据关键词从视频库中筛选得到候选视频集合，候选视频集合中包括第一视频片段。

转换模块43，用于将所述第一视频片段转换为第一图形，将目标的第二视频片段转换为第二图形。

计算模块44，用于计算所述第一图形与所述第二图形进行拼接的平滑度，根据所述平滑度确定所述第二视频片段与所述第一视频片段之间的匹配度。

拼接模块45，用于当匹配度符合预设条件时，将第一视频片段和第二视频片段进行拼接。

本发明实施例所提供的方法可以应用于任意需要视频生成的电子设备，例如，可以为服务器、终端等电子设备，在此不做具体限定，为描述方便，后续简称为电子设备。

本申请实施例还提供一种电子设备，如图5所示，电子设备可以包括：处理器1501、通信接口1502、存储器1503和通信总线1504，其中，处理器1501，通信接口1502，存储器1503通过通信总线1504完成相互间的通信。

存储器1503，用于存放计算机程序；

处理器1501，用于执行存储器1503上所存放的计算机程序时，实现以下上述方法实施例的步骤。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，P C I)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(DigitalSignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本申请还提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以下上述方法实施例的步骤。

需要说明的是，对于上述装置、电子设备及计算机可读存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

进一步需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个物体或者操作与另一个物体或操作区分开来，而不一定要求或者暗示这些物体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的具体实施方式，使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims

1.一种视频生成方法，其特征在于，包括：

根据文本解析得到关键词；

当所述匹配度符合预设条件时，将所述第一视频片段和所述第二视频片段进行拼接；

所述计算所述第一图形与所述第二图形进行拼接的平滑度，包括：

确定所述第一图形和所述第二图形的公共连接点；

根据所述第一图形和所述第二图形在所述公共连接点处的切线角度之差、切平面角度之差或n阶导数之差，其中，n>1，计算所述平滑度。

2.根据权利要求1所述的方法，其特征在于，所述将所述第一视频片段转换为第一图形，将目标的第二视频片段转换为第二图形，包括：

3.根据权利要求2所述的方法，其特征在于，根据所述第一特征值序列和第二特征值序列分别生成第一图形和第二图形，包括：

或，

4.根据权利要求3所述的方法，其特征在于，所述根据所述第一图形和所述第二图形在所述公共连接点处的切线角度之差或切平面角度之差，计算所述平滑度，包括：

5.根据权利要求3所述的方法，其特征在于，所述根据所述第一图形和所述第二图形在所述公共连接点处的n阶导数之差，计算所述平滑度，包括：

计算所述第一图形和所述第二图形在所述公共连接点处的n阶导数之差，其中，n为大于1且小于或等于N的整数，N为所述特征值序列中特征维度的个数；

6.根据权利要求1所述的方法，其特征在于，所述将所述第一视频片段转换为第一图形，将已拼接生成的第二视频片段转换为第二图形之前，所述方法还包括：

判断所述第二视频片段中是否包括所述第一视频片段；

和/或，

判断所述第二视频片段中是否包括所述第一视频片段；

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

解析所述视频库中视频片段，识别所述视频片段中物体；

根据所述剧情标签和/或物体标签得到视频标签；

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取拼接后视频中每个视频片段的视频标签；

和/或，所述方法还包括：

获取拼接后视频中每个视频片段对应的源视频；

9.一种视频生成装置，其特征在于，包括：

解析模块，用于根据文本解析得到关键词；

拼接模块，用于当所述匹配度符合预设条件时，将所述第一视频片段和所述第二视频片段进行拼接；

所述计算模块，用于确定所述第一图形和所述第二图形的公共连接点；根据所述第一图形和所述第二图形在所述公共连接点处的切线角度之差、切平面角度之差或n阶导数之差，其中，n>1，计算所述平滑度。

10.一种电子设备，其特征在于，包括：处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

所述存储器，用于存放计算机程序；

所述处理器，用于执行所述计算机程序时，实现权利要求1-8任一项所述的方法步骤。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1-8任一项所述的方法步骤。