CN115086783B

CN115086783B - 一种视频生成方法、装置及电子设备

Info

Publication number: CN115086783B
Application number: CN202210750110.4A
Authority: CN
Inventors: 洪煜中
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2022-06-28
Filing date: 2022-06-28
Publication date: 2023-10-27
Anticipated expiration: 2042-06-28
Also published as: CN115086783A

Abstract

本发明实施例提供了一种视频生成方法、装置及电子设备，涉及视频处理技术领域，该视频生成方法包括：获取目标文本，并在指定视频集合中选取与所述目标文本中的每个句子对应的初始视频片段；从所述每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段；根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序，并按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频。与现有技术相比，应用本发明实施例提供的方案，可以在提高视频生成效率的前提下，使得生成的视频摘要可以反映剧情。

Description

一种视频生成方法、装置及电子设备

技术领域

本发明涉及视频处理技术领域，特别是涉及一种视频生成方法、装置及电子设备。

背景技术

当前，随着短视频、预告片等视频摘要的发展迅速，人们对于视频摘要的剧情流畅性、视频信息量和视频的故事完整性等内容要求也越来越高。

所谓视频摘要，是通过分析原始视频的结构和内容，从原始视频中提取有意义的片段/帧，并将所提取的片段/帧进行拼接得到的视频片段。例如，关于电影剧情简介的预告片、关于电视剧的前情提要、关于综艺解说的短视频等。

相关技术中，可以通过人工的手动操作生成视频摘要，但是，上述方法会导致较低的视频生成效率，并且造成大量的成本耗费，因此，为了提高视频摘要的生成效率并降低大量的成本耗费，可以根据用户需求，通过视频处理软件，将内容较为精彩的视频片段进行简单的罗列，从而，得到相应的视频摘要，但是，仅仅是多个视频片段进行罗列，会使得视频摘要中的各个视频片段之间缺乏关联性，从而，导致视频摘要不能反映剧情。

基于此，如何在提高视频生成效率的前提下，使得所生成的视频摘要可以反映剧情，成为当前亟需解决的问题。

发明内容

本发明实施例的目的在于提供一种视频生成方法、装置及电子设备，以实现在提高视频生成效率的前提下，使得所生成的视频摘要可以反映剧情。具体技术方案如下：

在本发明实施的第一方面，首先提供了一种视频生成方法，所述方法包括：

获取目标文本，并在指定视频集合中选取与所述目标文本中的每个句子对应的初始视频片段；从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段；其中，每个初始视频片段的播放时间为：该初始视频片段在所述指定视频集合中的播放时间；根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序；按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频；其中，每个指定视频片段的内容标签包括：该指定视频片段的播放时间或该指定视频片段对应的句子的序号，每个句子的序号为：该句子在所述目标文本中的排序。

在本发明实施的第二方面，还提供了一种视频生成装置，所述装置包括：

初始片段获取模块，用于获取目标文本，并在指定视频集合中选取与所述目标文本中的每个句子对应的初始视频片段；目标片段确定模块，用于从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段；其中，每个初始视频片段的播放时间为：该初始视频片段在所述指定视频集合中的播放时间；顺序确定模块，用于根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序；目标视频获取模块，用于按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频；其中，每个指定视频片段的内容标签包括：该指定视频片段的播放时间或该指定视频片段对应的句子的序号，每个句子的序号为：该句子在所述目标文本中的排序。

在本发明实施例的第三方面，还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序时，实现上述第一方面提供的任一所述的视频生成方法。

在本发明实施的又一方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一所述的视频生成方法。

在本发明实施的又一方面，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一所述的视频生成方法。

以上可见，应用本发明实施例提供的方案，在视频生成的过程中，首先，获取目标文本，并在指定视频集合中选取与上述目标文本中的每个句子对应的各个初始视频片段，从而，可以从每个句子对应的初始视频片段中，选取该初始视频片段在上述指定视频集合中的播放时间满足指定时间要求的指定视频片段，并根据各个指定视频片段的播放时间或各个指定视频片段对应的句子的序号，确定各个指定视频片段的拼接顺序，并按照所确定的拼接顺序，将各个指定视频片段进行拼接，得到目标视频。

基于此，应用本发明实施例提供的方案，上述目标文本可以用于描述一段剧情，从而，该目标文本中的每个句子用于描述该剧情中的部分情节，并且，各个句子之间具有关联性。从而，所确定的各个句子对应的指定视频片段的内容可以分别反映上述剧情中的部分内容，并且，各个指定视频片段之间具有关联性。进而，对各个指定视频片段进行拼接所得到的目标视频的内容便可以反映上述目标文本所描述的剧情。这样，应用本发明实施例提供的方案，便可以利用描述视频摘要的剧情的文本和用于生成视频摘要的原始视频，在提高视频生成效率的前提下，生成内容具有关联性且可以反映剧情的视频摘要。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的第一种视频生成方法的流程示意图；

图2为图1中步骤S102的一种具体实施例的流程示意图；

图3为图2中步骤S1021的一种具体实施例的流程示意图；

图4为图2中步骤S1022的一种具体实施例的流程示意图；

图5为一种利用目标直线和目标曲线确定平均直线上的点的示意图；

图6为图2中步骤S1024的一种具体实施例的流程示意图；

图7(a)为平均曲线的示意图；

图7(b)为利用平均曲线选取的目标视频的关于指定视频片段的多个样本点；

图8为根据各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序方法的流程示意图；

图9为若各个指定视频片段中，存在播放时间具有重叠时间段的片段，根据各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序方法的流程示意图；

图10为本发明实施例提供的第二种视频生成方法的流程示意图；

图11为本发明实施例的一种具体实施例的流程示意图；

图12为本发明实施例提供的第三种视频生成方法的流程示意图；

图13为本发明实施例提供的第四种视频生成方法的流程示意图；

图14为本发明实施例提供的第五种视频生成方法的流程示意图；

图15为本发明的另一个具体实施例的流程示意图；

图16为本发明实施例提供的一种视频生成装置的结构示意图；

图17为一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

当前，随着短视频、预告片等视频摘要的发展迅速，人们对于视频摘要的剧情流畅性、视频信息量和视频的故事完整性等内容要求也越来越高。相关技术中，可以通过人工的手动操作生成视频摘要，但是，上述方法会导致较低的视频生成效率，并且造成大量的成本耗费，因此，为了提高视频摘要的生成效率并降低大量的成本耗费，可以根据用户需求，通过视频处理软件，将内容较为精彩的视频片段进行简单的罗列，从而，得到相应的视频摘要，但是，仅仅是多个视频片段进行罗列，会使得视频摘要中的各个视频片段之间缺乏关联性，从而，导致视频摘要不能反映剧情。基于此，如何在提高视频生成效率的前提下，使得所生成的视频摘要可以反映剧情，成为当前亟需解决的问题。

为了解决上述技术问题，本发明实施例提供了一种视频生成方法。其中，该方法可以适用于各种需要进行视频生成的应用场景，例如，生成电影预告片、生成电视剧的前情提要等。并且，该方法可以应用于笔记本电脑、平板电脑、台式电脑等各类电子设备中，以下简称电子设备。基于此，本发明实施例不对该方法的应用场景和执行主体进行限定。

本发明实施例提供的一种视频生成方法，可以包括如下步骤：

获取目标文本，并在指定视频集合中选取与所述目标文本中的每个句子对应的初始视频片段；

从所述每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段；其中，每个初始视频片段的播放时间为：该初始视频片段在所述指定视频集合中的播放时间；

根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序，并按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频；其中，每个指定视频片段的内容标签包括：该指定视频片段的播放时间或该指定视频片段对应的句子的序号，每个句子的序号为：该句子在所述目标文本中的排序。

下面结合附图，对本发明实施例提供的一种视频生成方法进行具体说明。

图1为本发明实施例提供的一种视频生成方法的流程示意图，如图1所述，该方法包括如下步骤S101-S104。

S101：获取目标文本，并在指定视频集合中选取与目标文本中的每个句子对应的初始视频片段。

在利用指定视频集合生成新的视频时，可以首先确定新的视频想要表达的视频内容，从而，电子设备可以首先获取用于描述该视频内容的文本，作为目标文本。例如，所希望生成的新的视频为讲述某个童话故事的视频，电子设备可以首先获取该童话故事的故事文本，作为目标文本。又例如，所希望生成的新的视频为关于某个电影的预告片，电子设备可以首先获取关于该电影的故事梗概，作为目标文本。

可选的，上述目标文本可以是电子设备生成的，从而，电子设备生成上述目标文本的过程，即为电子设备获取该目标文本的过程。

可选的，上述目标文本可以是用户编写的，用户可以向电子设备输入所编写目标文本，从而，电子设备可以获取用户输入的目标文本。

进而，在获取目标文本后，电子设备便可以确定上述目标文本中所包括的各个句子。

可选的，电子设备可以基于预定的分隔符，对目标文本进行分隔，得到至少一个子文本，则所得到的每个子文本即为该目标文本中所包括的一个句子。

其中，上述预定的分隔符可以包括“，”、“。”、“；”、“？”、“！”等各类语言文字中用于对目标文本中的文字进行分割的符号中的至少一个，对此，本发明实施例不做具体限定。例如，可以将“。”作为分隔符，也可以将“，”、“。”、“；”、“？”和“！”均作为分隔符等。

可以首先检测目标文本中所包括的分隔符，从而，可以将上述目标文本中的第一个文字至第一个分隔符之前的文字，确定为上述目标文本中的第一个子文本，即确定为上述目标文本中的第一个句子；将最后一个文字至最后一个分隔符之后的文字，确定为上述目标文本中的最后一个子文本，即确定为上述目标文本中的最后一个句子；并将除上述第一个子文本和最后一个子文本外的各个文字中，位于上述两个分隔符之间的文字确定为目标文本的一个子文本，即确定为上述目标文本中的一个句子。

例如，目标文本为“一个月黑风高的杀人夜，传说中的雌雄双煞从天而降，打乱了客栈的安稳日子。家世显赫、从小娇生惯养的G，父亲是一代大侠，始终把她笼罩在阴影之下。从小争胜好胜的她，毅然选择了一条离家出走独闯江湖的路，却在第一站，被扣在了客栈，从此开始了艰苦卓绝的杂役生涯。”。则将“。”作为上述目标文本中的分隔符，则可以得到上述目标文本中的三个句子，且该三个句子分别为：第一个句子：“一个月黑风高的杀人夜，传说中的雌雄双煞从天而降，打乱了客栈的安稳日子。”；第二个句子：“家世显赫、从小娇生惯养的G，父亲是一代大侠，始终把她笼罩在阴影之下。”；第三个句子：“从小争胜好胜的她，毅然选择了一条离家出走独闯江湖的路，却在第一站，被扣在了客栈，从此开始了艰苦卓绝的杂役生涯。”。

这样，在确定出上述目标文本中所包括的各个句子后，便可以根据每个句子的文本内容，在指定视频集合中选取与每个句子对应的初始视频片段。

其中，指定视频集合是指与目标文本相关，且用于生成用于反映目标文本的文本内容的目标视频的视频集合，且该指定视频集合中可以包括一个视频，或多个视频。例如，当目标文本为某个电影的故事梗概，所希望生成的目标视频为该电影的预告片时，则指定视频集合为该电影的电影原片；又例如，当目标文本为某个电视剧的故事梗概，所希望生成的目标视频为该电视剧的剧情简介时，则指定视频集合为该电视剧的全部剧集。

由于在指定视频集合中，可能出现多处反映相同或相近情节的片段，因此，在选取上述目标文本中的每个句子对应的初始视频片段时，一个句子可以对应一个初始视频片段，也可以对应多个初始视频片段。其中，每个句子对应的初始视频片段为：反映该句子的文本内容的视频片段。

例如，目标文本中的某个句子为：“一个月黑风高的杀人夜，传说中的雌雄双煞从天而降，打乱了客栈的安稳日子。”，则该句子对应的初始视频片段中可以包括：“夜晚”、“雌雄双煞”和“客栈”等反映该句子的文本内容的视频内容。

S102：从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段。

其中，每个初始视频片段的播放时间为该初始视频片段在指定视频集合中的播放时间。

由于指定视频集合可以包括一个或多个视频，因此，在确定各个初始视频片段的播放时间时，若指定视频集合是一个视频，则每个初始视频片段的播放时间为该初始视频片段在指定视频集合中的播放时间，例如，指定视频集合是某个电影的电影原片，则每个初始视频片段的播放时间即为该初始片段视频在该电影原片中的播放时间；若指定视频集合是多个视频时，则每个初始视频片段的播放时间包括：该初始视频片段所在视频的序号和该初始片段在所在视频中的播放时间，例如，指定视频集合是某个电视剧的全部剧集，则每个初始视频片段的播放时间包括：该初始视频片段所在剧集的集数和该初始视频片段在所在剧集中的播放时间。

其中，在确定每个句子对应的初始视频片段时，可能会出现一个句子对应多个初始视频片段的情况。考虑到目标视频的时长、用于拼接目标视频的各个视频片段之间的连贯性等各项需求，可以基于实际应用中的需求，设置指定时间条件，从而，针对对应于多个初始视频片段的句子，可以在该句子对应的多个初始视频片段中，选取播放时间满足指定时间要求的指定视频片段。

也就是说，在得到上述目标文本中的每个句子对应的初始视频片段后，针对对应于多个初始视频片段的句子，便可以从该句子对应的初始视频片段中，选取播放时间满足指定时间要求的初始视频片段，并将所选取的初始视频片段作为该句子对应的指定视频片段。

例如，在指定视频集合包括一个视频的情况下，目标文本包括三个句子，其中：目标文本中的第一个句子对应的初始视频片段为：初始视频片段a和初始视频片段b，其中，初始视频片段a的播放时间为15秒到30秒，则该初始视频片段a的播放时长为15秒，初始视频片段b的播放时间为20秒到40秒，则该初始视频片段b的播放时长为20秒；目标文本中的第二个句子对应的初始视频片段为：初始视频片段c和初始视频片段d，其中，初始视频片段c的播放时间为45秒到1分05秒，则该初始视频片段c的播放时长为20秒，初始视频片段d的播放时间为49秒到1分19秒，则该初始视频片段d的播放时长为30秒；目标文本中的第三个句子对应的初始视频片段为：初始视频片段e和初始视频片段f，其中，初始视频片段e的播放时间为1分15秒到1分50秒，则该初始视频片段e的播放时长为45秒，初始视频片段f的播发时间为1分03秒到1分50秒，则该初始视频片段f的播放时长为47秒。

进而，指定时间要求为根据播放时间所确定的播放时长与预设的标准时长的差距不大于5秒，并且，第一个句子对应的标准时长为10秒，第二个句子对应的标准时长为35秒，第三个句子对应的标准时长为40秒。其中：

针对目标文本中的第一个句子，满足该句子对应的指定视频片段的播放时长范围为5秒到15秒，则初始视频片段a的播放时长为15秒，15＝15，则初始视频片段a的播放时间满足指定时间要求，初始视频片段a可以作为第一个句子对应的指定视频片段；初始视频片段b的播放时长为20秒，20>15，初始视频片段b的播放时间不满足指定时间要求，初始视频片段b不可以作为第一个句子对应的指定视频片段。针对目标文本中的第二个句子，满足该句子对应的指定视频片段的播放时长范围为30秒到40秒，则初始视频片段c的播放时长为20秒，20<30，初始视频片段c的播放时间不满足指定时间要求，初始视频片段c不可以作为第二个句子对应的指定视频片段；初始视频片段d的播放时长为30秒，30＝30，初始视频片段d的播放时间满足指定时间要求，初始视频片段d可以作为第二个句子对应的指定视频片段。针对目标文本中的第三个句子，满足该句子对应的指定视频片段的播放时长范围为35秒到45秒。则初始视频片段e的播放时长为45秒，45＝45，初始视频片段e的播放时间满足指定时间要求，初始视频片段e可以作为第三个句子对应的指定视频片段；初始视频片段f的播放时长为47秒，45<47，初始视频片段f的播放时间不满足指定时间要求，初始视频片段f不可以作为第三个句子对应的指定视频片段。

这样，便可以确定目标文本中的第一个句子对应的指定视频片段为：初始视频片段a；目标文本中的第二个句子对应的指定视频片段为：初始视频片段d；目标文本中的第三个句子对应的指定视频片段为：初始视频片段e。

可选的，可以根据每个句子对应的初始视频片段的播放时间确定该初始视频片段的播放时长，并从每个句子对应的初始视频片段中选择播放时长最短的视频片段，作为该句子对应的指定视频片段。

可选的，可以根据每个句子对应的初始视频片段的播放时间确定该初始视频片段的播放时长，并从每个句子对应的初始视频片段中选择播放时长最长的视频片段，作为该句子对应的指定视频片段。

可选的，可以根据每个句子对应的初始视频片段的播放时间确定该初始视频片段的播放时长，然后，计算全部初始片段的播放时长的平均值，作为关于指定视频片段的时长的平均值，并从每个句子对应的初始视频片段中选择播放时长距离上述平均值最近的视频片段，作为该句子对应的指定视频片段。

其中，上述可选的实施方式仅仅是对上述步骤S102的举例说明，任何能够实现上述步骤S102的具体实现方式均属于本发明实施例的保护范围。

S103：根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序；

S104：按照拼接顺序，对各个指定视频片段进行拼接，得到目标视频。

其中，每个指定视频片段的内容标签包括：该指定视频片段的播放时间或该指定视频片段对应的句子的序号，每个句子的序号为：该句子在目标文本中的排序。

在得到各个指定视频片段后，电子设备可以确定该指定视频片段的播放时间和该指定视频片段对应的句子的序号。

其中，对于上述目标文本中的每个句子，可以按照该句子在上述目标文本中的顺序，得到该句子的序号，也就是说，可以将该句子在上述目标文本中的顺序作为该句子的序号。

例如，目标文本为“一个月黑风高的杀人夜，传说中的雌雄双煞从天而降，打乱了客栈的安稳日子。家世显赫、从小娇生惯养的G，父亲是一代大侠，始终把她笼罩在阴影之下。从小争胜好胜的她，毅然选择了一条离家出走独闯江湖的路，却在第一站，被扣在了客栈，从此开始了艰苦卓绝的杂役生涯。”，并且，上述目标文本包括三个句子，该三个句子分别为：“一个月黑风高的杀人夜，传说中的雌雄双煞从天而降，打乱了客栈的安稳日子。”；“家世显赫、从小娇生惯养的G，父亲是一代大侠，始终把她笼罩在阴影之下。”；“从小争胜好胜的她，毅然选择了一条离家出走独闯江湖的路，却在第一站，被扣在了客栈，从此开始了艰苦卓绝的杂役生涯。”。

进而，可以确定上述三个句子的序号分别为：句子“一个月黑风高的杀人夜，传说中的雌雄双煞从天而降，打乱了客栈的安稳日子。”的序号为1；句子“家世显赫、从小娇生惯养的G，父亲是一代大侠，始终把她笼罩在阴影之下。”的序号为2；句子“从小争胜好胜的她，毅然选择了一条离家出走独闯江湖的路，却在第一站，被扣在了客栈，从此开始了艰苦卓绝的杂役生涯。”的序号为3。

在确定出每个指定视频片段的播放时间和每个指定视频片段对应的句子的序号后，针对每个指定视频片段，可以将该指定视频片段的播放时间或该指定视频片段对应的句子的序号确定为该指定视频片段的内容标签，进而，便可以根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序。

也就是说，可以根据各个指定视频片段的播放时间，或者，根据各个指定视频片段对应的句子序号，确定各个指定视频片段的拼接顺序，

这样，在确定出上述各个指定视频片段的拼接顺序后，便可以按照该拼接顺序，将各个指定视频片段进行拼接，得到上述目标文本对应的目标视频。

例如，可以将各个指定视频片段的播放时间由先到后的顺序，确定为各个指定视频片段的拼接顺序，并按照上述拼接顺序，对各个指定视频片段进行拼接，得到目标视频。又例如，可以将各个指定视频片段对应的句子的序号由小到大的顺序，确定为各个指定视频片段的拼接顺序，并按照上述拼接顺序，对各个指定视频片段进行拼接，得到目标视频。

根据每个句子对应的初始视频片段的播放时间，可以确定每个句子对应的初始视频片段的播放时长。其中，在基于每个句子对应初始视频片段的播放时长与预设的标准时长的长度关系，选取该句子对应的指定视频片段时，可能会出现一个句子存在多个指定视频片段的情况，从而，导致生成的目标视频不能满足实际应用的需求，例如，目标视频的时长过长，或者，目标视频所反映的剧情的逻辑混乱等。

基于此，可选的，一种具体实现方式中，如图2所示，上述步骤S102，从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段，可以包括如下步骤S1021-S1024：

S1021：根据全部句子的序号以及全部初始视频片段的播放时间，确定目标直线。

在本具体实现方式中，在选取出目标文本中的每个句子对应的初始视频片段后，可以得到目标文本中的全部句子的序号以及所选取的全部初始视频片段的播放时间，从而，利用上述全部句子的序号以及全部初始视频片段的播放时间，确定目标直线。

可选的，一种具体实现方式中，如图3所示，上述S1021，可以包括如下步骤S211-S212：

S211：根据全部初始视频片段的播放时间，确定全部初始视频片段的播放总时长；

S212：确定斜率为全部句子的序号的数量与播放总时长的比值且截距为零的目标直线。

在本具体实现方式中，可以根据每个初始视频片段的播放时间，确定该初始视频片段的播放时长，进而，将全部的初始视频片段的播放时长相加，得到全部初始视频片段的播放总时长；并且，在确定目标文本中的每个句子的序号后，可以确定目标文本中的全部句子的序号的数量，从而，可以计算全部句子的序号的数量与上述得到的播放总时长的比值，进而，构建以上述比值作为斜率，且截距为零的目标直线。

其中，假设上述所计算得到的比值为k，则所构建的目标直线可以表示为：y＝kx，并且，当在二维坐标系中绘制该目标直线时，该目标直线为过原点且至少位于第一象限内的直线。

可选的，可以建立以序号为纵坐标，且播放时间为横坐标的二维坐标系，并在该二维坐标系中，绘制斜率为上述比值且截距为零的目标直线。

S1022：基于每个句子的序号和该句子对应的初始视频片段的播放时间的对应关系，进行曲线拟合，得到目标曲线。

在本具体实现方式中，针对每个句子，可以确定该句子的序号和该句子对应的初始视频片段的播放时间的对应关系，进而，便可以基于所确定的各个对应关系，进行曲线拟合，得到目标曲线。

可选的，针对每个句子，可以确定该句子的序号和该句子对应的初始视频片段的播放时间的对应关系，进而，在预设坐标系中确定用于表征该对应关系的点的坐标，其中，可以将上述用于表征该对应关系的点称为该句子的样本点。例如，可以将该句子的序号作为预设坐标系中用于表征该对应关系的点的纵坐标，并将基于该句子对应的初始视频片段的播放时间确定的数值作为预设坐标系中用于表征该对应关系的点的横坐标，示例性的，将该句子对应的初始视频片段的起始播放时间作为预设坐标系中用于表征该对应关系的点的横坐标等。

这样，在得到目标文本中全部句子的样本点的坐标后，便可以基于所得到的各个坐标，进行曲线拟合，得到目标曲线。

可选的，一种具体实现方式中，如图4所示，上述步骤S1022，可以包括如下步骤S221-S223：

S221：确定每个初始视频片段的播放时间的中间时刻；

S222：计算每个句子的序号和该句子对应的每个初始视频片段的播放时间的中间时刻的指定系数；

S223：利用指定参数下的指定多项式对各个指定系数进行曲线拟合，得到目标曲线。

在本具体实现方式中，对于每个视频片段来说，通常，该视频片段的中间部分的视频内容是该视频片段中较为重要的内容，并且，可以包含更多的信息量，从而，该视频片段的中间部分的视频内容通常也是用户较为关注的内容。

因此，在确定上述目标曲线时，可以首先确定每个初始视频片段的播放时间的中间时刻，然后，计算每个句子的序号和该句子对应的每个初始视频片段的播放时间的中间时刻的指定系数，从而，可以利用指定参数下的指定多项式对上述所计算得到的各个指定系数进行曲线拟合，得到目标曲线。

可选的，可以利用的Lasso(Least absolute shrinkage and selectionoperator，套索)算法对每个句子的序号和该句子对应的每个初始视频片段的播放时间的中间时刻的关系拟合到度数为2的多项式曲线上，得到目标曲线。

例如，目标曲线为：其中，指定参数W^T通过Lasso算法得到的。

S1023：确定目标直线和目标曲线的平均曲线。

在得到上述目标直线和目标曲线后，便可以进一步确定上述目标直线和目标曲线的平均曲线。

可选的，上述目标直线的函数表达式为y₁＝f(x₁)，上述目标曲线的函数公式y₂＝f(x₂)，从而，上述目标直线和上述目标曲线的平均曲线的函数表达式可以为

可选的，可以预先构建二维坐标系，并且，该二维坐标系的横轴为句子对应的初始视频片段的播放时间的中间时刻，该二维坐标系的纵轴为句子的序号，从而，可以在该二维坐标系中绘制上述目标直线和目标曲线。进而，可以确定全部初始视频片段的播放时间的中间时刻，并针对所确定的每个中间时刻，在所绘制的目标直线和目标曲线中，分别确定横坐标为该中间时刻的点，并计算所确定的两个点的纵坐标的平均值，从而，可以在该二维坐标系中确定横坐标为该中间时刻，纵坐标为所计算得到的平均值的目标点，作为该中间时刻的目标点。这样，便可以在该二维坐标系中，确定出全部中间时刻的目标点，从而，便可以对上述所确定的全部目标点进行曲线拟合，得到上述目标直线和上述目标曲线的平均曲线。

示例性的，如图5所示，在预先构建的二维坐标系中，确定某个初始视频片段的播放时间的中间时刻为j，从而，可以在目标直线501上确定横坐标为该中间时刻x的点A的纵坐标为y₁，并在目标曲线502上确定横坐标为该中间时刻x的点B的纵坐标为y₂，则可以计算上述y₁和y₂的平均值y₃，作为该中间时刻x的目标点的纵坐标，从而，可以在该二维坐标系中，确定该目标中间时刻x的目标点C。遍历该二维坐标系中，全部初始视频片段的播放时间的中间时刻，便可以在该二维坐标系中确定每个中间时刻的目标点，从而，根据所确定的各个目标点，确定上述目标直线501和目标曲线502的平均曲线。

S1024：利用平均曲线，从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段。

在得到目标直线和目标曲线的平均曲线后，便可以利用该平均曲线，从每个句子对应的初始视频片段中，播放时间满足指定时间要求的指定视频片段。

可选的，一种具体实现方式中，如图6所示，上述S1024，可以包括如下步骤S241-S242：

S241：利用平均曲线，找到各个句子的序号对应的指定播放时刻；

S242：从该句子的序号对应的初始视频片段中，选取播放时间的中间时刻与该句子的序号对应的指定播放时刻的时间差不大于指定时长的指定视频片段。

在本具体实现方式中，由于上述目标曲线是利用指定参数下的指定多项式对各个指定系数进行曲线拟合得到的，而每个指定系数为：每个句子的序号和该句子对应的每个初始视频片段的播放时间的中间时刻的指定系数，因此，所得到的平均曲线为：用于表征关于句子的序号以及句子对应的视频片段的播放时间的中间时刻的对应关系的曲线。

基于此，针对目标文本中的每个句子，可以利用该平均曲线，确定该句子的序号对应的指定播放时刻。

例如，当在横坐标为句子对应的初始视频片段的播放时间的中间时刻，纵坐标为句子的序号的二维坐标系中绘制该平均曲线时，可以针对目标文本中的每个句子，在该平均曲线中，确定纵坐标为该句子的序号的点，并进一步确定该点的横坐标，则所确定的横坐标即为该句子的序号对应的指定播放时刻。

这样，针对目标文本中的每个句子，便可以从该句子的序号对应的初始视频片段中，选取播放时间的中间时刻与该句子的序号对应的指定播放时刻的时间差不大于指定时长的视频片段，作为该句子对应的指定视频片段。

例如，指定时长可以为5秒。若某个句子的序号为1，且在上述平均曲线中，纵坐标为1的点的横坐标为50秒，则序号1对应的指定播放时刻为50秒；其中，该句子对应的初始视频片段为：初始视频片段a和初始视频片段b，且初始视频片段a的播放时间的中间时刻为46秒，初始视频片段b的播放时间的中间时刻为56秒，由此可见，对于初始视频片段a而言，50-46＝4，4秒<5秒，因此，初始视频片段a的播放时间的中间时刻46秒与序号1对应的指定播放时刻50秒的时间差小于指定时长，则可以将初始视频片段a确定为该句子对应的指定视频片段；对于初始视频片段b而言，56-50＝6，6秒>5秒，因此，初始视频片段b的播放时间的中间时刻56秒与序号1对应的指定播放时刻50秒的时间差大于指定时长，则初始视频片段b不能确定为该句子对应的指定视频片段。从而，该句子对应的指定视频片段为上述初始视频片段a。

示例性的，如图7(a)所示，图7(a)中的坐标系的横坐标为句子对应的初始视频片段的播放时间的中间时刻，纵坐标为句子的序号，并且，图7(a)中的曲线700为在上述坐标系中绘制的平均曲线，图7(a)中的各个矩形块701为在上述坐标系中绘制的各个初始视频片段对应的样本点。每个样本点的纵坐标为：该样本点对应的初始视频片段的序号；每个样本单的横坐标为：该样本点对应的初始视频片段的播放时间的中间时刻。其中，每个初始视频片段的序号为：该初始视频片段对应的句子的序号。进而，便可以利用平均曲线700，从每个句子的序号对应的初始视频片段中，选取播放时刻与该句子的序号对应的指定播放时刻的距离不大于指定时长的指定视频片段。如图7(b)所示，图7(b)中的各个矩形块702即为所选取的每个句子对应的指定视频片段对应的样本点。

在执行上述步骤S103中，根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序的步骤时，可以将各个指定视频片段的播放时间或各个指定视频片段对应的句子的序号确定为该指定视频片段的内容标签，从而，可以根据不同的内容标签，采用不同的方式确定拼接顺序。

可选的，一种具体实现方式中，将每个指定视频片段的播放时间确定为该指定视频片段的内容标签，则上述步骤S103中，根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序的步骤，可以包括如下步骤31：

步骤31：根据各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序。

在本具体实现方式中，每个指定视频片段的内容标签可以包括该指定视频片段的播放时间，且该播放时间为该指定视频片段在指定视频集合中的播放时间，因此，可以根据各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序。

例如，共有3个指定视频片段：指定视频片段1、指定视频片段2和指定视频片段3，其中，指定视频片段1在指定视频集合中的播放时间为10秒到59秒，指定视频片段3在指定视频集合中的播放时间为1分26秒到2分30秒，指定视频片段2在指定视频集合中的播放时间为3分10秒到4分59秒，则可以按照上述3个指定视频片段在指定视频集合中的播放时间由先到后的顺序对上述3个指定视频片段进行排序，得到上述3个指定视频片段的拼接顺序依次为：指定视频片段1、指定视频片段3和指定视频片段2，从而，在进行拼接时，将指定视频片段3的开头与指定视频片段1的结尾连接，再将指定视频片段2的开头和指定视频片段3的结尾连接，得到目标视频。

又例如，共有3个指定视频片段：指定视频片段1、指定视频片段2和指定视频片段3，其中，指定视频片段1在指定视频集合中的播放时间为10秒到59秒，指定视频片段3在指定视频集合中的播放时间为48秒到1分20秒，指定视频片段2在指定视频集合中的播放时间为1分10秒到1分30秒，则可以按照上述3个指定视频片段在指定视频集合中的播放时间由先到后的顺序对上述3个指定视频片段进行排序，得到上述3个指定视频片段的拼接顺序依次为：指定视频片段1、指定视频片段3和指定视频片段2，从而，在进行拼接时，将指定视频片段3与指定视频片段1中的相同部分进行重合，再将指定视频片段2和指定视频片段3中的相同部分进行重合，得到目标视频。

可选的，一种具体实现方式中，如图8所示，上述步骤31，可以包括如下步骤S801-S804：

S801：按照所得到的各个指定视频片段的播放时间由先到后的顺序，排列各个指定视频片段的序号，得到待划分序号组；

S802：按照第一方向遍历待划分序号组，在遍历到待划分序号组中的每个序号时，确定已遍历序号中的最小值；并按照与第一方向相反的第二方向遍历待划分序号组，在遍历到待划分序号组中的每个序号时，确定已遍历序号中的最大值；针对待划分序号中的每个序号，若所确定的最大值小于在第二方向上该序号的下一序号处确定的最小值，则将该序号确定为待划分序号；

S803：按照待划分序号，将待划分序号组划分为各个第二类分组，并将各个第二类分组确定为各个目标分组。

其中，待划分序号为所在第二类分组中的最后一个序号。

在本具体实现方式中，指定视频片段的序号为：该指定视频片段对应的句子的序号。由于在指定视频集合中存在倒叙、插叙等表现手法，因此，在生成目标视频时，可能会将播放时间靠后的指定视频片段所对应的句子在目标文本中处于靠前的位置，例如，序号为1的指定视频片段的播放时间为第30秒-第35秒；序号为2的指定视频片段的播放时间为第10秒-第20秒，序号为3的指定视频片段的播放时间为第1秒-第7秒。

这样，在将指定视频片段按照播放时间由先到后的顺序进行排序时，各个指定视频片段的序号的顺序可以不再是由小到大排列，而出现顺序混乱的情况。

因此，可以首先按照所得到的各个指定视频片段的播放时间由先到后的顺序，排列各个指定视频片段的序号，得到待划分序号组。

例如，共有5个指定视频片段：指定视频片段1、指定视频片段2、指定视频片段3、指定视频片段4和指定视频片段5，其中，指定视频片段1的播放时间为：第1秒-第7秒，且指定视频片段1的序号为：1；指定视频片段2的播放时间为：第17秒-第20秒，且指定视频片段2的序号为：2；指定视频片段3的播放时间为：第12秒-第16秒，且指定视频片段3的序号为：3；指定视频片段4的播放时间为：第8秒-第10秒，且指定视频片段4的序号为：4；指定视频片段5的播放时间为：第22秒-第30秒，且指定视频片段5的序号为：5。则按照上述5个指定视频片段的播放时间由先到后的顺序，排列各个指定视频片段的序号，可以得到待划分序号组：1、4、3、2和5。

进而，在得到上述待划分序号组后，便可以按照第一方向遍历上述待划分序号组，其中，在遍历到上述待划分序号组中的每个序号时，确定已遍历序号中的最小值；并且，可以按照与上述第一方向相反的第二方向遍历上述待划分序号组，其中，在遍历到上述待划分序号组中的每个序号时，确定已遍历序号中的最大值。

这样，针对上述待划分序号组中的每个序号，若所确定的最大值小于在该序号的下一序号处确定的最小值，则将该序号确定为待划分序号，然后，便可以按照上述待划分序号，将上述待划分序号组划分为各个第二类分组，并将各个第二类分组确定为各个目标分组。

其中，对于每个第二类分组而言，上述待划分序号为该待划分序号所在的第二类分组中的最后一个序号。并且，每个目标分组中可以包括一个序号，也可以包括多个序号。

可选的，上述第一方向可以为从右到左，则上述第二方向可以为从左到右。

例如，针对上述举例中的待划分序号组：1、4、3、2和5，如表1所示，按照从右到左的方向遍历上述待划分序号组，在遍历到上述待划分序号组中的每个序号时，确定已遍历序号中的最小值分别为：1、2、2、2和5，然后，按照从左到右的方向遍历上述待划分序号组，在遍历到上述待划分序号组中的每个序号时，确定已遍历序号中的最大值分别为:1、4、4、4和5。这样，针对上述待划分序号组中的序号1，所确定的最大值1小于在序号1从左到右方向上的下一序号4处所确定的最小值2，则将序号1确定为待划分序号；针对上述待划分序号组中的序号2，所确定的最大值4小于在序号2从左到有方向上的下一个序号5处所确定的最小值5，则将序号2确定为待划分序号。

然后，按照上述待划分序号1和带划分序号2，将上述待划分序号组划分为3个第二类分组，其中，第二类分组O包括序号1、第二类分组H包括序号2、序号3和序号4和第二类分组K包括序号5。因此，可以将第二类分组O确定为目标分组o，将第二类分组H确定为目标分组h，以及将第二类分组K确定为目标分组k。

表1

S804：基于各个目标分组和各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序。

在本具体实现方式中，在按照上述待划分序号，对上述待划分序号组进行划分，得到各个目标分组后，便可以基于各个目标分组和各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序。

可选的，一种具体实现方式中，上述步骤S804，可以包括如下步骤8041-8043：

步骤8041：将每个目标分组中包括的各个序号对应的指定视频片段的最先播放时间，确定为该组的分组播放时刻；并将各个分组播放时刻由先到后的顺序，确定为各个目标分组的第三拼接子顺序；

步骤8042：针对每个目标分组，将该组中包括的各个序号对应的指定视频片段的播放时间由先到后的顺序，确定为该组中包括的各个序号对应的指定视频片段的第四拼接子顺序；

步骤8043：基于第三拼接子顺序和各个第四拼接子顺序，确定各个指定视频片段的拼接顺序。

在本具体实现方式中，针对每个目标分组，可以首先确定该目标分组中包括的各个序号对应的指定视频片段的播放时间，从而，可以将所确定的各个播放时间中的最先播放时间，确定为该组的分组播放时刻；然后，将各个分组播放时刻由先到后的顺序，确定为各个目标分组的第三拼接子顺序。接着，针对每个目标分组，将该组中包括的各个序号对应的指定视频片段的播放时间由先到后的顺序，确定为该组中包括的各个序号对应的指定视频片段的第四拼接子顺序，进而，便可以基于上述第三拼接子顺序和各个第四拼接子顺序，确定各个指定视频片段的拼接顺序。

例如，针对上述举例中的目标分组o、目标分组h和目标分组k，其中，目标分组h包括：指定视频片段2的序号2、指定视频片段3的序号3和指定视频片段4的序号4，并且，指定视频片段2的播放时间为：第17秒-第20秒，指定视频片段3的播放时间为：第12秒-第16秒，指定视频片段4的播放时间为：第8秒-第10秒。目标分组o包括：指定视频片段1的播放时间为：第1秒-第7秒。目标分组k包括：指定视频片段5的播放时间为：第22秒-第30秒。

进而，可以确定目标分组o的分组播放时刻为第1秒，目标分组h的分组播放时刻为第8秒，目标分组k的分组播放时刻为第22秒。然后，将目标分组o、目标分组h和目标分组k按照分组播放时刻由先到后的顺序，排列各个目标分组，可以得到的第三拼接子顺序依次为：目标分组o、目标分组h和目标分组k。

然后，针对目标分组o而言，该目标分组的第四拼接子顺序为：序号为1的指定视频片段1。针对目标分组h而言，该目标分组的第四拼接顺序依次为：序号为4的指定视频片段4、序号为3的指定视频片段3和序号为2的指定视频片段2。针对目标分组k而言，该目标分组的第四拼接子顺序为：序号为5的指定视频片段5。

基于上述第三拼接子顺序和第四拼接子顺序，可以确定上述目标分组o、目标分组h和目标分组k中所有的指定视频片段的拼接顺序依次为：指定视频片段1、指定视频片段4、指定视频片段3、指定视频片段2和指定视频片段5。

可选的，一种具体实现方式中，上述步骤S804，可以包括如下步骤8044-8045：

步骤8044：将每个目标分组中包括的各个序号对应的指定视频片段，按照播放时间由先到后的顺序进行拼接，得到该组对应的第二视频片段；

步骤8045：将各个第二视频片段的播放时间由先到后的顺序，确定为各个第二视频片段的拼接顺序。

在本具体实现方式中，可以首先将每个目标分组中包括的各个序号对应的指定视频片段，按照上述各个指定视频片段的播放时间由先到后的顺序进行拼接，得到一个新的视频片段，作为该组对应的第二视频片段，然后，确定各个第二视频片段的播放时间，并将各个第二视频片段按照由先到后的顺序进行排列，得到各个第二视频片段的拼接顺序。

将目标分组h中包括的各个序号对应的指定视频片段按照播放时间的顺序，依次排列得到的顺序为：指定视频片段4、指定视频片段3和指定视频片段2，并将上述3个指定视频片段按照上述顺序进行拼接，得到一个新的指定视频片段，作为该目标分组h对应的第二视频片段，且该目标分组h对应的第二视频片段的播放时间为：第8秒-第20秒。

由于，目标分组o中只包括序号1对应的指定视频片段1，因此，该目标分组o对应的第二视频片段为指定视频片段1且该目标分组o对应的第二视频片段的播放时间为：第1秒-第7秒。目标分组k中只包括序号5对应的指定视频片段5，因此，该目标分组k对应的第二视频片段为：指定视频片段5且该目标分组k对应的第二视频片段的播放时间为：第22秒-第30秒。

将上述目标分组o对应的第二视频片段、目标分组h对应的第二视频片段和目标分组k对应的第二视频片段的播放时间，按照播放时间由先到后的顺序进行排列，得到的顺序为：目标分组o对应的第二视频片段、目标分组h对应的第二视频片段和目标分组k对应的第二视频片段，作为各个第二视频片段的拼接顺序。

对于电影、电视剧等各类视频而言，出于故事情节表现的原因，可以在不同的播放时间播放相同或相似的视频画面，因此，在基于指定视频集合确定目标文本中的各个句子对应的指定视频片段时，不同的指定视频片段中可能存在重叠片段。因此，在不同的指定视频片段中存在重叠片段时，在确定上述目标分组时，可以基于各个指定视频片段之间的重叠情况，对各个指定视频片段进行分组，从而，利用上述基于各个指定视频片段之间的重叠情况的分组结果和所得到的第二类分组，确定各个目标分组。

基于此，可选的，一种具体实现方式中，若各个指定视频片段中，存在播放时间具有重叠时间段的片段，如图9所示，上述步骤31，可以包括如下步骤S901-S908：

S901：按照所得到的各个指定视频片段的播放时间由先到后的顺序，排列各个指定视频片段的序号，得到待划分序号组；

S902：按照第一方向遍历待划分序号组，在遍历到待划分序号组中的每个序号时，确定已遍历序号中的最小值；并按照与第一方向相反的第二方向遍历待划分序号组，在遍历到待划分序号组中的每个序号时，确定已遍历序号中的最大值；针对待划分序号中的每个序号，若所确定的最大值小于在第二方向上该序号的下一序号处确定的最小值，则将该序号确定为待划分序号；

S903：按照待划分序号，将待划分序号组划分为各个第二类分组。

其中，待划分序号为所在第二类分组中的最后一个序号。

在本具体实现方式中，上述步骤S901与上述步骤S801实现方式相同，上述步骤S902与上述S802实现方式相同，S903与上述步骤S803中，按照待划分序号，将待划分序号组划分为各个第二类分组的步骤实现方式相同，在此不再赘述。

其中，在得到上述各个第二类分组后，可以不直接把各个第二类分组确定为目标分组，而基于各个指定视频片段之间的重叠情况，对各个指定视频片段进行关于重叠的分组，从而，利用上述关于重叠的分组结果和上述第二类分组，确定各个目标分组。

S904：基于各个指定视频片段的播放时间，对各个指定视频片段的序号进行分组，得到第一类分组；

其中，每个第一类分组中的每个序号对应的指定视频片段的播放时间，与该组中除该序号之外的其他至少一个序号对应的指定视频片段的播放时间存在重叠时间段；

由于每个指定视频片段的播放时间为该指定视频片段在指定视频集合中的播放时间，那么，对于视频内容存在重叠的不同指定视频片段而言，该不同指定视频片段的播放时间存在重叠时间段，并且，该重叠时间段内所播放的视频内容即为该不同指定视频片段中所重叠的视频内容。

因此，可以首先确定各个指定视频片段的播放时间，对各个指定视频片段的序号进行分组，得到第一类分组，并且，每个第一类分组中的每个序号对应的指定视频片段的播放时间，与该组中除该序号之外的其他至少一个序号对应的指定视频片段的播放时间存在重叠时间段。

可选的，首先从各个指定视频片段中选取第一个视频片段，并在除该第一个视频片段之外的其他指定视频片段中，确定播放时间与该第一个视频片段的播放时间存在重叠时间段的第二个视频片段，从而，将该第一个视频片段的序号和该第二个视频片段的序号划分为一组；进而，在除该第一个视频片段和该第二个视频片段之外的其他指定视频片段中，确定播放时间与该第一个视频片段和/或该第二个视频的播放时间存在重叠时间段的第三个视频片段，从而，将该第三个视频片段的序号划分到该组中，即将该第一个视频片段的序号、该第二个视频片段的序号和该第三个视频片段的序号划分为一组，依次类推，直至未被划分到该组中的剩余指定视频片段的播放时间，均与该组中的全部序号对应的指定视频片段的播放时间不存在重叠时间段，从而，得到一个第一类分组；之后，针对未被分组的剩余指定视频片段，循环执行上述过程，最终得到各个第一类分组。

可选的，首先确定各个指定视频片段中，播放时间存在重叠时间段的指定视频片段，并将播放时间存在重叠时间段的各个目标视频分组的序号划分为一组，得到各个初始分组，其中，对于播放时间不与其他指定视频片段的播放时间存在重叠时间段的指定视频片段而言，将该指定视频片段的序号单独划分为一个初始分组；进而，确定每个初始分组所包括的序号对应的指定视频片段的播放时间，作为该初始分组的播放时间，并将播放时间存在重叠时间段的各个初始分组划分为一组，从而，得到各个第一类分组。

其中，上述可选的具体实现方式只是对上述步骤S904的举例说明，而非限定，任何能够对各个指定视频片段的序号进行分组，得到第一类分组，并保证每个第一类分组中的每个序号对应的指定视频片段的播放时间，与该组中除该序号之外的其他至少一个序号对应的指定视频片段的播放时间存在重叠时间段的实现方式，均属于本发明实施例的保护范围。

并且，上述步骤S904与上述步骤S901的执行顺序可以是任意的，只要保证步骤S901是在上述步骤S902之前执行，且步骤S903是在步骤S902之前执行即可。即上述步骤S904可以在上述步骤S901之前执行，也可以在上述步骤S901之后执行，还可以与上述步骤S901同时执行。

S905：合并包括相同序号的第一类分组和第二类分组，得到第三类分组；

其中，第三类分组包括：合并后的分组和未合并的第二类分组。

相应的，如图9所示，在本具体实现方式中，上述步骤S803中，将各个第二类分组确定为各个目标分组，可以包括如下步骤S906或S907：

S906：若第三类分组中不存在包括相同序号的组，则将第三类分组确定为目标分组。

S907：若第三类分组中存在包括相同序号的组，则合并包括相同序号的第三类分组，得到目标分组。

在本具体实现方式中，在得到各个第一类分组后，由于各个第一类分组和各个第二类分组中包括的均是指定视频片段的序号，因此，可以确定包括相同序号的第一类分组和第二类分组，并合并包括相同序号的上述第一类分组和第二类分组，得到各个第三类分组。

其中，针对每个第一类分组，若不存在与该第一类分组包括相同序号的第二类分组，则可以直接将该第一类分组确定为第三类分组；并且，针对每个第二类分组，若不存在与该第二类分组包括相同序号的第一类分组，则可以直接将该第二类分组确定为第三类分组。

并且，针对第一类分组，若存在多个与该第一类分组包括相同序号的第二类分组，则可以将该第一类分组分别与上述包括相同序号的每个第二类分组进行合并，得到多个第三类分组，所得到的每个第三类分组中均包括该第一类分组中的序号；同样的，针对每个第二类分组，若存在多个与该第二类分组包括相同序号的第一类分组，则可以将该第二类分组分别与上述包括相同序号的每个第一类分组进行合并，得到多个第三类分组，所得到的每个第三类分组中均包括该第二类分组中的序号。

基于此，若针对每个第一类分组，只存在一个与该第一类分组包括相同序号的第二类分组，且针对每个第二类分组，只存在一个与该第二类分组包括相同序号的第一类分组，则所得到的各个第三类分组中，不存在包括相同序号的组，从而，可以直接将所得到的各个第三类分组确定为各个目标分组。

若针对每个第一类分组，存在多个与该第一类分组包括相同序号的第二类分组，和/或，针对每个第二类分组，存在多个与该第二类分组包括相同序号的第一类分组，则所得到的各个第三类分组中，存在包括相同序号的组，从而，可以对各个第三类分组中，包括相同序号的第三类分组进行合并，得到各个目标分组。

例如，共有5个指定视频片段分别为：指定视频片段1的序号为1，且播放时间为：第1秒-第7秒；指定视频片段2的序号为2，且播放时间为：第15秒-第20秒；指定视频片段3的序号为3，且播放时间为：第9秒-第16秒；指定视频片段4的序号为4，且播放时间为：第8秒-第10秒；指定视频片段5的序号为5，且播放时间为：第22秒-第30秒。其中，序号为4的指定视频片段4和序号为3的指定视频片段3存在重叠片段，序号为3的指定视频片段3和序号为2的指定视频片段2存在重叠片段。因此，可以基于各个指定视频片段的播放时间，对各个指定视频片段的序号进行分组，得到第一类分组，该第一类分组包括：序号2、序号3和序号4。

针对上述举例中的第二类分组O、第二类分组H和第二类分组K，其中，第二类分组O包括：序号1；第二类分组H包括：序号2、序号3和序号4；第二类分组K包括：序号5。

然后，将包括相同序号的上述第一类分组和上述两个第二类分组进行合并，得到第三类分组M：序号1，第三类分组N：序号2、序号3和序号4以及第三类分组I：序号5。并且，上述3个第三类分组中不存在相同序号，进而，可以将上述第三类分组M，确定为目标分组m，将第三类分组N，确定为目标分组n，将第三类分组I，确定为目标分组i。

S908：基于各个目标分组和各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序。

其中，上述步骤S908的实现方式与上述步骤S804的实现方式相同，在此不再赘述。

可选的，一种具体实现方式中，将每个指定视频片段对应的句子的序号确定为该指定视频片段的内容标签，则上述步骤S103中，根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序，可以包括如下步骤32：

步骤32：根据各个指定视频片段的序号，确定各个指定视频片段的拼接顺序。

其中，每个指定视频片段的序号为：该指定视频片段对应的句子的序号。

在本具体实现方式中，每个指定视频片段的内容标签可以包括该指定视频片段的序号，且该指定视频片段的序号为该指定视频片段对应的句子的序号，因此，可以根据各个指定视频片段的序号，确定各个指定视频片段的拼接顺序。

例如，共有3个指定视频片段：指定视频片段1、指定视频片段2和指定视频片段3，其中，指定视频片段1的序号为1，指定视频片段2的序号为3以及指定视频片段3的序号为2，则可以按照各个指定视频片段的序号由小到大的顺序，确定各个指定视频片段的拼接顺序依次为：指定视频片段1、指定视频片段3和指定视频片段2。

可选的，一种具体实现方式中，上述步骤32，可以包括如下步骤321：

步骤321：将各个指定视频片段的序号由小到大的顺序，确定为各个指定视频片段的拼接顺序。

在本具体实现方式中，由于上述目标文本可以用于描述一段剧情，从而，该目标文本中的每个句子用于描述该剧情中的部分情节，并且，各个句子之间具有关联性。从而，所确定的各个句子对应的指定视频片段的内容可以分别反映上述剧情中的部分内容，并且，各个指定视频片段之间具有关联性。

这样，便可以将各个指定视频片段的序号按照由小到大的顺序进行排列，并将得到的顺序作为上述各个指定视频片段的拼接顺序。也就是说，可以按照每个句子在目标文本中的排列顺序，依次拼接每个句子对应的指定视频片段。

对于电影、电视剧等各类视频而言，出于故事情节表现的原因，可以在不同的播放时间播放相同或相似的视频画面，因此，在基于指定视频集合确定目标文本中的各个句子对应的指定视频片段时，不同的指定视频片段中可能存在重叠片段。因此，在不同的指定视频片段中存在重叠片段时，在确定上述目标分组时，可以基于各个指定视频片段之间的重叠情况，对各个指定视频片段进行分组，从而，利用上述基于各个指定视频片段之间的重叠情况的分组结果，确定各个指定视频片段的拼接顺序。

基于此，可选的，一种具体实现方式中，若各个指定视频片段中，存在播放时间具有重叠时间段的片段，上述步骤32，可以包括如下步骤322-323：

步骤322：基于各个视频片段的播放时间，对各个指定视频片段的序号进行分组，得到第一类分组；

其中，每个第一类分组中的每个序号对应的指定视频片段的播放时间，与该组中除该序号之外的其他至少一个序号对应的指定视频片段的播放时间存在重叠时间段。

步骤323：基于第一类分组中包括的各个序号中的最小序号，确定各个指定视频片段的拼接顺序。

在本具体实现方式中，由于每个指定视频片段的播放时间为该指定视频片段在指定视频集合中的播放时间，那么，对于视频内容存在重叠的不同指定视频片段而言，该不同指定视频片段的播放时间存在重叠时间段，并且，该重叠时间段内所播放的视频内容即为该不同指定视频片段中所重叠的视频内容。

其中，上述可选的具体实现方式仅仅是对上述步骤322的举例说明，而非限定，任何能够对各个指定视频片段的序号进行分组，得到第一类分组，并保证每个第一类分组中的每个序号对应的指定视频片段的播放时间，与该组中除该序号之外的其他至少一个序号对应的指定视频片段的播放时间存在重叠时间段的实现方式，均属于本发明实施例的保护范围。

这样，在得到上述各个第一类分组后，便可以确定每个第一类分组包括的各个序号中的最小序号，从而，便可以基于每个第一类分组中包括的各个指定视频片段的序号中的最小序号，确定各个指定视频片段的拼接顺序。

例如，共有4个指定视频片段：指定视频片段1、指定视频片段2、指定视频片段3和指定视频片段4，其中，指定视频片段1的序号为1，指定视频片段2的序号为2、指定视频片段3的序号为3以及指定视频片段4的序号为4。指定视频片段1的播放时间和指定视频片段2的播放时间存在重叠时间段，指定视频片段2的播放时间和指定视频片段3的播放时间存在重叠时间段，因此，可以将指定视频片段1的序号1、指定视频片段2的序号2以及指定视频片段3的序号3划分到一组，得到一个第一类分组。针对该第一类分组，可以确定该第一类分组中包括的各个序号中的最小序号为序号1，因此，便可以基于该最小序号1和指定视频片段4的序号4，确定上述各个指定视频片段的拼接顺序。

可选的，一种具体实现方式中，上述步骤323，可以包括如下步骤3231-3234：

步骤3231：将每个第一类分组中包括的各个序号中的最小序号确定为该组的分组序号；

步骤3232：将各个分组序号和各个未分组的指定视频片段的序号由小到大的顺序，确定为各个第一类分组包括的各个序号对应的指定视频片段以及各个未分组的指定视频片段的第一拼接子顺序；

步骤3233：针对每个第一类分组，将该组中包括的各个序号对应的指定视频片段的播放时间由先到后的顺序，确定为该组中包括的各个序号对应的指定视频片段的第二拼接子顺序；

步骤3234：基于第一拼接子顺序和各个第二拼接子顺序，确定各个指定视频片段的拼接顺序。

在本具体实现方式中，在得到各个第一类分组后，便可以确定每个第一类分组包括的各个序号中的最小序号，并将每个第一类分组中包括的各个序号中的最小序号，确定为该组的分组序号，从而，可以得到各个第一类分组的分组序号，以及各个未分组的指定视频片段的序号；从而，便可以将各个分组序号和各个未分组的指定视频片段的序号由小到大的顺序，确定为各个第一类分组包括的各个序号对应的指定视频片段以及各个未分组的指定视频片段的第一拼接子顺序。然后，针对每个第一类分组，可以将该组中包括的各个序号对应的指定视频片段的播放时间由先到后的顺序，确定为该组中包括的各个序号对应的指定视频片段的第二拼接子顺序，从而，便可以基于上述第一拼接子顺序和上述第二拼接子顺序，确定各个指定视频片段的拼接顺序。

例如，共有4个指定视频片段：指定视频片段1、指定视频片段2、指定视频片段3和指定视频片段4，其中，指定视频片段1的序号为1，指定视频片段2的序号为2、指定视频片段3的序号为3以及指定视频片段4的序号为4，并且，得到包括序号1、序号2以及序号3的第一类分组。进而，可以确定该第一类分组的分组序号为序号1，因此，可以确定第一拼接子顺序依次为：上述第一类分组包括的各个序号对应的指定视频片段和指定视频片段4。

针对该第一类分组，由于序号1对应的指定视频片段的播放时间为第1秒-第7秒、序号2对应的指定视频片段2的播放时间为第5秒-第12秒，以及序号3对应的指定视频片段3的播放时间为第10秒-第16秒，因此，按照上述3个指定视频片段的播放时间由先到后的顺序，可以确定上述3个指定视频片段的第二拼接子顺序依次为：指定视频片段1、指定视频片段2和指定视频片段3。

基于此，便可以基于上述第一拼接子顺序以及上述第二拼接子顺序，确定上述4个指定视频片段的拼接顺序依次为：指定视频片段1、指定视频片段2、指定视频片段3和指定视频片段4。

可选的，一种具体实现方式中，上述步骤323，可以包括如下步骤3235-3237：

步骤3235：将每个第一类分组中包括的各个序号对应的指定视频片段，按照播放时间由先到后的顺序进行拼接，得到该组对应的第一视频片段；

步骤3236：将每个第一类分组中包括的各个序号中的最小序号，确定为该组对应的第一视频片段的序号；

步骤3237：将各个第一视频片段的序号和各个未分组的指定视频片段的序号由小到大的顺序，确定为各个第一视频片段和各个未分组的指定视频片段的拼接顺序。

在本具体实现方式中，在得到各个第一类分组后，针对每个第一类分组，可以首先将该第一类分组中包括的各个序号对应的指定视频片段，按照播放时间由先到后的顺序进行拼接，得到该组对应的第一视频片段，并确定该第一类分组中包括的各个序号中的最小序号，作为该第一类分组对应的第一视频片段的序号。这样，便可以得到各个第一视频片段的序号以及各个未分组的指定视频片段的序号，从而，便可以将各个第一视频片段的序号和各个未分组的指定视频片段的序号由小到大的顺序，确定为各个第一视频片段和各个未分组的指定视频片段的拼接顺序。

例如，共有4个指定视频片段：指定视频片段1、指定视频片段2、指定视频片段3和指定视频片段4，其中，指定视频片段1的序号为1，指定视频片段2的序号为2、指定视频片段3的序号为3以及指定视频片段4的序号为4，并且，得到包括序号1、序号2以及序号3的第一类分组，进而，可以确定该第一类分组的分组序号为序号1。

针对该第一类分组，由于序号1对应的指定视频片段1的播放时间为第1秒-第7秒，由于序号2对应的指定视频片段2的播放时间为第5秒-第12秒，以及由于序号3对应的指定视频片段3的播放时间为第10秒-第16秒。因此，可以按照上述3个指定视频片段的播放时间由先到后的顺序，依次拼接上述指定视频片段1、指定视频片段2以及指定视频片段3，得到该第一类分组对应的第一视频片段，并且，该第一视频片段的序号为1。

这样，便可以将上述第一视频片段的序号1和指定视频片段4的序号4由小到大的顺序，确定为上述第一视频片段和指定视频片段4的拼接顺序，即上述第一视频片段和指定视频片段4的拼接顺序依次为：第一视频片段和指定视频片段4。

在实际应用中，由于宣传需要、发布平台的时长要求、存储容量等限制，用户所希望得到的目标视频往往具有时长限制，从而，在利用本发明实施例提供的上述具体实现方式得到各个目标分组之后，可以判断所得到的各个目标分组对应的播放时长是否满足时长限制，进而，确定是否需要对所得到的各个目标分组对应的播放时长进行缩放处理。

基于此，可选的，一种具体实现方式中，如图10所示，为本发明实施例提供的一种视频生成方法，还可以包括如下步骤S1001-S1006。

S1001：遍历全部目标分组，在遍历到每个目标分组时，判断该目标分组包括的各个指定视频片段的播放时长的第一和值与预设时长的大小关系；如果第一和值等于预设时长，则执行步骤S1002；如果第一和值小于预设时长，则执行步骤S1003；如果第一和值大于预设时长，则执行步骤S1007；

S1002：遍历下一目标分组；

S1003：从指定视频集合中，确定位于该目标分组中的每两个相邻的指定视频片段之间且未被选取的间隔视频片段，将间隔视频片段确定为该目标分组包括的新的指定视频片段；计算间隔视频片段的播放时长与第一和值的第二和值，并判断第二和值与预设时长的大小关系；当第二和值等于预设时长时，则执行步骤S1004；当第二和值小于预设时长时，则执行步骤S1005；当第二和值大于预设时长时，则执行步骤S1006；

S1004：基于每个目标分组包括的各个指定视频片段的播放时间，更新拼接顺序，并返回步骤S1002；

S1005：将该目标分组中的第一个指定视频片段的起始播放时刻向前拖动第一时长，和/或，将该目标分组中的最后一个指定视频片段的结束播放时刻向后拖动第二时长；

其中，播放时刻拖动后该目标分组包括的各个指定视频片段的播放时长的第一和值等于所述预设时长；

S1006：从间隔视频片段中裁剪播放时长为特定时长的视频片段，将裁剪后的间隔视频片段确定为该目标分组包括的新的指定视频片段；并返回步骤S1004；其中，特定时长为第二和值与预设时长的差值；

S1007：按照拼接顺序，依次对该目标分组中的各个指定视频片段的起始端和/或终止端分别进行相同时长的视频裁剪；

S1008：在裁剪完每个指定视频片段后，判断裁剪后的该目标分组的播放时长是否等于预设时长，且所裁剪的指定视频片段是否为该目标分组中的最后一个指定视频片段；

S1009：如果该目标分组对应的播放时长大于预设时长，且所裁剪的指定视频片段不是该目标分组中的最后一个指定视频片段，则对下一个指定视频片段进行裁剪，并返回步骤S1008；

S1010：如果该目标分组对应的播放时长大于预设时长，且所裁剪的指定视频片段为该目标分组中的最后一个指定视频片段，则将裁剪后的各个指定视频片段作为该目标分组包括的各个指定视频片段，并返回上述步骤S1007；

S1011：如果该目标分组对应的播放时长小于预设时长，则将该目标分组中包括的被裁剪的各个指定视频片段替换为裁剪后的各个指定视频片段，并返回步骤S1003；

S1012：如果该目标分组对应的播放时长等于预设时长，则该目标分组中包括的被裁剪的各个指定视频片段替换为裁剪后的各个指定视频片段，并返回步骤S1002；

S1013：在遍历完全部目标分组时，判断各个目标分组之间是否存在播放时间具有重叠时间段的片段；

如果具有，则返回执行步骤S904；

如果不具有，则上述步骤S104，按照拼接顺序，对各个指定视频片段进行拼接，得到目标视频，可以包括如下步骤S1014；

S1014：按照当前拼接顺序，对各个指定视频片段进行拼接，得到目标视频。

在本具体实现方式中，在得到各个指定视频片段的拼接顺序后，可以遍历全部目标分组，并在遍历到每个目标分组时，判断该目标分组包括的各个指定视频片段的播放时长的第一和值与预设时长的大小关系。

如果上述第一和值等于上述预设时长，表征该目标分组对应的播放时长满足上述预设时长，则可以遍历下一目标分组。

如果上述第一和值小于上述预设时长，表征该目标分组对应的播放时长小于上述预设时长，可以对该目标分组包括的各个指定视频片段进行增长处理，以使增长后的该目标分组包括的各个指定视频片段的播放时长的第一和值为上述预设时长。

其中，在上述第一和值小于上述预设时长时，可以从指定视频集合中，确定位于该目标分组中的每两个相邻的指定视频片段之间且未被选取的间隔视频片段，并将上述间隔视频片段确定为该目标分组包括的新的指定视频片段。

可选的，所选取的间隔视频片段可以是一个，也可以是多个。

可选的，可以将相邻的两个指定视频片段之间的未被选取的视频片段全部或部分选取为间隔视频片段。

然后，便可以计算上述间隔视频片段的播放时长与上述第一和值的第二和值，并判断上述第二和值与上述预设时长的大小关系。

当上述第二和值等于上述预设时长时，表征在将上述间隔视频片段插入到该目标分组后，该目标分组对应的播放时长满足上述预设时长，则可以将上述间隔视频片段确定为该目标分组包括的新的指定视频片段。进而，便可以基于每个目标分组包括的各个指定视频片段的播放时间，更新之前确定的拼接顺序，并遍历下一个目标分组。

当上述第二和值小于上述预设时长时，表征在将上述间隔视频片段插入到该目标分组后，该目标分组对应的播放时长小于上述预设时长，可以对该目标分组包括的各个指定视频片段进行增长处理，以使增长后的该目标分组包括的各个指定视频片段的播放时长的第二和值为上述预设时长。

其中，在上述第二和值小于上述预设时长时，可以将该目标分组中的第一个指定视频片段的起始播放时刻向前拖动第一时长，和/或，将该目标分组中的最后一个指定视频片段的结束播放时刻向后拖动第二时长，以使播放时刻拖动后的该目标分组包括的各个指定视频片段的播放时长的第一和值等于上述预设时长。

可选的，将该目标分组中的第一指定视频片段的起始播放时刻向前拖动第一时长，以使播放时刻拖动后的该目标分组包括的各个指定视频片段的播放时长的第一和值等于上述预设时长。

可选的，将该目标分组中的最后一个指定视频片段的结束播放时刻向后拖动第二时长，以使播放时刻拖动后的该目标分组包括的各个指定视频片段的播放时长的第一和值等于上述预设时长。

可选的，将该目标分组中的第一个指定视频片段的起始播放时刻向前拖动第一时长，并将该目标分组中的最后一个指定视频片段的结束播放时刻向后拖动第二时长，以使播放时刻拖动后的该目标分组包括的各个指定视频片段的播放时长的第一和值等于预设时长。

当上述第二和值大于上述预设时长时，表征在将上述间隔视频片段插入到该目标分组后，该目标分组对应的播放时长大于上述预设时长，可以对该目标分组包括的各个指定视频片段进行裁剪处理，以使裁剪后的该目标分组包括的各个指定视频片段的播放时长的第二和值为上述预设时长。

其中，在上述第二和值大于上述预设时长时，可以从间隔视频片段中裁剪播放时长为特定时长的视频片段，将裁剪后的间隔视频片段确定为该目标分组包括的新的指定视频片段。然后，基于每个目标分组包括的各个指定视频片段的播放时间，更新之前确定的拼接顺序，并遍历下一目标分组。

并且，特定时长为第二和值与预设时长的差值。

可选的，针对同一目标视频的各个目标分组对应的预设时长相同。

可选的，针对同一目标视频的各个目标分组对应的预设时长不相同。

如果上述第一和值大于上述预设时长，表征该目标分组对应的播放时长大于上述预设时长，可以对该目标分组包括的各个指定视频片段进行裁剪处理，以使得裁剪后的该目标分组包括的各个指定视频片段的播放时长的第一和值为上述预设时长。

其中，在上述第一和值大于上述预设时长时，可以按照拼接顺序，依次对该目标分组中的各个指定视频片段的起始端和/或终止端分别进行相同时长的视频裁剪，并在裁剪完每个指定视频片段后，判断裁剪后的该目标分组的播放时长是否等于预设时长，且所裁剪的指定视频片段是否为该目标分组中的最后一个指定视频片段。

如果该目标分组对应的播放时长大于上述预设时长，且所裁剪的指定视频片段不是该目标分组中的最后一个指定视频片段，表征裁剪后的该目标分组的播放时长大于上述预设时长，且所裁剪的指定视频片段不是该目标分组中的最后一个指定视频片段，可以对下一个指定视频片段进行裁剪，并返回步骤S1008，判断裁剪后的该目标分组的播放时长是否等于预设时长，且所裁剪的指定视频片段是否为该目标分组中的最后一个指定视频片段。

如果该目标分组对应的播放时长大于上述预设时长，且所裁剪的指定视频片段为该目标分组中的最后一个指定视频片段，表征裁剪后的该目标分组的播放时长大于上述预设时长，且所裁剪的指定视频片段是该目标分组中的最后一个指定视频片段，可以将裁剪后的各个指定视频片段作为该目标分组包括的各个指定视频片段，并返回步骤S1007，按照拼接顺序，依次对该目标分组中的各个指定视频片段的起始端和/或终止端分别进行相同时长的视频裁剪。

如果该目标分组对应的播放时长小于预设时长，表征裁剪后的该目标分组的播放时长小于上述预设时长，则将该目标分组中包括的被裁剪的各个指定视频片段替换为裁剪后的各个指定视频片段，并返回上述步骤S1003，从指定视频集合中，确定位于该目标分组中的每两个相邻的指定视频片段之间且未被选取的间隔视频片段。

如果该目标分组对应的播放时长等于预设时长，表征裁剪后的该目标分组的播放时长小于上述预设时长，则该目标分组中包括的被裁剪的各个指定视频片段替换为裁剪后的各个指定视频片段，此时，该目标分组中的各个指定视频片段包括：被裁剪后的各个指定视频片段，以及未被裁剪的各个指定视频片段。然后，便可以遍历下一个目标分组。

在遍历完全部目标分组后，为了使得各个目标分组的播放时长等于上述预设时长，对各个播放时长不满足上述预设时长的各个目标分组的各个指定视频片段进行增长处理，和/或，裁剪处理。为了避免经过处理后的各个目标分组之间存在播放时间具有重叠时间段的片段，可以在遍历完全部目标分组后，判断各个目标分组之间是否存在播放时间具有重叠时间段的片段。

如果各个目标分组之间存在播放时间具有重叠时间段的片段，则返回步骤S904，基于各个指定视频片段的播放时间，对各个指定视频片段的序号进行分组，得到第一分组，对各个目标分组进行再次处理，从而，提高用户的观看体验。

如果各个目标分组之间不存在播放时间具有重叠时间段的片段，则可以按照当前拼接顺序，对各个指定视频片段进行拼接，从而，得到目标视频。

其中，由于在对各个目标分组的各个指定视频片段进行增长处理时，可能会改变各个指定视频片段已经确定的拼接顺序，需要对各个指定视频片段的拼接顺序进行更新，从而，得到新的拼接顺序。而在对各个目标分组的各个指定视频片段进行裁剪处理时，不会影响各个指定视频片段已经确定的拼接顺序。

因此，上述当前拼接顺序可以包括各个指定视频片段已经确定的拼接顺序，和/或，各个指定视频片段新的拼接顺序。

可选的，上述当前拼接顺序可以包括各个指定视频片段已经确定的拼接顺序和各个指定视频片段新的拼接顺序。

可选的，上述当前拼接顺序可以包括各个指定视频片段已经确定的拼接顺序。

可选的，上述当前拼接顺序可以包括各个指定视频片段新的拼接顺序。

示例性的，如图11所示，为本发明的一种具体实施例。图11中的匹配结果：正序视频、乱序句子为本发明实施例的按照所得到的各个指定视频片段的播放时间由先到后的顺序，排列各个指定视频片段的序号，得到待划分序号组。

图11中的重叠视频合并分组、乱序句子子序列合并分组是按照本发明实施例的图9所示的具体实现方式执行的。图11中的无视频重叠、已排序分组，共N组，第i组内有M_i个视频片段是按照本发明实施例的图9所示的具体实现方式得到的N个目标分组。如图11所示，当i＝1时，即针对第一个分组，判断该组内的视频片段的总时长是否小于该组预设时长。

若该组内的视频片段的总时长小于该组预设时长，则利用该组内各个视频片段之间的间隔补充缺少的时长，并在补充后，判断该组内视频片段的总时长是否等于该组预设时长。

如果该组内视频片段的总时长等于该组预设时长，则针对下一组执行上述过程；如果组内视频片段的总时长不等于该组预设时长，则将中间已无间隔的视频片段，也就是一个完整的视频片段的起止点向左右延长至该组的预设时长，并将i更新为i＝i+1，如果等于，则将i更新为i＝i+1。

若该组内的视频片段的总时长大于该组预设时长，则按照(第i组内视频总时长-第i组预设时长)/M_i的剪裁长度剪裁每个视频片段，并将i更新为i＝i+1。

若该组内的视频片段的总时长等于该组预设时长，则将i更新为i＝i+1。

其中，对于上述若该组内的视频片段的总时长小于该组预设时长所执行的方式、若该组内的视频片段的总时长大于该组预设时长所执行的方式是按照本发明实施例的图10所示的具体实现方式执行的。

在将i更新为i＝i+1后，便可以判断当前i是否小于N+1，也就是判断是否遍历完全部的分组，若小于，则重新执行上述步骤，若大于，则判断N个分组中各个视频片段间是否存在重叠时间段的片段，若存在，则返回重叠视频合并分组、乱序句子子序列合并分组的步骤，并循环执行上述步骤，若不存在，则将全部分组进行拼接，得到目标视频，结束循环。

除了上述在利用本发明实施例提供的上述具体实现方式得到目标视频中的各个目标分组之后，可以判断所得到的目标视频中的各个目标分组是否满足时长限制，也可以在利用本发明实施例提供的上述具体实现方式得到目标视频后，可以判断所得到的目标视频是否满足时长限制，进而，确定是否需要对所得到的目标视频进行缩放处理。

基于此，可选的，一种具体实现方式中，如图12所示，本发明实施例提供的一种视频生成方法，还可以包括如下步骤S1201-S1204：

S1201：若目标视频的播放时长大于预设时长，按照拼接顺序，依次对各个指定视频片段的起始端和/或终止端分别进行相同时长的视频裁剪；

S1202：在裁剪完每个指定视频片段后，判断裁剪后的目标视频的播放时长是否等于预设时长；如果否，则执行步骤S1203；

S1203：对下一个指定视频片段进行裁剪，直至裁剪后的目标视频的播放时长等于预设时长，或，裁剪全部的指定视频片段；

S1204：若裁剪完全部的指定视频片段后，裁剪后的目标视频的播放时长大于预设时长，得到新的指定视频片段，并返回执行步骤S1201。

在本具体实现方式中，在得到目标视频后，可以首先确定目标视频的播放时长，并进一步判断目标视频的播放时长与预设时长的大小关系。

若目标视频的播放时长大于预设时长，则可以对该目标视频进行裁剪处理，以使裁剪后的目标视频的时长为上述预设时长。

其中，在目标视频的播放时长大于上述预设时长时，按照各个指定视频片段的拼接顺序，依次对各个指定视频片段的起始端和/或终止端分别进行相同时长的视频裁剪。并且，在对裁剪完每个指定视频片段后，可以判断裁剪后的目标视频的播放时长是否等于上述预设时长。

若裁剪后的目标视频的播放时长不等于预设时长，则对下一个指定视频片段进行裁剪，即对下一个指定视频片段的起始端和/或终止端分别进行相同时长的视频裁剪，直至裁剪后的目标视频的播放时长等于预设时长，或，裁剪完全部的指定视频片段。

如果在裁剪完全部的指定视频片段后，裁剪后的目标视频的播放时长仍然大于上述预设时长，则可以将裁剪完全部指定视频片段的目标视频作为新的指定视频片段，并返回上述步骤S1201，并再次执行步骤S1201-S1204，直至裁剪后的目标视频的播放时长等于预设时长。

例如，目标视频的时长大于预设时长，则按照各个指定视频片段的拼接顺序，首先对第一个指定视频片段的起始端和终止端分别进行t时长的视频裁剪；并判断裁剪后的目标视频的时长是否等于上述预设时长。

若判断结果为大于，则对第二个指定视频片段的起始端和终止端分别进行t时长的视频裁剪，并再次裁剪后的目标视频的时长是否等于上述预设时长。

如果再次判断的判断结果为等于，则可以直接将两次裁剪后的目标视频确定为最终所得到的目标视频。

如果再次判断的判断结果仍然为大于，则对第三个指定视频片段的起始端和终止端分别进行t时长的视频裁剪，并再次裁剪后的目标视频的时长是否等于上述预设时长，依次类推，直至裁剪后的目标视频的播放时长等于上述预设时长，或裁剪完全部的指定视频片段。

当裁剪完全部的指定视频片段后，所得到的目标视频的播放时长仍然大于上述预设时长，则可以将裁剪完全部的指定视频片段后的目标视频确定为新的目标视频，并循环上述过程，直至得到播放时长为上述预设时长的目标视频。

可选的，在上述图12所示的具体实现方式中，在对每个指定视频片段进行裁剪后，可以将裁剪后的指定视频片段确定为新的指定视频片段，从而，利用上述本发明实施例提供的各个具体实现方式，重新生成新的目标视频，在针对该新的目标视频执行上述图12所示的具体实现方式。依次循环，直至得到播放时长等于上述预设时长的目标视频。

可选的，一种具体实现方式中，如图13所示，本发明实施例提供的一种视频生成方法，还可以包括如下步骤S1301-S1303：

S1301：若目标视频的播放时长小于预设时长，从指定视频集合中，确定未被选取的位于相邻的指定视频片段之间的间隔视频片段；

S1302：按照间隔视频片段的播放时间与各个指定视频片段的播放时间的时间关系，将间隔视频片段插入所述目标视频中，得到新的目标视频；

S1303：若新的目标视频的播放时长小于预设时长，则从指定视频集合中获取待插入视频片段，并将待插入视频片段添加至新的目标视频中，得到播放时长满足预设时长的目标视频。

其中，待插入视频片段的播放时长为：预设时长与新的目标视频的播放时长的差值；待插入视频片段包括：第一子视频片段和/或第二子视频片段，第一子视频片段为：播放时间先于第一个指定视频片段的起始播放时刻的第一长度的视频片段，且第一子视频片段的插入位置为：新的目标视频中的第一个指定视频片段之前，第二子视频片段为：播放时间后于最后一个指定视频片段的结束播放时刻的第二长度的视频片段，且第二子视频片段的插入位置为：新的目标视频中的最后一个指定视频片段之后。

若目标视频的播放时长小于预设时长，则可以对该目标视频进行增长处理，以使裁剪后的目标视频的时长为上述预设时长。

其中，在目标视频的播放时长小于上述预设时长时，可以从指定视频集合中，确定未被选取的位于相邻的指定视频片段之间的间隔视频片段，然后，按照间隔视频片段的播放时间与各个指定视频片段的播放时间的时间关系，将间隔视频片段插入目标视频中，得到新的目标视频。

可选的，所选取的间隔视频片段的时长总和不超过目标视频的播放时长与上述预设时长的差值。

可选的，若相邻的两个指定视频片段之间的间隔时长大于预设第一间隔时长，则确定未被选取的位于相邻的指定视频片段之间的目标时长的任意视频片段，作为间隔视频片段。

例如，相邻的两个指定视频片段之间的间隔时长为30秒，第一间隔时长为10秒，则可以确定目标时长为5秒，进而，可以从该两个指定视频片段之间的30秒的视频片段中选取任意5秒，作为间隔视频片段。

可选的，若相邻的两个指定视频片段之间的间隔时长不大于预设第一间隔时长，则确定位于相邻的两个指定视频片段中，前一指定视频片段的最后一个视频帧与后一指定视频片段的第一个视频帧之间的各个视频帧构成的视频片段，作为间隔视频片段。

例如，相邻的两个指定视频片段之间的间隔时长为5秒，第一间隔时长为10秒，则可以将该两个指定视频片段之间的全部5秒的视频片段，确定为间隔视频片段。

在完成对上述间隔视频片段的插入后，可以判断上述新的目标视频的播放时长是否等于上述预设时长。

如果在完成对上述间隔视频片段的插入后，上述新的目标视频的播放时长仍然小于上述预设时长，则可以从指定视频集合中获取待插入视频片段，并将所获取的待插入视频片段添加至上述新的目标视频中，得到播放时长满足上述预设时长的目标视频。

其中，上述待插入视频片段的播放时长为：上述预设时长与上述新的目标视频的播放时长的差值，并且，上述待插入视频片段可以包括第一子视频片段和/或第二子视频片段。

可选的，上述待插入视频片段包括：第一子视频片段。其中，第一子视频片段为：播放时间先于上述新的目标视频中的第一个指定视频片段的起始播放时刻的第一长度的视频片段，并且，该第一长度为上述预设时长与上述新的目标视频的播放时长的差值，该第一子视频片段插入到：上述新的目标视频中的第一个指定视频片段之前。

可选的，上述待插入视频片段包括：第二子视频片段。其中，第二子视频片段为：播放时间晚于上述新的目标视频中的最后一个指定视频片段的结束播放时刻的第二长度的视频片段，并且，该第二长度为上述预设时长与上述新的目标视频的播放时长的差值，该第二子视频片段插入到：上述新的目标视频中的最后一个指定视频片段之后。

可选的，上述待插入视频片段包括：第一子视频片段和第二子视频片段，则上述第一长度和第二长度的和值为：上述预设时长与上述新的目标视频的播放时长的差值。

可选的，针对上述图12和图13，若利用图12所示的具体实现方式，在对目标视频进行裁剪后，得到播放时长小于预设时长的新的目标视频，则可以继续采用上述图13所示的具体实现方式，对该新的目标视频进行增长；相应的，若利用图13所示的具体实现方式，在对目标视频进行增长后，得到播放时长大于预设时长的新的目标视频，则可以继续采用上述图12所示的具体实现方式，对新的目标视频进行裁剪。

通常，文本中的各个句子，因为其在构成文本中所起的作用以及句子所表达的内容，可以具有一定的属性，例如，连贯性、戏剧性等，因此，在本发明实施例中，在生成用于表达目标文本的内容的目标视频时，可以考虑目标文本中的各个句子的属性，从而，使最终得到的目标视频所表达的内容能够具有更好的效果。

基于此，可选的，一种具体实现方式中，如图14所示，在上述步骤S103，根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序之前，还可以包括如下步骤S1430：

S1430：确定目标文本中的每个句子的指定属性的属性参数，并选取属性参数达到属性阈值的目标句子。

其中，指定属性包括：连贯性，和/或，戏剧性。

在本具体实现方式中，在得到目标文本后，便可以确定上述目标文本中每个句子的指定属性的属性参数，并选取属性参数达到属性阈值的句子，作为目标句子。

可选的，若句子的指定属性为连贯性，则可以利用LCD(local coherencediscriminator，局部连贯性判别)算法和BCF(Barthes’Cardinal Function，巴特核心功能单元)算法，确定上述目标文本中的每个句子的连贯性参数。

可选的，若句子的指定属性为戏剧性，则可以利用SUS(Suspense modeling，悬念型模型)算法，确定上述目标文本中的每个句子的戏剧性参数。

可选的，若句子的指定属性为连贯性和戏剧性，则可以利用LCD算法和BCF算法，确定上述目标文本中的每个句子的连贯性参数，并利用SUS算法，确定上述目标文本中的每个句子的戏剧性参数。

例如，利用句子的指定属性的属性参数，可以确定该句子的连贯性和/或戏剧性，然后，可以根据关于句子的指定属性的属性阈值在目标文本中选取目标句子。若需要更加概括的目标视频，则可以提高关于句子的连贯性的属性阈值；若需要更加详细的目标视频，则可以降低关于句子的连贯性的属性阈值；若需要更加戏剧化的目标视频，则可以提高关于句子的戏剧性的属性阈值；若需要更加平淡化的目标视频，则可以降低关于句子的戏剧性的属性阈值。

相应的，可选的，一种具体实现方式中，如图14所示，上述步骤S103，根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序，并按照拼接顺序，对各个指定视频片段进行拼接，得到目标视频，可以包括如下S1431：

S1431：将各个目标句子对应的初始视频片段中，播放时间满足指定时间要求的视频片段确定为指定视频片段，并根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序，并按照拼接顺序，对各个指定视频片段进行拼接，得到目标视频。

在本具体实现方式中，在得到各个目标句子后，可以确定各个目标句子对应的初始视频片段中，播放时间满足指定时间要求的视频片段，并将所确定的各个视频片段确定为指定视频片段，从而，便可以根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序，并按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频。

其中，可选的，在得到目标文本后，可以首先确定该目标文本所包括的各个句子中的目标句子，进而，在指定视频集合中，确定每个目标句子对应的初始视频片段，进而，从每个目标句子对应的初始视频片段中，选取满足指定时间要求的视频片段，作为上述指定视频片段。从而，便可以根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序，并按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频。

可选的，在得到目标文本后，可以首先在指定视频集合中选取与该目标文本中的每个句子对应的初始视频片段，并从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的视频片段。进而，便可以确定该目标文本所包括的各个句子中的目标句子，并从上述所选取的播放时间满足指定时间要求的视频片段中，选取每个目标句子对应的播放时间满足指定时间要求的视频片段，作为上述指定视频片段。从而，便可以根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序，并按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频。

为了方便理解本发明实施例提供的一种视频生成方法，如图15所示，以影视剧视频摘要为例，提供了本发明的一个具体实施例的流程示意图。

其中，影视剧视频即指定视频集合；摘要相关信息生产即获取目标文本，并在指定视频集合中选取与目标文本中的每个句子对应的初始视频片段；过滤即从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段；抽取即确定目标文本中的每个句子的指定属性的属性参数，并选取属性参数达到属性阈值的目标句子；分组与排序即根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序，并按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频；时长调整即对目标视频中的指定视频片段进行裁剪或在目标视频中插入待插入视频片段；影视剧视频摘要即最终得到的目标视频。具体的，如图15所示，在生成影视剧视频摘要时，首先获取影视剧视频以及摘要相关信息生产，并对所得到的初始视频片段进行过滤处理，得到指定视频片段，并从摘要相关信息中确定要抽取出作为目标句子的句子，从而，可以根据得到的指定视频片段和目标句子，对上述指定视频片段和目标句子进行分组和排序，得到影视剧视频摘要，进而，对所得到的影视剧视频摘要进行时长调整，得到满足时长的影视剧视频摘要。

相应于上述本发明实施例提供的一种视频生成方法，本发明实施例还提供了一种视频生成装置。

图16为本发明实施例提供的一种视频生成装置的结构示意图，如图16所示，该方法包括如下模块：

初始片段获取模块1610，用于获取目标文本，并在指定视频集合中选取与所述目标文本中的每个句子对应的初始视频片段；

目标片段确定模块1620，用于从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段；其中，每个初始视频片段的播放时间为：该初始视频片段在所述指定视频集合中的播放时间；

顺序确定模块1630，用于根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序；

目标视频获取模块1640，用于按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频；其中，每个指定视频片段的内容标签包括：该指定视频片段的播放时间或该指定视频片段对应的句子的序号，每个句子的序号为：该句子在所述目标文本中的排序。

可选的，一种具体实现方式中，所述目标片段确定模块1620包括：

目标直线确定子模块，用于根据全部句子的序号以及全部初始视频片段的播放时间，确定目标直线；

目标曲线确定子模块，用于基于每个句子的序号和该句子对应的初始视频片段的播放时间的对应关系，进行曲线拟合，得到目标曲线；

平均曲线确定子模块，用于确定所述目标直线和所述目标曲线的平均曲线；

目标片段确定子模块，用于利用所述平均曲线，从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段。

可选的，一种具体实现方式中，所述目标直线确定子模块具体用于：根据全部初始视频片段的播放时间，确定所述全部初始视频片段的播放总时长；确定斜率为全部句子的序号的数量与所述播放总时长的比值，且截距为零的目标直线。

可选的，一种具体实现方式中，所述目标曲线确定子模块具体用于：确定每个初始视频片段的播放时间的中间时刻；计算每个句子的序号和该句子对应的每个初始视频片段的播放时间的中间时刻的指定系数；利用指定参数下的指定多项式对各个指定系数进行曲线拟合，得到目标曲线。

可选的，一种具体实现方式中，所述目标片段确定子模块具体用于：利用所述平均曲线，找到各个句子的序号对应的指定播放时刻；从该句子的序号对应的初始视频片段中，选取播放时间的中间时刻与该句子的序号对应的指定播放时刻的时间差不大于指定时长的指定视频片段。

可选的，一种具体实现方式中，所述顺序确定模块1630包括：

时间顺序拼接子模块，用于根据各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序；或者，

序号顺序拼接子模块，用于根据各个指定视频片段的序号，确定各个指定视频片段的拼接顺序；其中，每个指定视频片段的序号为：该指定视频片段对应的句子的序号。

可选的，一种具体实现方式中，所述序号顺序拼接子模块包括第一序号顺序拼接单元或第二序号顺序拼接单元：

所述第一序号顺序拼接单元，用于将各个指定视频片段的序号由小到大的顺序，确定为各个指定视频片段的拼接顺序；

所述第二序号顺序拼接单元包括第一分组子单元和序号确定子单元：

所述第一分组子单元，用于若各个指定视频片段中存在具有重叠片段的片段，则基于各个视频片段的内容，对各个指定视频片段的序号进行分组，得到第一类分组；其中，每个第一类分组中的每个序号对应的指定视频片段，与该组中除该序号之外的其他至少一个序号对应的指定视频片段存在重叠片段；

所述序号确定子单元，用于基于所述第一类分组中包括的各个序号中的最小序号，确定各个指定视频片段的拼接顺序。

可选的，一种具体实现方式中，所述序号确定子单元具体用于：

将每个第一类分组中包括的各个序号中的最小序号，确定为该组的分组序号；并将各个分组序号和各个未分组的指定视频片段的序号由小到大的顺序，确定为各个第一类分组包括的各个序号对应的指定视频片段以及各个未分组的指定视频片段的第一拼接子顺序；针对每个第一类分组，将该组中包括的各个序号对应的指定视频片段的播放时间由先到后的顺序，确定为该组中包括的各个序号对应的指定视频片段的第二拼接子顺序；基于所述第一拼接子顺序和各个第二拼接子顺序，确定各个指定视频片段的拼接顺序；或者，

将每个第一类分组中包括的各个序号对应的指定视频片段，按照播放时间由先到后的顺序进行拼接，得到该组对应的第一视频片段；将每个第一类分组中包括的各个序号中的最小序号，确定为该组对应的第一视频片段的序号；将各个第一视频片段的序号和各个未分组的指定视频片段的序号由小到大的顺序，确定为各个第一视频片段和各个未分组的指定视频片段的拼接顺序。

可选的，一种具体实现方式中，所述时间顺序拼接子模块具体用于：按照所得到的各个指定视频片段的播放时间由先到后的顺序，排列各个指定视频片段的序号，得到待划分序号组；按照第一方向遍历所述待划分序号组，在遍历到所述待划分序号组中的每个序号时，确定已遍历序号中的最小值；并按照与所述第一方向相反的第二方向遍历所述待划分序号组，在遍历到所述待划分序号组中的每个序号时，确定已遍历序号中的最大值；针对所述待划分序号中的每个序号，若所确定的最大值小于在所述第二方向上该序号的下一序号处确定的最小值，则将该序号确定为待划分序号；按照所述待划分序号，将所述待划分序号组划分为各个第二类分组，并将各个第二类分组确定为各个目标分组；其中，所述待划分序号为所在所述第二类分组中的最后一个序号；基于各个目标分组和各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序。

可选的，一种具体实现方式中，所述装置还包括：

目标分组模块，用于目标分组模块，用于若各个指定视频片段中，存在播放时间具有重叠时间段的片段，在所述将各个第二类分组确定为各个目标分组之前，基于各个指定视频片段的播放时间，对各个指定视频片段的序号进行分组，得到第一类分组；其中，每个第一类分组中的每个序号对应的指定视频片段的播放时间，与该组中除该序号之外的其他至少一个序号对应的指定视频片段的播放时间存在重叠时间段；

目标合并模块，用于合并包括相同序号的所述第一类分组和所述第二类分组，得到第三类分组；其中，所述第三类分组包括：合并后的分组和未合并的所述第二类分组；

所述时间顺序拼接子模块具体用于：若所述第三类分组中不存在包括相同序号的组，则将所述第三类分组确定为目标分组；若所述第三类分组中存在包括相同序号的组，则合并包括相同序号的所述第三类分组，得到目标分组。

可选的，一种具体实现方式中，所述时间顺序拼接子模块具体用于：

将每个目标分组中包括的各个序号对应的指定视频片段的最先播放起始时间，确定为该组的分组播放时刻；并将各个分组播放时刻由先到后的顺序，确定为各个目标分组的第三拼接子顺序；针对每个目标分组，将该组中包括的各个序号对应的指定视频片段的播放时间由先到后的顺序，确定为该组中包括的各个序号对应的指定视频片段的第四拼接子顺序；基于所述第三拼接子顺序和各个第四拼接子顺序，确定各个指定视频片段的拼接顺序；

或者，将每个目标分组中包括的各个序号对应的指定视频片段，按照播放时间由先到后的顺序进行拼接，得到该组对应的第二视频片段；将各个第二视频片段的播放时间由先到后的顺序，确定为各个第二视频片段的拼接顺序。

可选的，一种具体实现方式，所述装置还包括：

视频处理模块，用于在所述按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频之前，遍历全部所述目标分组，在遍历到每个目标分组时，判断该目标分组包括的各个指定视频片段的播放时长的第一和值与预设时长的大小关系；

如果所述第一和值等于所述预设时长，则遍历下一目标分组；

如果所述第一和值小于所述预设时长，则从所述指定视频集合中，确定位于该目标分组中的每两个相邻的指定视频片段之间且未被选取的间隔视频片段，将所述间隔视频片段确定为该目标分组包括的新的指定视频片段；计算所述间隔视频片段的播放时长与所述第一和值的第二和值，并判断所述第二和值与所述预设时长的大小关系；

当所述第二和值等于所述预设时长时，则基于每个目标分组包括的各个指定视频片段的播放时间，更新所述拼接顺序，并遍历下一目标分组；

当所述第二和值小于所述预设时长时，则将该目标分组中的第一个指定视频片段的起始播放时刻向前拖动第一时长，和/或，将该目标分组中的最后一个指定视频片段的结束播放时刻向后拖动第二时长；其中，播放时刻拖动后该目标分组包括的各个指定视频片段的播放时长的第一和值等于所述预设时长；

当所述第二和值大于所述预设时长时，则从所述间隔视频片段中裁剪播放时长为特定时长的视频片段，将裁剪后的所述间隔视频片段确定为该目标分组包括的新的指定视频片段；并返回所述基于每个目标分组包括的各个指定视频片段的播放时间，更新所述拼接顺序，并遍历下一目标分组；其中，所述特定时长为所述第二和值与所述预设时长的差值。

如果所述第一和值大于所述预设时长，则按照所述拼接顺序，依次对该目标分组中的各个指定视频片段的起始端和/或终止端分别进行相同时长的视频裁剪；

在裁剪完每个指定视频片段后，判断裁剪后的该目标分组的播放时长是否等于所述预设时长，且所裁剪的指定视频片段是否为该目标分组中的最后一个指定视频片段；

如果该目标分组对应的播放时长大于所述预设时长，且所裁剪的指定视频片段不是该目标分组中的最后一个指定视频片段，则对下一个所述指定视频片段进行裁剪，并返回所述判断裁剪后的该目标分组的播放时长是否等于所述预设时长，且所裁剪的指定视频片段是否为该目标分组中的最后一个指定视频片段的步骤；

如果该目标分组对应的播放时长大于所述预设时长，且所裁剪的指定视频片段为该目标分组中的最后一个指定视频片段，则将裁剪后的各个指定视频片段作为该目标分组包括的各个指定视频片段，并返回所述按照所述拼接顺序，依次对各个指定视频片段的起始端和/或终止端分别进行相同时长的视频裁剪；

如果该目标分组对应的播放时长小于所述预设时长，则将该目标分组中包括的被裁剪的各个指定视频片段替换为裁剪后的各个指定视频片段，并返回所述从所述指定视频集合中，确定位于该目标分组中的每两个相邻的指定视频片段之间且未被选取的间隔视频片段的步骤；

如果该目标分组对应的播放时长等于所述预设时长，则将该目标分组中包括的被裁剪的各个指定视频片段替换为裁剪后的各个指定视频片段，并遍历下一目标分组；

在遍历完全部所述目标分组时，判断各个目标分组之间是否存在播放时间具有重叠时间段的片段；

如果具有，则返回所述基于各个指定视频片段的播放时间，对各个指定视频片段的序号进行分组，得到第一类分组的步骤；

如果不具有，则所述目标视频获取模块1640具体用于：

按照当前拼接顺序，对各个指定视频片段进行拼接，得到目标视频。

可选的，一种具体实现方式中，所述装置还包括：

视频裁剪模块，用于若所述目标视频的播放时长大于预设时长，按照所述拼接顺序，依次对各个指定视频片段的起始端和/或终止端分别进行相同时长的视频裁剪；

在裁剪完每个指定视频片段后，判断裁剪后的所述目标视频的播放时长是否等于所述预设时长；

如果否，则对下一个所述指定视频片段进行裁剪，直至裁剪后的所述目标视频的播放时长等于所述预设时长，或，裁剪完全部的指定视频片段；

若裁剪完全部的指定视频片段后，裁剪后的所述目标视频的播放时长大于所述预设时长，得到新的指定视频片段，并返回所述按照所述拼接顺序，依次对各个指定视频片段的起始端和/或终止端分别进行相同时长的视频裁剪。

可选的，一种具体实现方式中，所述装置还包括：

视频填充模块，用于若在拼接得到所述目标视频时，各个指定视频片段的拼接顺序是基于各个指定视频片段的播放时间确定的，若所述目标视频的播放时长小于预设时长，从所述指定视频集合中，确定未被选取的位于相邻的所述指定视频片段之间的间隔视频片段；

按照所述间隔视频片段的播放时间与各个指定视频片段的播放时间的时间关系，将所述间隔视频片段插入所述目标视频中，得到新的目标视频；

若所述新的目标视频的播放时长小于所述预设时长，则从所述指定视频集合中获取待插入视频片段，并将所述待插入视频片段添加至所述新的目标视频中，得到播放时长满足所述预设时长的目标视频；

其中，所述待插入视频片段的播放时长为：所述预设时长与所述新的目标视频的播放时长的差值；所述待插入视频片段包括：第一子视频片段和/或第二子视频片段，所述第一子视频片段为：播放时间先于所述新的目标视频片段中的第一个指定视频片段的起始播放时刻的第一长度的视频片段，且所述第一子视频片段的插入位置为：所述新的目标视频中的第一个指定视频片段之前，所述第二子视频片段为：播放时间晚于所述新的目标视频片段中的最后一个指定视频片段的结束播放时刻的第二长度的视频片段，且所述第二子视频片段的插入位置为：所述新的目标视频中的最后一个指定视频片段之后。

可选的，一种具体实现方式中，所述装置还包括：

目标句子确定模块，用于在所述根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序之前，确定所述目标文本中的每个句子的指定属性的属性参数，并选取属性参数达到属性阈值的目标句子；其中，所述指定属性包括：连贯性，和/或，戏剧性；

所述目标视频获取模块1630具体用于：

将各个目标句子对应的初始视频片段中，播放时间满足指定时间要求的视频片段，确定为指定视频片段，并根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序，并按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频。

相应于上述本发明实施例提供的一种视频生成方法，本发明实施例还提供了一种电子设备，如图17所示，包括处理器1701、通信接口1702、存储器1703和通信总线1704，其中，处理器1701，通信接口1702，存储器1703通过通信总线1704完成相互间的通信，存储器1703，用于存放计算机程序；处理器1701，用于执行存储器1703上所存放的程序时，实现上述本发明实施例提供的任一视频生成方法的步骤。

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。通信接口用于上述终端与其他设备之间的通信。存储器可以包括随机存取存储器(Random AccessMemory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processor，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述实施例中任一所述的视频生成方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的视频生成方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例、电子设备实施例、计算机可读存储介质实施例，以及计算机程序产品实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种视频生成方法，其特征在于，所述方法包括：

从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段；其中，每个初始视频片段的播放时间为：该初始视频片段在所述指定视频集合中的播放时间；

根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序；

按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频；其中，每个指定视频片段的内容标签包括：该指定视频片段的播放时间或该指定视频片段对应的句子的序号，每个句子的序号为：该句子在所述目标文本中的排序；

其中，所述从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段，包括：

根据全部句子的序号以及全部初始视频片段的播放时间，确定目标直线；

基于每个句子的序号和该句子对应的初始视频片段的播放时间的对应关系，进行曲线拟合，得到目标曲线；

确定所述目标直线和所述目标曲线的平均曲线；

利用所述平均曲线，从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段；

所述根据全部句子的序号以及全部初始视频片段的播放时间，确定目标直线，包括：

根据全部初始视频片段的播放时间，确定所述全部初始视频片段的播放总时长；

确定斜率为全部句子的序号的数量与所述播放总时长的比值，且截距为零的目标直线；

所述基于每个句子的序号和该句子对应的初始视频片段的播放时间的对应关系，进行曲线拟合，得到目标曲线，包括：

确定每个初始视频片段的播放时间的中间时刻；

计算每个句子的序号和该句子对应的每个初始视频片段的播放时间的中间时刻的指定系数；

利用指定参数下的指定多项式对各个指定系数进行曲线拟合，得到目标曲线；

所述利用所述平均曲线，从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段，包括：

利用所述平均曲线，找到各个句子的序号对应的指定播放时刻；

从该句子的序号对应的初始视频片段中，选取播放时间的中间时刻与该句子的序号对应的指定播放时刻的时间差不大于指定时长的指定视频片段。

2.根据权利要求1所述的方法，其特征在于，所述根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序，包括：

根据各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序；

或者，

根据各个指定视频片段的序号，确定各个指定视频片段的拼接顺序；其中，每个指定视频片段的序号为：该指定视频片段对应的句子的序号。

3.根据权利要求2所述的方法，其特征在于，所述根据各个指定视频片段的序号，确定各个指定视频片段的拼接顺序，包括：

将各个指定视频片段的序号由小到大的顺序，确定为各个指定视频片段的拼接顺序；

或者，

若各个指定视频片段中存在具有重叠片段的片段，则基于各个视频片段的内容，对各个指定视频片段的序号进行分组，得到第一类分组，并基于所述第一类分组中包括的各个序号中的最小序号，确定各个指定视频片段的拼接顺序；

其中，每个第一类分组中的每个序号对应的指定视频片段，与该组中除该序号之外的其他至少一个序号对应的指定视频片段存在重叠片段。

4.根据权利要求3所述的方法，其特征在于，所述基于所述第一类分组中包括的各个序号中的最小序号，确定各个指定视频片段的拼接顺序，包括：

将每个第一类分组中包括的各个序号中的最小序号，确定为该组的分组序号；并将各个分组序号和各个未分组的指定视频片段的序号由小到大的顺序，确定为各个第一类分组包括的各个序号对应的指定视频片段以及各个未分组的指定视频片段的第一拼接子顺序；针对每个第一类分组，将该组中包括的各个序号对应的指定视频片段的播放时间由先到后的顺序，确定为该组中包括的各个序号对应的指定视频片段的第二拼接子顺序；基于所述第一拼接子顺序和各个第二拼接子顺序，确定各个指定视频片段的拼接顺序；

或者，

5.根据权利要求2所述的方法，其特征在于，所述根据各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序，包括：

按照所得到的各个指定视频片段的播放时间由先到后的顺序，排列各个指定视频片段的序号，得到待划分序号组；

按照第一方向遍历所述待划分序号组，在遍历到所述待划分序号组中的每个序号时，确定已遍历序号中的最小值；并按照与所述第一方向相反的第二方向遍历所述待划分序号组，在遍历到所述待划分序号组中的每个序号时，确定已遍历序号中的最大值；针对所述待划分序号中的每个序号，若所确定的最大值小于在所述第二方向上该序号的下一序号处确定的最小值，则将该序号确定为待划分序号；

按照所述待划分序号，将所述待划分序号组划分为各个第二类分组，并将各个第二类分组确定为各个目标分组；其中，所述待划分序号为所在所述第二类分组中的最后一个序号；

基于各个目标分组和各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序。

6.根据权利要求5所述的方法，其特征在于，若各个指定视频片段中，存在播放时间具有重叠时间段的片段，在所述将各个第二类分组确定为各个目标分组之前，所述方法还包括：

基于各个指定视频片段的播放时间，对各个指定视频片段的序号进行分组，得到第一类分组；其中，每个第一类分组中的每个序号对应的指定视频片段的播放时间，与该组中除该序号之外的其他至少一个序号对应的指定视频片段的播放时间存在重叠时间段；

合并包括相同序号的所述第一类分组和所述第二类分组，得到第三类分组；其中，所述第三类分组包括：合并后的分组和未合并的所述第二类分组；

所述将各个第二类分组确定为各个目标分组，包括：

若所述第三类分组中不存在包括相同序号的组，则将所述第三类分组确定为目标分组；

若所述第三类分组中存在包括相同序号的组，则合并包括相同序号的所述第三类分组，得到目标分组。

7.根据权利要求5或6所述的方法，其特征在于，所述基于所得到的目标分组和各个指定视频片段的播放时间，确定各个指定视频片段的拼接顺序，包括：

将每个目标分组中包括的各个序号对应的指定视频片段的最先播放时间，确定为该组的分组播放时刻；并将各个分组播放时刻由先到后的顺序，确定为各个目标分组的第三拼接子顺序；针对每个目标分组，将该组中包括的各个序号对应的指定视频片段的播放时间由先到后的顺序，确定为该组中包括的各个序号对应的指定视频片段的第四拼接子顺序；基于所述第三拼接子顺序和各个第四拼接子顺序，确定各个指定视频片段的拼接顺序；

或者，

将每个目标分组中包括的各个序号对应的指定视频片段，按照播放时间由先到后的顺序进行拼接，得到该组对应的第二视频片段；将各个第二视频片段的播放时间由先到后的顺序，确定为各个第二视频片段的拼接顺序。

8.根据权利要求6所述的方法，其特征在于，在所述按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频之前，所述方法还包括：

遍历全部所述目标分组，在遍历到每个目标分组时，判断该目标分组包括的各个指定视频片段的播放时长的第一和值与预设时长的大小关系；

当所述第二和值大于所述预设时长时，则从所述间隔视频片段中裁剪播放时长为特定时长的视频片段，将裁剪后的所述间隔视频片段确定为该目标分组包括的新的指定视频片段；并返回所述基于每个目标分组包括的各个指定视频片段的播放时间，更新所述拼接顺序，并遍历下一目标分组；其中，所述特定时长为所述第二和值与所述预设时长的差值；

如果不具有，则所述按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频的步骤，包括：

9.根据权利要求1所述的方法，其特征在于，所述方法还包括：

若所述目标视频的播放时长大于预设时长，按照所述拼接顺序，依次对各个指定视频片段的起始端和/或终止端分别进行相同时长的视频裁剪；

10.根据权利要求1所述的方法，其特征在于，所述方法还包括：

若所述目标视频的播放时长小于预设时长，从所述指定视频集合中，确定未被选取的位于相邻的所述指定视频片段之间的间隔视频片段；

其中，所述待插入视频片段的播放时长为：所述预设时长与所述新的目标视频的播放时长的差值；所述待插入视频片段包括：第一子视频片段和/或第二子视频片段，所述第一子视频片段为：播放时间先于所述新的目标视频中的第一个指定视频片段的起始播放时刻的第一长度的视频片段，且所述第一子视频片段的插入位置为：所述第一个指定视频片段之前，所述第二子视频片段为：播放时间晚于所述新的目标视频的最后一个指定视频片段的结束播放时刻的第二长度的视频片段，且所述第二子视频片段的插入位置为：所述新的目标视频中的最后一个指定视频片段之后。

11.根据权利要求1所述的方法，其特征在于，在所述根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序之前，所述方法还包括：

确定所述目标文本中的每个句子的指定属性的属性参数，并选取属性参数达到属性阈值的目标句子；其中，所述指定属性包括：连贯性，和/或，戏剧性；

所述根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序，并按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频，包括：

12.一种视频生成装置，其特征在于，所述装置包括：

初始片段获取模块，用于获取目标文本，并在指定视频集合中选取与所述目标文本中的每个句子对应的初始视频片段；

目标片段确定模块，用于从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段；其中，每个初始视频片段的播放时间为：该初始视频片段在所述指定视频集合中的播放时间；

顺序确定模块，用于根据各个指定视频片段的内容标签，确定各个指定视频片段的拼接顺序；

目标视频获取模块，用于按照所述拼接顺序，对各个指定视频片段进行拼接，得到目标视频；其中，每个指定视频片段的内容标签包括：该指定视频片段的播放时间或该指定视频片段对应的句子的序号，每个句子的序号为：该句子在所述目标文本中的排序；

其中，所述目标片段确定模块包括：

目标片段确定子模块，用于利用所述平均曲线，从每个句子对应的初始视频片段中，选取播放时间满足指定时间要求的指定视频片段；

所述目标直线确定子模块，具体用于：

所述目标曲线确定子模块，具体用于：

确定每个初始视频片段的播放时间的中间时刻；

所述目标片段确定子模块，具体用于：

13.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-11任一所述的方法步骤。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-11任一所述的方法步骤。