CN109360436B

CN109360436B - 一种视频生成方法、终端及存储介质

Info

Publication number: CN109360436B
Application number: CN201811303089.3A
Authority: CN
Inventors: 张弓
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2018-11-02
Filing date: 2018-11-02
Publication date: 2021-01-08
Anticipated expiration: 2038-11-02
Also published as: CN109360436A

Abstract

本申请实施例公开了一种视频生成方法、终端及存储介质，该方法可以包括：获取待处理视频；将待处理视频输入预设视频生成模型，并通过预设视频生成模型进行处理，获得模型训练视频；其中，预设视频生成模型为待训练成具备生成自动驾驶样本视频功能的模型；通过模型训练视频，对预设视频生成模型进行训练，获得目标视频生成模型；通过目标视频生成模型对待处理视频进行处理，生成自动驾驶样本视频。

Description

一种视频生成方法、终端及存储介质

技术领域

本申请实施例涉及自动驾驶视频技术领域，尤其涉及一种视频生成方法、终端及存储介质。

背景技术

随着科技的不断发展，自动驾驶技术的出现不仅可以使驾驶员脱离出枯燥的驾驶工作，还可以有效降低由于疲劳驾驶导致的高事故率，为人们的生活做出了极大的贡献。

目前，通常获取大量自动驾驶样本视频用于进行自动驾驶训练。然而，采用现有技术，即通过摄像装置，如车辆上的摄像头，收集大量的交通视频，作为自动驾驶样本视频时，其中大部分视频并不能适合用于进行自动驾驶训练，因此，需要耗费大量的人工对这些大量的交通视频进行筛选和标注，获得自动驾驶样本视频，即获取自动驾驶样本视频难度较大。

发明内容

本申请实施例提供一种视频生成方法、终端及存储介质，能够基于较少的已获得的自动驾驶样本视频或路况视频，生成新的满足自动驾驶训练的自动驾驶样本视频，降低了获取自动驾驶样本视频的难度，提高了自动驾驶样本视频获取的智能性。

本申请实施例的技术方案是这样实现的：

本申请实施例提供了一种视频生成方法，应用于终端，所述方法包括：

获取待处理视频；

将所述待处理视频输入预设视频生成模型，并通过所述预设视频生成模型对所述待处理视频进行处理，获得模型训练视频；其中，所述预设视频生成模型为待训练成具备生成自动驾驶样本视频功能的模型；

通过所述模型训练视频，对所述预设视频生成模型进行训练，获得目标视频生成模型；

通过所述目标视频生成模型对所述待处理进行处理，生成自动驾驶样本视频。

在上述方案中，所述将所述待处理输入预设视频生成模型，并通过所述预设视频生成模型对所述待处理视频进行处理，获得模型训练视频，包括：

按照预设特征提取方式，提取所述待处理视频中每一帧对应的视频帧特征；

对所述视频帧特征进行特征修改，生成目标视频帧；

将所述目标视频帧输入预设长短期记忆网络，进行视频帧组合，获得所述模型训练视频。

在上述方案中，所述将所述目标视频帧输入预设长短期记忆网络，进行视频帧组合，获得所述模型训练视频，包括：

将所述目标视频帧输入所述预设长短期记忆网络，获得所述目标视频帧中每一帧对应的预测时间；

基于所述预测时间，将所述目标视频帧进行组合，获得所述模型训练视频。

在上述方案中，所述通过所述模型训练视频，对所述预设视频生成模型进行训练，获得目标视频生成模型，包括：

判断所述模型训练视频是否满足预设自动驾驶样本视频条件；

若所述模型训练视频不满足所述预设自动驾驶样本视频条件，对所述预设视频生成模型进行调整，获得所述目标视频生成模型。

在上述方案中，所述生成自动驾驶样本视频之后，所述方法还包括：

根据所述自动驾驶样本视频，进行自动驾驶训练，获得自动驾驶模型；其中，所述自动驾驶模型用于控制自动驾驶时对应的驾驶操作。

在上述方案中，所述判断所述模型训练视频是否满足预设自动驾驶样本视频条件之后，所述方法还包括：

若所述模型训练视频满足所述预设自动驾驶样本视频条件，将所述预设视频生成模型确定为所述目标视频生成模型。

本申请实施例提供了一种终端，所述终端包括：

获取单元，用于获取待处理视频；

第一生成单元，用于将所述待处理视频输入预设视频生成模型，并通过所述预设视频生成模型对所述待处理视频进行处理，获得模型训练视频；其中，所述预设视频生成模型为待训练成具备生成自动驾驶样本视频功能的模型；

模型训练单元，用于通过所述模型训练视频，对所述预设视频生成模型进行训练，获得目标视频生成模型；

第二生成单元，用于通过所述目标视频生成模型对所述待处理进行处理，生成自动驾驶样本视频。

在上述终端中，所述第一生成单元，具体用于按照预设特征提取方式，提取所述待处理视频中每一帧对应的视频帧特征；对所述视频帧特征进行特征修改，生成目标视频帧；将所述目标视频帧输入预设长短期记忆网络，进行视频帧组合，获得所述模型训练视频。

在上述终端中，所述第一生成单元，具体用于将所述目标视频帧输入所述预设长短期记忆网络，获得所述目标视频帧中每一帧对应的预测时间；基于所述预测时间，将所述目标视频帧进行组合，获得所述模型训练视频。

在上述终端中，所述模型训练单元，具体用于判断所述模型训练视频是否满足预设自动驾驶样本视频条件；若所述模型训练视频不满足所述预设自动驾驶样本视频条件，对所述预设视频生成模型进行调整，获得所述目标视频生成模型。

在上述终端中，所述模型训练单元，还用于若所述模型训练视频满足所述预设自动驾驶样本视频条件，将所述预设视频生成模型确定为所述目标视频生成模型。

在上述终端中，所述终端还包括：驾驶训练单元；

所述驾驶训练单元，用于根据所述自动驾驶样本视频，进行自动驾驶训练，获得自动驾驶模型；其中，所述自动驾驶模型用于控制自动驾驶操作。

本申请实施例提供了一种终端，处理器、存储器、自编码器和通信总线；

所述通信总线用于实现所述处理器、所述存储器和所述自编码器之间的通信连接；

所述处理器和所述自编码器用于执行所述存储器中存储的视频生成程序，以实现上述视频生成方法。

本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，应用于终端，该计算机程序被处理器和自编码器执行时实现上述视频生成方法。

本申请实施例提供了一种视频生成方法，终端获取待处理视频；将待处理视频输入预设视频生成模型，并通过预设视频生成模型对待处理视频进行处理，获得模型训练视频；其中，预设视频生成模型为待训练成具备生成自动驾驶样本视频功能的模型；基于模型训练视频，对预设视频生成模型进行训练，获得目标视频生成模型；通过目标视频生成模型对待处理视频进行处理，生成自动驾驶样本视频。也就是说，在本申请的实施例中，能够基于较少的已获得的自动驾驶样本视频或路况视频，生成新的满足自动驾驶训练的自动驾驶样本视频，降低了获取自动驾驶样本视频的难度，提高了自动驾驶样本视频获取的智能性。

附图说明

图1为本申请实施例提供的一种视频生成方法的流程示意图一；

图2为本申请实施例提供的一种示例性的视频帧对应的视频帧特征的示意图；

图3为本申请实施例提供的一种视频生成方法的流程示意图二；

图4为本申请实施例提供的一种示例性的自动驾驶的场景示意图；

图5为本申请实施例提供的一种终端的结构示意图一；

图6为本申请实施例提供的一种终端的结构示意图二。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。可以理解的是，此处所描述的具体实施例仅仅用于解释相关申请，而非对该申请的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关申请相关的部分。

实施例一

本申请实施例提供一种视频生成方法，应用于终端，图1为本申请实施例提供的一种视频生成方法的流程示意图一。如图1所示，该方法可以包括：

S101、获取待处理视频。

在本申请的实施例中，终端可以直接获取待处理视频。

需要说明的是，在本申请的实施例中，终端包括处理器、存储器、自编码器和通信总线，其中，通信总线用于实现处理器、存储器和自编码器之间的通信连接，处理器和自编码器用于执行存储器中存储的视频生成程序，以实现本申请提出的视频生成方法。

需要说明的是，在本申请的实施例中，终端可以为任何具备通信和存储功能的设备，例如：平板电脑、个人计算机(Personal Computer，PC)、笔记本电脑、车载设备等设备，具体的根据实际情况进行选择，本申请实施例不作具体的限定。

需要说明的是，在本申请的实施例中，终端的存储器中可以预先存储有待处理视频，待处理视频为由人工对交通视频筛选后获得的，适合用于进行自动驾驶训练的视频，也可以为实时采集的路况视频。具体的待处理视频和待处理视频的帧数本申请实施例不作限定。

可以理解的是，在本申请的实施例中，由于自动驾驶训练主要在于训练车辆应对障碍物等特殊路况下自动处理的能力，因此，人工对交通视频进行筛选时，可以将视频中人、车和障碍物较多的视频筛选出来，同时，还可以关注视频的清晰度等方面进一步筛选，将筛选出的视频作为待处理视频。此外，如果视频中基本上大部分时间均处于畅通无阻，正常行驶的情况，不具备代表性，也可以将其去除，不作为待处理视频。当然，通常路况视频中也包含一些障碍物，也可以反映路况信息，因此同样可以直接实时采集一些路况视频，不将采集的路况视频确定为待处理视频。

具体的，在本申请的实施例中，终端的处理器可以直接从存储器中获取待处理视频，或者，还可以实时进行采集待处理视频。

S102、将待处理视频输入预设视频生成模型，并通过预设视频生成模型对待处理视频进行处理，获得模型训练视频；其中，预设视频生成模型为待训练成具备生成自动驾驶样本视频功能的模型。

在本申请的实施例中，终端在获取到待处理视频之后，可以将待处理视频输入预设视频生成模型，通过预设视频生成模型对待处理视频进行处理，获得模型训练视频。

需要说明的是，在本申请的实施例中，预设视频生成模型可以为根据经验预先设置在终端的一个视频生成模型，终端可以对预设视频生成模型进行训练，训练成具备生成自动驾驶样本视频功能的模型，从而用于自动生成自动驾驶样本视频，而不需要消耗大量人工进行视频筛选或采集等步骤。

具体的，在本申请的实施例中，终端将待处理视频输入预设视频生成模型，通过预设视频生成模型对待处理视频进行处理，获得模型训练视频，包括：自编码器中的编码器按照预设特征提取方式，提取待处理视频中每一帧对应的视频帧特征；处理器对视频帧特征进行特征修改，送入自编码器的解码器生成目标视频帧；处理器将目标视频帧输入预设长短期记忆网络(Long Short-Term Memory，LSTM)，进行视频帧组合，获得模型训练视频。

需要说明的是，在本申请的实施例中，自编码器包括：编码器和解码器，其中，编码器用于进行特征提取，解码器用于进行视频帧生成。

可以理解的是，在本申请的实施例中，自编码器是一种神经网络模型，可以学习到输入数据的特征，即只要对自编码器输入一定的自动驾驶样本视频，就能够学习到其中的特征，从而自编码器的编码器可以根据学习到的特征，对输入的待处理视频的每一帧进行视频帧特征提取。

可以理解的是，在本申请的实施例中，待处理视频是由多个视频帧组成的，自编码器中的编码器是对组成待处理视频的每一个视频帧进行特征提取，获得每一个视频帧对应的视频帧特征。

需要说明的是，在本申请的实施例中，自编码器中的编码器提取的待处理视频的每一个视频帧对应的视频帧特征，可以为每一个视频帧中的车、人或障碍物。具体的视频帧特征本申请实施例不作限定。

需要说明的是，在本申请的实施例中，自编码器中的编码器可以采用预设的提取算法来提取待处理视频的每一个视频帧对应的视频帧特征，例如，自编码器的编码器可以采用全卷积网络(Fully Convolutional Networks，FCN)算法进行视频帧特征提取。具体的提取算法本申请实施例不作限定。

图2为本申请实施例提供的一种示例性的视频帧对应的视频帧特征的示意图。如图2所示，自编码器的编码器可以将视频帧中的车、人和障碍物全部提取出来，即为视频帧对应的视频帧特征，具体包括图中的1、2、3和4。

需要说明的是，在本申请的实施例中，自编码器的编码器提取的待处理视频的每一个视频帧对应的视频帧特征，可以通过权重来进行表示，因此，处理器对视频帧特征进行修改，可以直接修改权重，即实现视频帧特征的修改，从而送入自编码器的解码器，生成目标视频帧，其中，目标视频帧即为待处理视频的每一个视频帧修改特征后的视频帧，处理器可以随机对视频帧特征进行修改，具体的修改方式本申请实施例不作限定。

示例性的，在本申请的实施例中，权重A1对应的视频帧特征B1，权重A2对应的视频帧特征B2，权重A3对应的视频帧特征B3，权重A4对应的视频帧特征B4。自编码器的编码器提取待处理视频的每一个视频帧对应的视频帧特征，其中，提取出待处理视频的第一帧对应的视频帧包括：B1和B2，因此，处理器可以对视频帧特征B1和视频帧特征B2进行修改，随机将第一帧中的权重A1修改为权重A3，将第一帧中的权重A2修改为权重A4，从而得到修改特征后的第一帧。

可以理解的是，在本申请的实施例中，目标视频帧实际上就是对待处理视频的每一个视频帧的特征进行修改后生成的视频帧，因此，目标视频帧的帧数与待处理视频的帧数相同。

需要说明的是，在本申请的实施例中，自编码器的解码器实际上获得的是修改后的待处理视频的每一个视频帧对应的视频帧特征进行修改后的特征对应的权重，基于这些权重，自编码器的解码器将权重这一抽象的数据，解码成图像数据，从而获得目标视频帧。

可以理解的是，在本申请的实施例中，若待处理视频包括N个视频帧，N为大于等于1的自然数，终端的处理器将待处理视频输入预设视频生成模型，进行特征提取、特征修改和视频帧连接处理，实际上是将待处理视频的每一帧依次输入到预设视频生成模型，进行特征提取和特征修改，从而获得修改后的每一帧，即目标视频帧，再将目标视频帧进行组合，获得模型训练视频，模型训练视频即也包括N帧，与待处理视频包括的帧数相同。

需要说明的是，在本申请的实施例中，终端存储有预设LSTM，用于对输入的目标视频帧中每一帧的时间进行预测，并进一步进行组合。

需要说明的是，在本申请的实施例中，LSTM实际上是一种时间递归神经网络，可以针对输入的序列，即目标视频帧，进行时间上的预测。在LSTM中存储有预设预测规则，当目标视频帧输入LSTM之后，根据预设预测规则将进行判断，以确定时间顺序，从而实现目标视频帧的组合。具体的LSTM中的预设预测规则本申请不作限定。

具体的，在本申请的实施例中，终端的处理器将目标视频帧输入预设长短期记忆网络，进行视频帧组合，获得模型训练视频，包括：将目标视频帧输入预设长短期记忆网络，获得目标视频帧中每一帧对应的预测时间；基于预测时间，将目标视频帧进行组合，获得模型训练视频。

示例性的，在本申请的实施例中，目标视频帧包括：第一视频帧、第二视频帧、第三视频帧、第四视频帧、第五视频帧和第六视频帧，终端的处理器将六个视频帧输入预设LSTM，从而基于预设LSTM，获得目标视频帧中每一帧对应的预测时间，其中，第一视频帧对应的预测时间为第一时间，第三视频帧对应的预测时间为第二时间，第四视频帧对应的预测时间为第三时间，第六视频帧对应的预测时间为第四时间，第二视频帧对应的预测时间为第五时间，第五视频帧对应的预测时间为第六时间，第一时间早于第二时间，第二时间早于第三时间，第三时间早于第四时间，第四时间早于第五时间，第五时间早于第六时间，因此，将六个视频帧按照：第一视频帧、第一视频帧、第四视频帧、第六视频帧、第二视频帧和第五视频帧的顺序组合起来，获得模型训练视频。

可以理解的是，在本申请的实施例中，终端可以获取到多个待处理视频，对每一个待处理视频执行步骤S102，从而可以获得对应的多个模型训练视频，用于对预设视频生成模型进行训练。

S103、通过模型训练视频，对预设视频生成模型进行训练，获得目标视频生成模型。

在本申请的实施例中，终端在获得模型训练视频之后，可以通过模型训练视频，对预设视频生成模型进行训练，获得目标视频生成模型，其中，目标视频生成模型能够较为准确的生成适用于训练自动驾驶的自动驾驶样本视频。

具体的，在本申请的实施例中，终端的处理器通过模型训练视频，对预设视频生成模型进行训练，获得目标视频生成模型，包括：判断模型训练视频是否满足预设自动驾驶样本视频条件；若模型训练视频不满足预设自动驾驶样本视频条件，对预设视频生成模型进行调整，获得目标视频生成模型；若模型训练视频满足预设自动驾驶样本视频条件，将预设视频生成模型确定为目标视频生成模型。

需要说明的是，在本申请的实施例中，终端中存储有预设自动驾驶样本视频条件，作为判断一个视频能否作为自动驾驶训练时使用的视频的标准，预设自动驾驶样本视频条件可以为根据实际需求设置的，也可以为根据经验进行设置的。具体的预设自动驾驶样本视频条件本申请实施例不作限定。

示例性的，在本申请的实施例中，预设自动驾驶样本视频条件为：视频中特征的变化符合预设逻辑，即在视频中，随着时间的推移，越靠近特征时，例如，路上的人，显示出的人越大，越远离人，显示出的人越小。因此，终端的处理器判断获得的模型训练视频是否满足预设自动驾驶样本视频条件，若满足，即说明基于预设视频生成模型获得的模型训练视频适用于训练自动驾驶，因此，可以直接将预设视频生成模型确定为目标视频生成模型，用于生成自动驾驶样本视频，若不满足，即说明基于预设视频生成模型获得的模型训练视频不适用于训练自动驾驶，因此，需要对预设视频生成模型进行调整，使调整后的预设视频生成模型能够生成适用于训练自动驾驶的视频，调整获得的预设视频生成模型即为目标视频生成模型。具体的，若终端的处理器判断获得的模型训练视频不满足预设自动驾驶样本视频条件，即说明模型训练视频中特征的变化不合预设逻辑，实际上就是对目标视频帧组合不准确，因此，可以针对将目标视频帧基于预测时间进行组合的预设LSTM中的预设预测规则等进行调整。

示例性的，在本申请的实施例中，预设自动驾驶样本视频条件为：与待处理视频相比，相同位置相同特征的数量大于N，即在视频中，出现的特征，包括：人、车和障碍物，对应的数量大于N。因此，终端的处理器判断模型训练视频是否满足预设自动驾驶样本视频条件，若满足，即说明基于预设视频生成模型获得的模型训练视频适用于训练自动驾驶，因此，可以直接将预设视频生成模型确定为目标视频生成模型，用于生成自动驾驶样本视频，若不满足，即说明基于预设视频生成模型获得的模型训练视频不适用于训练自动驾驶，因此，需要对预设视频生成模型进行调整，使调整后的预设视频生成模型能够生成适用于训练自动驾驶的视频，调整获得的预设视频生成模型即为目标视频生成模型。具体的，若终端的处理器判断获得的模型训练视频不满足预设自动驾驶样本视频条件，即说明模型训练视频与待处理视频相比，相同位置相同特征的数量较多，自编码器的解码器没有完全提取出待处理视频中每一视频帧对应的视频帧特征，即没有完全对视频帧特征进行修改，因此，可以更换自编码器中的编码器的提取算法或对算法中的相关参数进行调整。

可以理解的是，在本申请的实施例中，待处理视频可以为多个，因此，终端最终生成的模型训练视频也可以为多个，终端可以根据一定数量的模型训练视频，对预设视频生成模型进行调整，以保证获得的目标视频生成模型的准确性，即可以准确生成适用于自动驾驶训练的视频。

示例性的，在本申请的实施例中，待处理视频为M个，终端的处理器和自编码器对待处理视频按照预设视频生成模型进行特征提取、特征修改和视频帧连接处理，可以获得M个模型训练视频，之后，处理器可以分别判断这M个模型训练视频是否均满足预设自动驾驶样本视频条件，根据判断结果，相应的对预设视频生成模型进行调整，例如，调整自编码器的编码器提取视频帧时使用的算法，或者，修改LSTM预测时间的预设预测规则，以获得目标视频生成模型。

可以理解的是，在本申请的实施例中，终端根据待处理视频和预设视频生成模型，可以获得模型训练视频，基于模型训练是否是满足预设自动驾驶样本视频条件，进一步对预设视频生成模型进行训练，即对编码器或预设LSTM进行调整，获得能够生成适用于自动驾驶训练的自动驾驶样本视频的目标视频生成模型，从而不再需要大量人工对交通视频进行筛选，只需要人工获取少量的自动驾驶样本视频，输入目标视频生成模型，即可自动获得新的自动驾驶样本视频。

S104、通过目标视频生成模型对待处理视频进行处理，生成自动驾驶样本视频。

在本申请的实施例中，终端在获得目标视频生成模型之后，即可通过目标视频生成模型对待处理视频进行处理，生成自动驾驶样本视频。

可以理解的是，在本申请的实施例中，终端的处理器将待处理视频输入目标视频生成模型，通过目标视频生成模型对待处理视频进行处理，生成自动驾驶样本视频，即为适用于进行自动驾驶训练的视频。

可以理解的是，在本申请的实施例中，终端在生成自动驾驶样本视频之后，还可以将自动驾驶样本视频输入目标视频生成模型，继续生成新的自动驾驶样本视频，因此，仅需要人工筛选出少量的自动驾驶样本视频或采集较少的路况视频，即可基于目标视频生成模型，生成大量适用于进行自动驾驶训练的视频。

需要说明的是，在本申请的实施例中，终端在获得目标视频模型之后，重复执行步骤S104，即可获得大量的自动驾驶样本视频，并根据这些自动驾驶样本视频，进行自动驾驶训练。

图3为本申请实施例提供的一种视频生成方法的流程示意图二。如图3所示，步骤S104之后，还可以包括步骤S105，具体步骤如下：

S105、根据自动驾驶样本视频，进行自动驾驶训练，获得自动驾驶模型；其中，自动驾驶模型用于控制自动驾驶时对应的驾驶操作。

在本申请的实施例中，终端在获取到自动驾驶样本视频之后，可以根据待自动驾驶样本视频，进行自动驾驶训练，获得自动驾驶模型。

可以理解的是，在本申请的实施例中，待处理视频可以为多个，生成的自动驾驶视频也可以为多个，并且，若待处理视频本身属于自动驾驶时候，还可以作为输入，输入到目标视频生成模型，通过目标视频生成模型再生成新的自动驾驶视频，因此，终端实际上获得了大量的自动驾驶样本视频，用于进行自动驾驶训练。

需要说明的是，在本申请的实施例中，终端根据自动驾驶样本视频进行自动驾驶训练，实际上就是根据大量的自动驾驶样本视频，识别出针对不同路况下，进行的驾驶操作处理，也就是说，自动驾驶模型，其中包括了不同路况下对应的驾驶操作，在自动驾驶时，终端可以通过摄像头实时获取到路况，根据自动驾驶模型，确定对应的驾驶操作，自动控制进行相应的驾驶操作。

图4为本申请实施例提供的一种示例性的自动驾驶的场景示意图。如图4所示，终端为车辆A，车辆A在切换到自动驾驶时，车辆A的前置摄像头可以实时获取到当前的路况图像，并进行特征识别，其中，当前时刻下，路况图像中包括的特征为：行人、车辆B、车辆C和车辆D，车辆A根据自动驾驶模型，可以判断出该路况图像下，行人与车辆A距离较近，车辆A需要对行人进行避让，避免出现交通事故，因此，车辆A自动沿箭头a所指示的方向驶向车道1，避免驶向车道2。

本申请实施例提供了一种视频生成方法，终端获取待处理视频；将待处理视频输入预设视频生成模型，并通过预设视频生成模型对待处理视频进行处理，获得模型训练视频；其中，预设视频生成模型为待训练成具备生成自动驾驶样本视频功能的模型；通过模型训练视频，对预设视频生成模型进行训练，获得目标视频生成模型；通过目标视频生成模型对待处理视频进行处理，生成自动驾驶样本视频。也就是说，在本申请的实施例中，能够基于较少的已获得的自动驾驶样本视频或路况视频，生成新的满足自动驾驶训练的自动驾驶样本视频，降低了获取自动驾驶样本视频的难度，提高了自动驾驶样本视频获取的智能性。

实施例二

本申请实施例提供了一种终端，图5为本申请实施例提供的一种终端的结构示意图一。如图5所示，所述终端包括：

获取单元501，用于获取待处理视频；

第一生成单元502，用于将所述待处理视频输入预设视频生成模型，并通过所述预设视频生成模型对所述待处理视频进行处理，获得模型训练视频；其中，所述预设视频生成模型为待训练成具备生成自动驾驶样本视频功能的模型；

模型训练单元503，用于通过所述模型训练视频，对所述预设视频生成模型进行训练，获得目标视频生成模型；

第二生成单元504，用于将通过所述目标视频生成模型对所述待处理视频进行处理，获得自动驾驶样本视频。

可选的，所述第一生成单元502，具体用于按照预设特征提取方式，提取所述待处理视频中每一帧对应的视频帧特征；对所述视频帧特征进行特征修改，生成目标视频帧；将所述目标视频帧输入预设长短期记忆网络，进行视频帧组合，生成所述模型训练视频。

可选的，所述第一生成单元502，具体用于将所述目标视频帧输入所述预设长短期记忆网络，获得所述目标视频帧中每一帧对应的预测时间；基于所述预测时间，将所述目标视频帧进行组合，获得所述模型训练视频。

可选的，所述模型训练单元503，具体用于判断所述模型训练视频是否满足预设自动驾驶样本视频条件；若所述模型训练视频不满足所述预设自动驾驶样本视频条件，对所述预设视频生成模型进行调整，获得所述目标视频生成模型。

可选的，所述模型训练单元503，还用于若所述模型训练视频满足所述预设自动驾驶样本视频条件，将所述预设视频生成模型确定为所述目标视频生成模型。

可选的，所述终端还包括：驾驶训练单元505；

所述驾驶训练单元305，用于根据所述自动驾驶样本视频，进行自动驾驶训练，获得自动驾驶模型；其中，所述自动驾驶模型用于控制自动驾驶操作。

图6为本申请实施例提供的一种终端的结构示意图二。如图6所示，所述终端包括：处理器601、存储器602、自编码器403和通信总线604；

所述通信总线604用于实现所述处理器601、所述存储器602和所述自编码器603之间的通信连接；

所述处理器601和所述自编码器603用于执行所述存储器602中存储的视频生成程序，以实现上述视频生成方法。

本申请实施例提供了一种终端，获取待处理视频；将待处理视频输入预设视频生成模型，通过预设视频生成模型对待处理视频进行处理，获得模型训练视频；其中，预设视频生成模型为待训练成具备生成自动驾驶样本视频功能的模型；通过模型训练视频，对预设视频生成模型进行训练，获得目标视频生成模型；通过目标视频生成模型对待处理视频进行处理，生成自动驾驶样本视频。也就是说，本申请提出的终端，能够基于较少的已获得的自动驾驶样本视频或路况视频，生成新的满足自动驾驶训练的自动驾驶样本视频，降低了获取自动驾驶样本视频的难度，提高了自动驾驶样本视频获取的智能性。

本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器和自编码器执行时实现上述视频生成方法。计算机可读存储介质可以是易失性存储器(volatile memory)，例如随机存取存储器(Random-Access Memory，RAM)；或者非易失性存储器(non-volatile memory)，例如只读存储器(Read-Only Memory，ROM)，快闪存储器(flash memory)，硬盘(Hard Disk Drive，HDD)或固态硬盘(Solid-State Drive，SSD)；也可以是包括上述存储器之一或任意组合的各自设备，如移动电话、计算机、平板设备、个人数字助理等。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的实现流程示意图和/或方框图来描述的。应理解可由计算机程序指令实现流程示意图和/或方框图中的每一流程和/或方框、以及实现流程示意图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在实现流程示意图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在实现流程示意图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在实现流程示意图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。

Claims

1.一种视频生成方法，应用于终端，其特征在于，所述方法包括：

获取待处理视频；

通过所述目标视频生成模型对所述待处理视频进行处理，生成自动驾驶样本视频。

2.根据权利要求1所述的方法，其特征在于，所述将所述待处理视频输入预设视频生成模型，并通过所述预设视频生成模型对所述待处理视频进行处理，获得模型训练视频，包括：

对所述视频帧特征进行特征修改，生成目标视频帧；

3.根据权利要求2所述的方法，其特征在于，所述将所述目标视频帧输入预设长短期记忆网络，进行视频帧组合，获得所述模型训练视频，包括：

4.根据权利要求1所述的方法，其特征在于，所述通过所述模型训练视频，对所述预设视频生成模型进行训练，获得目标视频生成模型，包括：

5.根据权利要求4所述的方法，其特征在于，所述判断所述模型训练视频是否满足预设自动驾驶样本视频条件之后，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，所述生成自动驾驶样本视频之后，所述方法还包括：

7.一种终端，其特征在于，所述终端包括：

获取单元，用于获取待处理视频；

第二生成单元，用于通过所述目标视频生成模型对所述待处理视频进行处理，生成自动驾驶样本视频。

8.根据权利要求7所述的终端，其特征在于，

所述第一生成单元，具体用于按照预设特征提取方式，提取所述待处理视频中每一帧对应的视频帧特征；对所述视频帧特征进行特征修改，生成目标视频帧；将所述目标视频帧输入预设长短期记忆网络，进行视频帧组合，生成所述模型训练视频。

9.根据权利要求8所述的终端，其特征在于，

所述第一生成单元，具体用于将所述目标视频帧输入所述预设长短期记忆网络，获得所述目标视频帧中每一帧对应的预测时间；基于所述预测时间，将所述目标视频帧进行组合，获得所述模型训练视频。

10.根据权利要求7所述的终端，其特征在于，

所述模型训练单元，具体用于判断所述模型训练视频是否满足预设自动驾驶样本视频条件；若所述模型训练视频不满足所述预设自动驾驶样本视频条件，对所述预设视频生成模型进行调整，获得所述目标视频生成模型。

11.根据权利要求10所述的终端，其特征在于，

所述模型训练单元，还用于若所述模型训练视频满足所述预设自动驾驶样本视频条件，将所述预设视频生成模型确定为所述目标视频生成模型。

12.根据权利要求7所述的终端，其特征在于，所述终端还包括：驾驶训练单元；

13.一种终端，其特征在于，所述终端包括：处理器、存储器、自编码器和通信总线；

所述处理器和所述自编码器用于执行所述存储器中存储的视频生成程序，以实现权利要求1-6任一项所述的方法。

14.一种计算机可读存储介质，其上存储有计算机程序，应用于终端，其特征在于，该计算机程序被处理器和自编码器执行时实现如权利要求1-6任一项所述的方法。