CN110769196A

CN110769196A - 一种用于非连续监控路段的视频预测方法

Info

Publication number: CN110769196A
Application number: CN201910987781.0A
Authority: CN
Inventors: 史再峰; 任辉政; 罗韬; 瑟福; 樊强强
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2019-10-17
Filing date: 2019-10-17
Publication date: 2020-02-07

Abstract

本发明公开用于非连续监控路段的视频预测方法，包括：构建基于生成对抗网络的视频预测生成模型GAN：视频预测生成模型GAN由生成网络G和鉴别网络D组成；鉴别网络D通过学习训练以正确区分由生成网络G生成的视频序列

与真实视频序列Y；将训练集数据输入预测生成模型GAN网络训练；将训练完成的生成网络模型参数导出，利用一组来自网络公共数据库的真是视频序列作为输入数据，通过该生成网络模型输出相应的预测的视频序列。本发明可利用本发明所提出的基于深度学习的方法实现对交通监管过程中两摄像头间区域非连续监控路段进行视频预测。

Description

一种用于非连续监控路段的视频预测方法

技术领域

本发明涉及视频监控技术领域，特别是涉及一种用于非连续监控路段的视频预测方法。

背景技术

一些需要进行监控的交通路段由于施工成本、技术限制或自然/人为破坏，往往会缺失摄像头的监控，为了便于交通监管(如判断行车是否超速)与针对车辆(行人)的目标跟踪等，因此，亟需一种应用于非连续监控路段的视频预测方法。

发明内容

本发明的目的是针对现有技术中存在的视频预测技术在应用于交通监管与目标跟踪时难以得到长期、清晰的结果的难题，而提供一种用于非连续监控路段的视频预测方法，具体是一种对公共交通监控环境中因摄像头监控视域不连续而产生的监控盲区路段进行视频预测的方法。

为实现本发明的目的所采用的技术方案是：

一种用于非连续监控路段的视频预测方法，包括：

S1.构建基于生成对抗网络的视频预测生成模型GAN：

所述视频预测生成模型GAN由生成网络G和鉴别网络D组成；

所述鉴别网络D通过学习训练以正确区分由生成网络G生成的视频序列

与真实视频序列Y；

S2.将训练集数据输入预测生成模型GAN进行网络训练；

S3.将验证样本集输入S2训练完成的网络模型中，测试评估网络性能，若反馈的性能指标指标不符合要求，则调整超参数与各权重初始值，重复步骤S2，重新训练网络及评估过程，直到符合要求；

S4.将训练完成的生成网络模型参数导出，利用一组来自网络公共数据库的真是视频序列作为输入数据，通过该生成网络模型输出相应的预测的视频序列。

本发明通过以上技术方案，便可利用本发明所提出的基于深度学习的方法实现对交通监管过程中两摄像头间区域非连续监控路段进行视频预测。

附图说明

图1本发明的用于非连续监控路段的视频预测方法的整体流程示意图。

图2本发明的生成对抗网络结构示意图。

图3本发明的生成网络结构示意图。

具体实施方式

以下结合附图和具体实施例对本发明作进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，本发明用于非连续监控路段的视频预测方法，其步骤如下：

S1.构建基于生成对抗网络的视频预测生成模型GAN：所述视频预测生成模型GAN由生成网络G和鉴别网络D组成；所述鉴别网络D通过学习训练以正确区分由生成网络G生成的视频序列

与真实视频序列Y；

S2.将训练集数据输入预测生成模型GAN进行网络训练；

其中，所述构建基于生成对抗网络的视频预测生成模型GAN的步骤如下：

1.视频数据集构建及标注：

将来自网络公共数据库的数据进行人工标注和扩充，以得到充足的视频序列数据集，最终结果按8：2的比例分组，分别得到训练集和测试集数据。

其中，标注过程为通过计算机脚本对视频序列中每个目标对象添加标签信息；扩充数据集的方法包含以下两种方式：

1)对来自网络公共数据库的视频数据集进行复制并人工处理以扩充视频序列数据集，人工处理的方法包括对视频图像的亮度及对比度进行调节，对行人对象及其运动轨迹进行镜像翻转、对视频图像进行随机平移、随机旋转等；

2)根据网络公共数据库的视频数据，通过计算机脚本，模拟视频序列中运动目标的大小、虚拟运动轨迹(包含初始位置与消失位置)、运动速度与加速度等状态变量；再通过物理建模构建包含背景要素信息与运动的多目标数据的视频序列。

2.构建生成对抗网络：

所述生成对抗网络(GAN)由生成网络G和鉴别网络D组成，结构如图2所示。所述的生成网络G以视频序列X＝{X_t|t＝1,…m}为输入，生成能欺骗鉴别网络D的视频序列

与真实视频序列Y＝{Y_k|k＝1,…n}。

所述生成网络G具体结构如图3所示，由编码层、转换层、解码层构成：其中编码层由连续3层卷积网络构成，卷积核数量、大小、步长参数分别为(128,7×7,4)、(256,7×7,4)、(512,5×5,4)；转换层由4层残差网络构成；解码层由3层反卷积层构成，卷积核数量、大小、步长参数分别为(256,3×3,2)、(128,3×3,2)、(128,2×2,1)，解码层输出视频帧大小、深度与输入相同。

其中，所述鉴别网络D由连续5层卷积网络层与1个sigmod激活块构成，前4层卷积层用于提取图像特征，第5层卷积层根据高层特征判断图像真伪，经Sigmoid函数激活后产生1维输出鉴别结果(0,1)。

其中，5层卷积网络层的各层卷积核数量、大小、步长参数分别为(64,7×7,4)、(128,7×7,4)、(256,2×2,2)、(512,5×5,3)、(1,2×2,2)。

其中，所述生成对抗网络的损失函数为二元交叉熵损失函数，计算方法为：

其中，D(Y_k)，D(G(X_t))分别表示鉴别网络D判断样本Y_k，

来自真实视频帧数据集数据Y的概率，其中

和

分别指当视频序列数据中变量Y_k符合概率密度函数Pdata(Y_k)时对应于[D(Y_k)-1]²的期望值与当X_t符合概率密度函数Pdata(X_t)时对应于[D(X_t)-1]²的期望值。

本发明中，对生成网络G和鉴别网络D的训练过程可以用下式表示：

其中G^*,D^*分别是生成网络G和鉴别网络D的最优解训练目标，是获得令鉴别网络D鉴别准确率最高的权重参数和具有对鉴别网络最强欺骗能力的生成网络G的权重参数。

本发明中，生成网络G和鉴别网络D的训练过程为以下两个步骤A、B的迭代过程：

步骤A是固定生成网络权重参数，基于预设的鉴别网络的学习率等超参数值，利用梯度下降法训练鉴别网络以更新其权重等参数值；步骤B是固定鉴别网络权重参数，利用梯度下降法训练生成网络以更新其权重等参数值；

其中步骤A、B的迭代过程是，多次执行步骤A后，执行一次步骤B，重复该迭代过程，直至总损失函数最低,即鉴别网络无法鉴别生成网络生成的视频帧序列和真实视频帧序列时，即完成训练。

需要说明的是，本发明中，所述GAN包含一个以随机噪声作为输入生成视频序列的生成网络模型(Generate Model)G，和一个以视频序列作为输入判断其真实性的鉴别模型(Discriminal Model)D。在训练过程中，生成网络G将尽量生成真实的视频序列去欺骗鉴别网络D。而D将尽量把G生成的和真实的视频序列区分开来，G和D构成了一个动态“博弈过程”。直到反复训练迭代后，在理想状态下，G将生成足够贴合真实的视频序列，而D将难以判定G的结果的真实性。

本发明提出的基于深度学习的非连续监控路段视频预测方法，是一种无监督视频预测的生成网络构造和训练方法，相比传统的视频预测方法具有更少的计算量以及更好的效果。

本发明提出的基于深度学习的非连续监控路段视频预测方法通过生成网络G与鉴别网络D相拮抗的方式进行总体模型的训练，有效提高了生成网络针对交通监管与目标管理在监控缺失的路段内进行视频预测生成的精度；

本发明在输入视频具有不同光照条件，多个移动目标间频繁遮挡，相互影响及表观相似等复杂情况下下，均能实现较长时间清晰度可观的预测视频。

以上所述仅是本发明的优选实施方式，应当指出的是，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种用于非连续监控路段的视频预测方法，其特征在于，包括步骤：

S1.构建基于生成对抗网络的视频预测生成模型GAN：

所述视频预测生成模型GAN由生成网络G和鉴别网络D组成；

与真实视频序列Y；

S2.将训练集数据输入预测生成模型GAN进行网络训练；

S3.将测试集数据输入S2训练完成的网络模型中，测试评估网络性能，若反馈的性能指标指标不符合要求，则调整超参数与各权重初始值，重复步骤S2，重新训练网络及评估过程，直到符合要求；

2.根据权利要求1所述用于非连续监控路段的视频预测方法，其特征在于，所述生成对抗网络的损失函数为二元交叉熵损失函数，计算方法为：

其中，D(Y_k)，D(G(X_t))分别表示鉴别网络D判断样本Y_k，

来自真实视频帧数据集数据Y的概率，其中

和

3.根据权利要求2所述用于非连续监控路段的视频预测方法，其特征在于，对生成网络G和鉴别网络D的训练过程可以用下式表示：

4.根据权利要求2所述用于非连续监控路段的视频预测方法，其特征在于，生成网络G和鉴别网络D的训练过程为以下两个步骤A、B的迭代过程：

5.根据权利要求1所述用于非连续监控路段的视频预测方法，其特征在于，步骤S2所述训练集数据以及用于验证步骤S2获得的网络模型的测试集数据，是将来自网络公共数据库的数据进行人工标注和扩充所得到，最终得到的数据集按8：2的比例分组，分别得到训练集数据和测试集数据。

6.根据权利要求5所述用于非连续监控路段的视频预测方法，其特征在于，所述的标注过程为通过计算机脚本对视频序列中每个目标对象添加标签信息。

7.根据权利要求5所述用于非连续监控路段的视频预测方法，其特征在于，所述扩充数据集的方法包含以下两种方式：

1).对来自网络公共数据库的视频数据集进行复制并人工处理以扩充视频序列数据集，人工处理的方法包括对视频图像的亮度及对比度进行调节，对行人对象及其运动轨迹进行镜像翻转、对视频图像进行随机平移、随机旋转；

2).根据网络公共数据库的视频数据，通过计算机脚本，模拟视频序列中运动目标的大小、初始位置与消失位置的虚拟运动轨迹、运动速度与加速度等状态变量；再通过物理建模简单构建包含背景与运动的多目标的视频序列。