CN112509129A

CN112509129A - 一种基于改进gan网络的空间视场图像生成方法

Info

Publication number: CN112509129A
Application number: CN202011517733.4A
Authority: CN
Inventors: 朱锦雷; 张传锋; 井焜; 朱爱红
Original assignee: Synthesis Electronic Technology Co Ltd
Current assignee: Synthesis Electronic Technology Co Ltd
Priority date: 2020-12-21
Filing date: 2020-12-21
Publication date: 2021-03-16
Anticipated expiration: 2040-12-21
Also published as: CN112509129B

Abstract

本发明公开一种基于改进GAN网络的空间视场图像生成方法，本方法将重叠面积大于阈值的样本划分为一组，从不同组中分别抽取数据加入训练集与验证集，根据样本参数即三维位置（x,y,z）、视角（yaw，pitch，roll）和焦距（f），训练集向验证集指定样本几何投射，得到该样本的投射训练集，GAN网络以投射训练集训练生成模型，以其对应的验证集样本训练判别模型。本方法是一个不经过三维空间建模的视场图像生成方法，即输入其它参数的二维图像序列，得到一个新参数条件下的二维视场图像，中间没有三维空间建模过程。

Description

一种基于改进GAN网络的空间视场图像生成方法

技术领域

本发明涉及一种基于改进GAN网络的空间视场图像生成方法，属于机器学习与图像处理领域。

背景技术

生成式对抗网络（GAN, Generative Adversarial Networks ）是一种深度学习模型，是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中（至少）两个模块：生成模型（Generative Model）和判别模型（Discriminative Model）的互相博弈学习产生相当好的输出。近年来，GAN网络经常用于生成新图片，也可用于空间信息的生成，如将多角度二维图像变换为三维空间图像。

目前空间图像生成存在三个方面需要改进：一是，在训练模型时，需要先用专业设备采集空间数据进行三维建模，要求数据覆盖性完整，才能生成好的三维空间模型，进而基于三维空间模型生成某一位置与方向（观察者视角）的二维视场图像，没有采用二维图像序列向特定视场直接计算的方法获得；二是，在已知相机参数时，传统的计算机图像学经典方法可以进行二维图像投射，但投射后的目标视场图像可能不完整或者有较配准偏差，GAN网络在处理这一类问题时具有显著优势；三是，当可供选择的样本比较多时，采用基于已知样本序列，采用迭代方式生成目标视频图像，使图像变得更加清晰，如何通过记忆方式增强生成图像是一大技术难题。

发明内容

本发明要解决的技术问题是提供一种基于改进GAN网络的空间视场图像生成方法，从其他参数的二维图像序列得到一个新参数条件下的二维视场图像，中间没有三维空间建模过程。

为了解决所述技术问题，本发明采用的技术方案是：一种基于改进GAN网络的空间视场图像生成方法，包括以下步骤：

S01）、输入不同地点、不同视角采集的二维样本图像，并对二维样本图像进行标注，样本标注参数包括图像三维坐标（x,y,z）、视角（yaw,pich,roll）和焦距f，其中yaw表示偏航角，pitch表示俯仰角，roll表示翻滚角；

S02）、根据样本标注参数与空间几何投射方法，计算出从不同角度、不通过位置拍摄的图像是否存在同一物理目标，抽取重叠面积大于指定阈值的样本图像标记为重叠组；

S03）、从每个重叠组的样本中抽取部分数据加入训练集，其余加入验证集，其中训练集用于GAN网络中的生成模型，验证集用于GAN网络中的判别模型；

S04）、重叠组中的训练集向验证集指定样本几何投射，得到该样本的投射训练集；

S05）、基于投射训练集的训练过程，训练包括两个阶段，第一阶段基于验证集指定样本的投射训练集训练生成网络模型，第二阶段基于验证集指定样本的投射训练集和生成网络模型图像训练判别网络模型；其中，生成网络模型的编码模块与解码模块之间植入记忆单元，使生成网络模型具有记忆功能；

S06）、指定观察参数预测视场图像，如果想得到某一视场二维图像，输入待获取二维图像的三维坐标（x,y,z）、视角（yaw,pich,roll）和焦距f，抽取与该视场重叠的原始样本图像，并完成相应空间几何投射，投射图像序列依次输入生成网络模型，从而得到该视场的二维图像。

进一步的，验证集指定样本的投射训练集为正样本，生成网络模型图像为负样本。

进一步的，记忆单元为GRU或者LSTM单元；同一组训练样本输入训练时，在初始状态，记忆单元首先按投射面积大小作为贡献能力降序排列，先后输入至GAN网络编码模块；生成场景图像与真实场景图像经由判别模型时，计算出相似度，把相似度作为样本组中各样本的贡献能力，重新降序排列，以调整输入顺序。

本发明的有益效果：本发明将重叠面积大于阈值的样本划分为一组，从不同组中分别抽取数据加入训练集与验证集，根据样本参数即三维位置（x, y, z）、视角（yaw，pitch，roll）和焦距（f），训练集向验证集指定样本几何投射，得到该样本的投射训练集，GAN网络以投射训练集训练生成模型，以其对应的验证集样本训练判别模型。

生成网络模型具有记忆功能，即在编码模块与解码模块之间植入GRU/LSTM等类似单元，投射训练集序列输入时，可以不断生成增强后的视场图像。其特征在于，其记忆能力还体现在，同一组训练样本输入训练时，在初始状态，首先按投射面积大小作为贡献能力降序排列，先后输入至GAN网络编码模块；生成场景图像与真实场景图像经由判别模型时，会计算出相似度（属于GAN网络常识内容），把相似度作为样本组中各样本的贡献能力，重新降序排列，以调整输入顺序。

本方法是一个不经过三维空间建模的视场图像生成方法，即输入其它参数的二维图像序列，得到一个新参数条件下的二维视场图像，中间没有三维空间建模过程。

具体实施方式

下面结合具体实施例对本发明组进一步的说明。

实施例1

本实施例公开一种基于改进GAN网络的空间视场图像生成方法，包括以下步骤：

S01）、输入不同地点、不同视角采集的二维样本图像，并对二维样本图像进行标注，样本标注参数包括图像三维坐标（x,y,z）、视角（yaw,pich,roll）和焦距f，其中yaw表示偏航角，pitch表示俯仰角，roll表示翻滚角；图像三维坐标（x,y,z）、视角（yaw,pich,roll）通过在摄像机上增加相应的传感器实现；

本实施例中，验证集指定样本的投射训练集为正样本，生成网络模型图像为负样本。

本实施例中，记忆单元为GRU或者LSTM单元。投射训练集序列输入时，可以不断生成增强后的视场图像。其记忆能力还体现在，同一组训练样本输入训练时，在初始状态，首先按投射面积大小作为贡献能力降序排列，先后输入至GAN网络编码模块；生成场景图像与真实场景图像经由判别模型时，会计算出相似度（属于GAN网络常识内容），把相似度作为样本组中各样本的贡献能力，重新降序排列，以调整输入顺序。

该方法主要用于基于改进GAN网络的空间三维影像视图生成，可用于视觉目标空间位置估计、人物导览导航等领域。该方法本质上是，采用创新的GAN网络结构，训练样本包括随意抓拍的系列二维图片，以及各二维图片对应的三维视角，输入改进后的GAN网络进行训练形成模型，预测时随意输入生成器几张周围图片即可自动合成出三维空间的二维视图。

以上描述的仅是本发明的基本原理和优选实施例，本领域技术人员根据本发明做出的改进和替换，属于本发明的保护范围。

Claims

1.一种基于改进GAN网络的空间视场图像生成方法，其特征在于：包括以下步骤：

S02）、根据样本标注参数与空间几何投射方法，计算出从不同角度、不通过位置拍摄的图像是否存在同一物理目标，若存在同一物理目标，抽取重叠面积大于指定阈值的样本图像标记为重叠组；

2.根据权利要求1所述的基于改进GAN网络的空间视场图像生成方法，其特征在于：验证集指定样本的投射训练集为正样本，生成网络模型图像为负样本。

3.根据权利要求1所述的基于改进GAN网络的空间视场图像生成方法，其特征在于：记忆单元为GRU或者LSTM单元；同一组训练样本输入训练时，在初始状态，记忆单元首先按投射面积大小作为贡献能力降序排列，先后输入至GAN网络编码模块；生成场景图像与真实场景图像经由判别模型时，计算出相似度，把相似度作为样本组中各样本的贡献能力，重新降序排列，以调整输入顺序。