CN112446822A

CN112446822A - 一种污损集装箱号图片的生成方法

Info

Publication number: CN112446822A
Application number: CN202110124893.0A
Authority: CN
Inventors: 尹俊奇; 周振宇; 黄熠; 李颖; 任林涛
Original assignee: Jushi Technology Jiangsu Co ltd
Current assignee: Jushi Technology Jiangsu Co ltd
Priority date: 2021-01-29
Filing date: 2021-01-29
Publication date: 2021-03-05
Anticipated expiration: 2041-01-29
Also published as: CN112446822B

Abstract

本发明涉及到图像处理技术领域，具体公开了一种污损集装箱号图片的生成方法。具体步骤包括：基于干净的集装箱箱面图片做深度估计，拟合集装箱箱面所在平面；然后绘制随机的集装箱号并与集装箱箱面图片进行合成；再以合成图片为源域图像，以真实的污损集装箱号图片为目标域图像训练风格迁移模型；最后使用风格迁移模型应用于合成的图片，变换为污损的集装箱号图片。本发明提出的图片生成方法可以按需要生成任意数量的污损集装箱号图片，且生成所得图片非常接近真实场景采集的图片，生成图片可作为数据增广样本更好地训练集装箱箱号识别算法。

Description

一种污损集装箱号图片的生成方法

技术领域

本发明涉及图像识别技术领域，特别涉及一种污损集装箱号图片的生成方法。

背景技术

集装箱号指装运出口货物的集装箱箱号，采用ISO6346（1995）标准，集装箱箱号识别在港口理货环节中起着重要的作用，有效地提升了港口理货效率，并在安全方面为港口理货提供保障，节约成本。

随着深度学习、计算机视觉等技术的发展，越来越多的集装箱箱号识别算法基于深度学习方法进行设计和实现，基于深度学习的集装箱箱号识别算法往往拥有较高的准确性和泛化性能。

尽管如此，这些集装箱箱号识别算法仍然难以识别表面污损的集装箱号，难以推进污损集装箱号图片帮助集装箱箱号识别算法的训练。因此有必要提出一种污损集装箱号图片的生成方法。

发明内容

本发明的目的在于提供一种污损集装箱号图片的生成方法，用以生成任意数量的污损集装箱号图片，以帮助训练集装箱箱号识别算法。

一种污损集装箱号图片的生成方法，包括以下步骤：

S1. 获取干净的集装箱箱面图片作为背景图片；

S2. 对集装箱背景图片进行深度估计；

S3. 在结合了深度信息的背景图片上拟合集装箱箱面所在平面；

S4. 拟合平面内绘制随机的集装箱号；

S5. 将集装箱号与集装箱背景图片进行合成；

S6. 以步骤S5合成的图片为源域图像，以污损集装箱号图片为目标域图像训练风格迁移模型；

S7. 使用风格迁移模型应用于步骤S5合成的图片，变换为污损的集装箱号图片。

作为优选，所述步骤S2中基于CNN的深度估计算法对集装箱背景图片进行深度估计。

作为优选，所述步骤S3中使用RANSAC算法。

作为优选，所述步骤S4使用python的PIL库绘制随机的集装箱号。

作为优选，所述风格迁移模型为CycleGAN的风格迁移模型。进一步地，所述风格迁移模型训练包括以下步骤：

S61. 以步骤S5合成的图片为源域图像，以真实的污损集装箱号图片为目标域图像，划分训练集、验证集和测试集；

S62. 构建风格迁移的神经网络结构CycleGAN，由两个生成器网络和两个判别器网络构成；

S63. 构建如下损失函数及目标函数：

Adversarial loss：

Consistency loss：

总体loss：

其中，x表示域X内的样本，y表示域Y内的样本；G表示X域转到Y域的生成器，F表示Y域到X域的生成器，DX表示域X的判别器，DY表示域Y的判别器；

目标函数：

S64. 训练CycleGAN网络至loss收敛，保存模型。

作为优选，所述步骤S1选择干净的集装箱箱面图片作为背景图片，或选择任意集装箱图片，通过分割算法将不含文字的箱面区域分割出来作为背景图片。

相对于现有技术，本发明的有益效果为：

1. 本发明提出的图片生成方法可以按需要生成任意数量的集装箱号图片，且生成所得图片非常接近真实场景采集的图片。

2. 本发明通过深度估计算法和RANSAC算法，使生成的集装箱号与集装箱箱面在空间上处于同一平面，增加生成图片的真实性。

3. 本发明通过风格迁移算法将生成的集装箱号图片转换成污损的集装箱号，使用该方法得到的数据增广样本可以显著提升文本识别算法的泛化性，提升污损集装箱号的识别准确率。

4. 本发明只需较少的真实样本就可以生成无穷多的虚拟样本，极大地节约了人工采集和标注数据的工作量。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明一种污损集装箱号图片的生成方法的流程图。

图2为本发明风格迁移算法示意图。

具体实施方式

为了使本发明的目的、技术方案和有益技术效果更加清晰明白，以下结合附图和具体实施方式，对本发明进行进一步详细说明。应当理解的是，本说明书中描述的具体实施方式仅仅是为了解释本发明，并不是为了限定本发明。

如图1所示，本发明提供一种污损集装箱号图片的生成方法。

以下是本发明具体的实施例：

1. 获得集装箱箱面背景图片：选择干净的集装箱箱面图片作为背景图片，或者选择任意集装箱图片，通过分割算法将不含文字的箱面区域分割出来作为背景图片，防止生成的集装箱号与箱面上已有的文字重叠。

2. 使用基于CNN的深度估计算法对集装箱背景图片进行深度估计。使用论文F.Liu, C. Shen, and G. Lin. Deep convolutional neural fields for depthestimation from a single image. In Proc. CVPR, 2015.中的方法预测集装箱背景图片的深度信息。

3. 使用RANSAC算法(M. A. Fischler and R. C. Bolles. Random sampleconsensus: A paradigm for model fitting with applications to image analysisand automated cartography. Comm. ACM, 24(6):381–395, 1981.)在结合了深度信息的背景图片上拟合集装箱箱面所在平面。根据拟合的平面计算出一组透视变换参数，该组透视变换参数可将生成的文字变换到与集装箱号同一平面，使得合成文字图片在空间上更加真实自然。

4. 使用python的PIL库绘制随机的集装箱号，包括水平方向箱号和垂直方向箱号。为了增加生成集装箱号的多样性，我们对集装箱号应用一些数据增广方法，比如扭曲畸变、拉伸、模糊等。此外，使用不同的字体、字号、间距、颜色也可以增加生成集装箱号的多样性。根据集装箱箱主数据库和集装箱验证码规则可以组合出任意的实际可能存在的集装箱号对应的文字序列，基于这些文字序列生成集装箱号可以有效减少生成实际不存在的集装箱号的可能性。

5. 对绘制的集装箱号应用步骤四所得透视变换，使得生成的文字与背景图片可以更好地融合，增加生成图片的真实性。然后，将集装箱背景图片和集装箱号图片进行合并，裁切出集装箱号区域，即得到合成的集装箱号图片。

6. 训练基于CycleGAN的风格迁移的模型。具体包括以下步骤：

1）获得源域图像和目标域图像，划分训练集、验证集和测试集。源域图像是步骤五得到的合成集装箱号图片。目标域图像是真实的污损集装箱号图片。

2）构建风格迁移的神经网络结构。如图2所示，CycleGAN由两个生成器网络和两个判别器网络构成。域X表示合成集装箱号图片的分布，域Y表示真实集装箱号图片的分布，G是将域X转换到域Y的生成器，D_Y是域Y的判别器，F是域Y转换到域X的生成器，D_X是域X的判别器。

3）损失函数由以下几部分组成：

Adversarial loss：

Consistency loss：

总体loss：

其中x表示域X内的样本，y表示域Y内的样本。G表示X域转到Y域的生成器，F表示Y域到X域的生成器，DX表示域X的判别器，DY表示域Y的判别器。

目标函数：

4）训练CycleGAN网络至loss收敛，保存模型。

7. 使用步骤六所得风格迁移模型G对步骤五所得集装箱号合成图片应用风格迁移。由于G是一个合成集装箱号X到污损集装箱号Y的映射，故可以将合成集装箱号图片变换为污损的集装箱号图片。

本发明并不仅仅限于说明书和实施方式中所描述，因此对于熟悉领域的人员而言可容易地实现另外的优点和修改，故在不背离权利要求及等同范围所限定的一般概念的精神和范围的情况下，本发明并不限于特定的细节、代表性的设备和这里示出与描述的图示示例。