CN111414844A

CN111414844A - 一种基于卷积循环神经网络的集装箱箱号识别方法

Info

Publication number: CN111414844A
Application number: CN202010188543.6A
Authority: CN
Inventors: 张聪; 靳松直; 周斌; 张辉; 王浩; 韦海萍; 郑文娟; 高仕博; 郑智辉; 郝梦茜; 丛龙剑; 刘严羊硕; 李少军; 刘燕欣; 高琪; 张艺明
Original assignee: Beijing Aerospace Automatic Control Research Institute
Current assignee: Beijing Aerospace Automatic Control Research Institute
Priority date: 2020-03-17
Filing date: 2020-03-17
Publication date: 2020-07-14
Anticipated expiration: 2040-03-17
Also published as: CN111414844B

Abstract

本发明公开了一种基于卷积循环神经网络的集装箱箱号识别方法，所述方法包括如下步骤：步骤1：采集集装箱样本图像，根据集装箱样本图像构建循环卷积神经网络模型，对循环卷积神经网络模型训练后得到分类器；步骤2：计算图像透视变换矩阵；步骤3：利用步骤2得到的图像透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像；步骤4：使用步骤1的分类器对透视变换后的图像进行字符识别得到字符识别结果；步骤5：利用集装箱箱号规则对字符识别结果进行核对校验，输出最终的箱号检测结果。本发明对神经网络结构和参数进行优化，具有更高的识别率和可靠性；对图像进行透视变换，提高不同角度安装摄像头应用该方法的鲁棒性。

Description

一种基于卷积循环神经网络的集装箱箱号识别方法

技术领域

本发明属于集装箱箱号识别技术领域，尤其涉及一种基于卷积循环神经网络的集装箱箱号识别方法。

背景技术

集装箱箱号是集装箱的唯一身份标识，是智慧港口、集装箱自动化系统的重要基础信息。基于光学字符识别的箱号识别系统，无需对集装箱增加额外设备，只需获取包含集装箱箱号的图像即可实现，已成为现代化港口箱号识别的主流。

目前较为流行的光学字符识别算法主要分为两种，一种是基于模板匹配的算法，另一种是基于神经网络的算法。前者方法较为简单易于实现，但由于集装箱箱体的凹凸折纹、光照或恶劣天气等因素的影响，其准确率和可靠性较低。后者具有一定的自学习能力，尤其近年来随着深度学习算法和硬件的飞速发展，基于神经网络的字符识别受到越来越多的关注。

然而实际应用场景下，我们所能获取的集装箱箱号图像通常还受摄像头安装位置影响，图像存在较大角度的透视变形，传统的基于神经网络无法直接得到较好的结果。

发明内容

本发明解决的技术问题是：克服现有技术的不足，提供了一种基于卷积循环神经网络的集装箱箱号识别方法，对神经网络结构和参数进行优化，具有更高的识别率和可靠性；对图像进行透视变换，提高不同角度安装摄像头应用该方法的鲁棒性。

本发明目的通过以下技术方案予以实现：一种基于卷积循环神经网络的集装箱箱号识别方法，所述方法包括如下步骤：步骤1：采集集装箱样本图像，根据集装箱样本图像构建循环卷积神经网络模型，对循环卷积神经网络模型训练后得到分类器；步骤2：计算图像透视变换矩阵；步骤3：利用步骤2得到的图像透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像；步骤4：使用步骤1的分类器对透视变换后的图像进行字符识别得到字符识别结果；步骤5：利用集装箱箱号规则对字符识别结果进行核对校验，输出最终的箱号检测结果。

上述基于卷积循环神经网络的集装箱箱号识别方法中，在步骤1中，采集集装箱样本图像，根据集装箱样本图像构建循环卷积神经网络模型，对循环卷积神经网络模型训练后得到分类器包括如下步骤：(11)采集集装箱样本图像；(12)将集装箱样本图像缩放至高度32像素和宽度160像素的第二样本图像；将第二样本图像输入卷积神经网络，其中，卷积神经网络包括7层卷积层和4层最大池化；卷积神经网络输出512个特征图，每个特征图高度为1，宽度为40；(13)从步骤(12)得到的特征图中提取特征向量，其中，每个特征向量在特征图上按列从左到右生成，每一列包含512维特征，即第i个特征向量是所有特征图第i列像素的连接，共产生40个特征向量；(14)循环神经网络采用两层各256单元的双向长短型网络，在双向长短型网络的每个时间步传入一个特征向量，其中，时间步的数量为40个，每个时间步输出40个长度为37(26个英文字母+10个阿拉伯数字+1个空字符，其中空字符用“-”表示)的向量，40个向量构成后验概率矩阵；(15)由后验概率矩阵计算损失函数，其中，损失函数定义为概率的负最大似然函数；(16)通过损失函数对卷积循环神经网络进行训练，达到设定的学习次数>100000和精度<0.0001时完成训练，得到分类器。

上述基于卷积循环神经网络的集装箱箱号识别方法中，在步骤2中，计算图像透视变换矩阵包括如下步骤：(21)在待检测集装箱图像中选取4个点(x₁,y₁),(x₂,y₂),(x₃,y₃),(x₄,y₄)，其中，4个点构成的区域包含箱号区域，并在真实空间中为矩形；(22)根据(x₁,y₁),(x₂,y₂),(x₃,y₃),(x₄,y₄)得到待变换后图像上对应点坐标(X₁,Y₁)、(X₂,Y₂)、(X₃,Y₃)、(X₄,Y₄)；(23)将待变换后图像上对应点坐标(X₁,Y₁)、(X₂,Y₂)、(X₃,Y₃)、(X₄,Y₄)带入透视变换矩阵计算公式得到透视变换矩阵。

上述基于卷积循环神经网络的集装箱箱号识别方法中，在步骤3中，利用步骤2得到的图像透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像包括如下步骤：(31)根据步骤(23)中的透视变换矩阵对待检测集装箱图像进行透视变换得到透视变换后的图像；(32)将透视变换后的图像缩放至高度32像素、宽度160像素得到32*160的图像。

上述基于卷积循环神经网络的集装箱箱号识别方法中，在步骤4中，使用步骤1的分类器对透视变换后的图像进行字符识别得到字符识别结果包括如下步骤：(41)将步骤(32)中的32*160的图像输入步骤(16)中训练好的分类器，分类器输出40个时间步的37种字符类别的概率分布；(42)每个时间步取最大概率的字符作为该时间步的输出字符，所有时间步的输出字符组成一个字符序列；(43)删除字符序列中连续重复字符，然后删除所有“-”字符,得到字符识别结果。

上述基于卷积循环神经网络的集装箱箱号识别方法中，在步骤5中，利用集装箱箱号规则对字符识别结果进行核对校验，输出最终的箱号检测结果包括如下步骤：根据集装箱箱号规则对步骤(43)中的字符识别结果进行校验，满足集装箱箱号规则时输出最终的箱号识别结果，否则认为识别错误，输出识别错误信号；其中，集装箱箱号规则为：a)集装箱箱号的前4位是大写英文字母，集装箱箱号的后7位是阿拉伯数字；b)集装箱箱号的第11位是校验字符，能够由前10位字符计算得出。

上述基于卷积循环神经网络的集装箱箱号识别方法中，在步骤(11)中，装箱样本图像的样本训练集为S＝{(x¹,z¹),(x²,z²),...(x^N,z^N)}；其中，x¹为第一个样本，x²为第二个样本，x^N为第N个样本，z¹为第一个样本的标注结果，z²为第二个样本的标注结果，z^N为第N个样本的标注结果，N为样本总数。

上述基于卷积循环神经网络的集装箱箱号识别方法中，步骤(15)中，损失函数为：

其中，O为损失函数，x为样本，l为可能的字符，S为样本集，p(l|x)表示后验概率矩阵中x为字符l的后验概率。

上述基于卷积循环神经网络的集装箱箱号识别方法中，在步骤(22)中，(X₁,Y₁)＝(min(x₁,x₃),min(y₁,y₂))(X₂,Y₂)＝(max(x₂,x₄),Y₁)(X₃,Y₃)＝(X₁,max(y₃,y₄))(X₄,Y₄)＝(X₂,Y₃)；

在步骤(23)中，透视变换矩阵计算公式为：

其中，x为透视变换前图像某点的横坐标，y为透视变换前图像某点的纵坐标，X为透视变换后图像对应点的横坐标，Y为透视变换后图像对应点的纵坐标，a₁₁、a₁₂…a₃₂均为透视变换矩阵系数。

上述基于卷积循环神经网络的集装箱箱号识别方法中，在步骤(31)中，透视变换后的图像为：

其中，m为待检测集装箱图像，M为透视变换后的图像，

为透视变换矩阵。

本发明与现有技术相比具有如下有益效果：

本发明对神经网络结构和参数进行优化，具有更高的识别率和可靠性；对图像进行透视变换，提高不同角度安装摄像头应用该方法的鲁棒性。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是本发明实施例提供的基于卷积循环神经网络的集装箱箱号识别方法的流程图；

图2是本发明实施例提供的卷积神经网络的结构框架图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

图1是本发明实施例提供的基于卷积循环神经网络的集装箱箱号识别方法的流程图。如图1所示，该方法包括如下步骤：

步骤1：采集集装箱样本图像，根据集装箱样本图像构建循环卷积神经网络模型，对循环卷积神经网络模型训练后得到分类器；

步骤2：计算图像透视变换矩阵；

步骤3：利用步骤2得到的图像透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像；

步骤4：使用步骤1的分类器对透视变换后的图像进行字符识别得到字符识别结果；

步骤5：利用集装箱箱号规则对字符识别结果进行核对校验，输出最终的箱号检测结果。

第一部分:卷积循环神经网络模型训练的具体步骤为：

11)人工标注样本图像，样本训练集S＝{(x¹,z¹),(x²,z²),...(x^N,z^N)}，表示有N个训练样本，x是输入样本，z是对应的真实字符；其中，x¹为第一个样本，x²为第二个样本，x^N为第N个样本，z¹为第一个样本的标注结果，z²为第二个样本的标注结果，z^N为第N个样本的标注结果，N为样本总数。

12)将样本图像缩放至高度32像素、宽度160像素；图像输入卷积神经网络，包括7层卷积层和4层最大池化，卷积神经网络如表1；卷积神经网络输出512个特征图，每个特征图高度为1，宽度为40；

表1

13)从步骤12)得到的特征图中提取特征向量，每个特征向量在特征图上按列从左到右生成，每一列包含512维特征，即第i个特征向量是所有特征图第i列像素的连接，共产生40个特征向量；如图2所示。

14)循环神经网络采用两层各256单元的双向LSTM(Long Short Term长短型网络)，在LSTM的每个时间步传入一个特征向量，本发明共40个时间步，每个时间步输出所有可能字符的概率分布，这里输出40个长度为37(26个英文字母+10个阿拉伯数字+1个空字符，其中空字符用“-”表示)的向量，40个向量构成后验概率矩阵；如图2所示。

15)由后验概率矩阵计算损失函数，损失函数定义为概率的负最大似然函数，为方便计算，对似然函数取对数。

16)通过最小化损失函数的方法对卷积循环神经网络进行训练，达到设定的学习次数和精度时完成训练，得到分类器。达到设定的学习次数为学习次数>100000，达到的精度为精度<0.0001。

第二部分：计算图像透视变换的具体步骤为：

21)假设原始图像上一点的坐标为(x,y)，(X,Y)为变换后图像上对应点坐标，透视变换公式为：

其中，

为透视变换矩阵，通常设a₃₃＝1，公式1可改写为

上式8个未知数需要4个点坐标即可求解；

22)在待检测集装箱图像中手动选取4个点，4个点构成的区域必须包含箱号区域，并在真实空间中尽量为矩形。4个点由左到右，由上到下坐标记为(x₁,y₁),(x₂,y₂),(x₃,y₃),(x₄,y₄)；根据(x₁,y₁),(x₂,y₂),(x₃,y₃),(x₄,y₄)得到待变换后图像上对应点坐标(X₁,Y₁)、(X₂,Y₂)、(X₃,Y₃)、(X₄,Y₄)；

23)将待变换后图像上对应点坐标(X₁,Y₁)、(X₂,Y₂)、(X₃,Y₃)、(X₄,Y₄)带入透视变换矩阵计算公式得到透视变换矩阵；

取(X₁,Y₁)＝(min(x₁,x₃),min(y₁,y₂))(X₂,Y₂)＝(max(x₂,x₄),Y₁)(X₃,Y₃)＝(X₁,max(y₃,y₄))(X₄,Y₄)＝(X₂,Y₃)，带入公式(21-2)中可得到透视变换矩阵。

第三部分：利用步骤2得到的透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像的具体步骤为：

31)利用步骤23)中得到的透视变换矩阵，对待检测集装箱图像进行透视变换得到透视变换后的图像；

式中m为原始输入图像，M为透视变换后的图像；

32)将透视变换后的图像缩放至高度32像素、宽度160像素得到32*160的图像；

第四部分：字符识别的具体步骤为：

41)将32*160的图像输入步骤16)中训练好的分类器，分类器输出40个时间步的37种字符类别的概率分布；

42)每个时间步取最大概率的字符作为该时间步的输出字符，所有时间步的输出字符组成一个字符序列；

43)删除字符序列中连续重复字符，然后删除所有“-”字符,得到字符识别结果；

第五部分：利用集装箱箱号规则对字符识别结果进行核对校验，输出最终结果包括如下步骤：

51)集装箱箱号具备以下两条规则：a)前4位是大写英文字母，后7位是阿拉伯数字；b)集装箱箱号的第11位是校验字符，能够由前10位字符计算得出。

52)根据集装箱箱号规则对步骤43)中的字符识别结果进行校验，满足51)中两条规则时输出最终的箱号识别结果，否则认为识别错误，输出识别错误信号。

本发明虽然已以较佳实施例公开如上，但其并不是用来限定本发明，任何本领域技术人员在不脱离本发明的精神和范围内，都可以利用上述揭示的方法和技术内容对本发明技术方案做出可能的变动和修改，因此，凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化及修饰，均属于本发明技术方案的保护范围。

Claims

1.一种基于卷积循环神经网络的集装箱箱号识别方法，其特征在于，所述方法包括如下步骤：

步骤2：计算图像透视变换矩阵；

2.根据权利要求1所述的基于卷积循环神经网络的集装箱箱号识别方法，其特征在于：在步骤1中，采集集装箱样本图像，根据集装箱样本图像构建循环卷积神经网络模型，对循环卷积神经网络模型训练后得到分类器包括如下步骤：

(11)采集集装箱样本图像；

(12)将集装箱样本图像缩放至高度32像素和宽度160像素的第二样本图像；将第二样本图像输入卷积神经网络，卷积神经网络输出512个特征图；

(13)从步骤(12)得到的特征图中提取特征向量；

(14)循环神经网络采用两层各256单元的双向长短型网络，在双向长短型网络的每个时间步传入一个特征向量，其中，时间步的数量为40个，每个时间步输出40个长度为37的向量，40个向量构成后验概率矩阵；

(15)由后验概率矩阵计算损失函数；

(16)通过损失函数对卷积循环神经网络进行训练，达到设定的学习次数>100000和精度<0.0001时完成训练，得到分类器。

3.根据权利要求2所述的基于卷积循环神经网络的集装箱箱号识别方法，其特征在于：在步骤2中，计算图像透视变换矩阵包括如下步骤：

(21)在待检测集装箱图像中选取4个点(x₁,y₁),(x₂,y₂),(x₃,y₃),(x₄,y₄)，其中，4个点构成的区域包含箱号区域，并在真实空间中为矩形；

(22)根据(x₁,y₁),(x₂,y₂),(x₃,y₃),(x₄,y₄)得到待变换后图像上对应点坐标(X₁,Y₁)、(X₂,Y₂)、(X₃,Y₃)、(X₄,Y₄)；

(23)将待变换后图像上对应点坐标(X₁,Y₁)、(X₂,Y₂)、(X₃,Y₃)、(X₄,Y₄)带入透视变换矩阵计算公式得到透视变换矩阵。

4.根据权利要求3所述的基于卷积循环神经网络的集装箱箱号识别方法，其特征在于：在步骤3中，利用步骤2得到的图像透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像包括如下步骤：

(31)根据步骤(23)中的透视变换矩阵对待检测集装箱图像进行透视变换得到透视变换后的图像；

(32)将透视变换后的图像缩放至高度32像素、宽度160像素得到32*160的图像。

5.根据权利要求4所述的基于卷积循环神经网络的集装箱箱号识别方法，其特征在于：在步骤4中，使用步骤1的分类器对透视变换后的图像进行字符识别得到字符识别结果包括如下步骤：

(41)将步骤(32)中的32*160的图像输入步骤(16)中训练好的分类器，分类器输出40个时间步的37种字符类别的概率分布；

(42)每个时间步取最大概率的字符作为该时间步的输出字符，所有时间步的输出字符组成一个字符序列；

(43)删除字符序列中连续重复字符，然后删除所有“-”字符,得到字符识别结果。

6.根据权利要求5所述的基于卷积循环神经网络的集装箱箱号识别方法，其特征在于：在步骤5中，利用集装箱箱号规则对字符识别结果进行核对校验，输出最终的箱号检测结果包括如下步骤：

根据集装箱箱号规则对步骤(43)中的字符识别结果进行校验，满足集装箱箱号规则时输出最终的箱号识别结果，否则认为识别错误，输出识别错误信号；其中，

集装箱箱号规则为：a)集装箱箱号的前4位是大写英文字母，集装箱箱号的后7位是阿拉伯数字；b)集装箱箱号的第11位是校验字符，能够由前10位字符计算得出。

7.根据权利要求2所述的基于卷积循环神经网络的集装箱箱号识别方法，其特征在于：在步骤(11)中，装箱样本图像的样本训练集为S＝{(x¹,z¹),(x²,z²),...(x^N,z^N)}；其中，

x¹为第一个样本，x²为第二个样本，x^N为第N个样本，z¹为第一个样本的标注结果，z²为第二个样本的标注结果，z^N为第N个样本的标注结果，N为样本总数。

8.根据权利要求2所述的基于卷积循环神经网络的集装箱箱号识别方法，其特征在于：在步骤(15)中，损失函数为：

9.根据权利要求3所述的基于卷积循环神经网络的集装箱箱号识别方法，其特征在于：在步骤(22)中，(X₁,Y₁)＝(min(x₁,x₃),min(y₁,y₂))(X₂,Y₂)＝(max(x₂,x₄),Y₁)(X₃,Y₃)＝(X₁,max(y₃,y₄))(X₄,Y₄)＝(X₂,Y₃)；

在步骤(23)中，透视变换矩阵计算公式为：

10.根据权利要求4所述的基于卷积循环神经网络的集装箱箱号识别方法，其特征在于：在步骤(31)中，透视变换后的图像为：

其中，m为待检测集装箱图像，M为透视变换后的图像，

为透视变换矩阵。