CN110119742B

CN110119742B - 一种集装箱号的识别方法、装置及移动终端

Info

Publication number: CN110119742B
Application number: CN201910337746.4A
Authority: CN
Inventors: 徐国强
Original assignee: Tianwei Information Technology Tianjin Co ltd
Current assignee: Tianwei Information Technology Tianjin Co ltd
Priority date: 2019-04-25
Filing date: 2019-04-25
Publication date: 2023-07-07
Anticipated expiration: 2039-04-25
Also published as: CN110119742A

Abstract

本发明实施例提供了一种集装箱号的识别方法及装置，方法包括：采集集装箱箱门的第一图像数据；利用基于卷积神经网络的文字检测算法对第一图像数据进行处理，确定出文字区域；获取集装箱箱门的图形特征，在文字区域对图形特征进行特征分析，以确定集装箱的箱号区域；对箱号区域进行文字识别，输出集装箱的箱号；其中，图形特征包括：集装箱箱门的轮廓和高度、集装箱箱门的文字密度、集装箱箱号的校验位；如此，利用可移动终端设备采集集装箱图像数据，降低了对设备、场地的要求；利用基于卷积神经网络的文字检测算法对图像数据进行识别，确保在自然环境下文字检测的成功率；利用集装箱箱门的图形特征进行特征分析，提高箱号的识别率。

Description

一种集装箱号的识别方法、装置及移动终端

技术领域

本发明涉及集装箱识别技术领域，尤其涉及一种集装箱号的识别方法、装置及移动终端。

背景技术

集装箱号码是码头、场站、海关，运输中的重要依据。传统的箱号识别系统主要是应用于码头、场站，海关的特殊监管区域的闸口，这种识别技术要求被识别集装箱必须到指定地点，该处必须按要求设置指定光源、多个工业摄像机，再利用图像识别技术进行识别。

可以看出，上述方案对场地要求较高，安装过程复杂，投入费用较高，只适合固定场景。但对于有些集装箱来说(比如无法移动的集装箱)，上述场地明显是不适合的，进而导致无法进行集装箱号的识别。

发明内容

针对现有技术存在的问题，本发明实施例提供了一种集装箱号的识别方法、装置及移动终端，用于解决现有技术中无法对无法移动的集装箱号进行识别的技术问题。

本发明实施例提供一种集装箱号的识别方法，应用在移动终端中，所述方法包括：

采集集装箱箱门的第一图像数据；

利用基于卷积神经网络的文字检测算法对所述第一图像数据进行处理，确定出文字区域；

获取所述集装箱箱门的图形特征，在所述文字区域对所述图形特征进行特征分析，以确定所述集装箱的箱号区域；

对所述箱号区域进行文字识别，输出所述集装箱的箱号；其中，所述图形特征包括：所述集装箱箱门的轮廓和高度、所述集装箱箱门的文字密度、所述集装箱箱号的校验位。

上述方案中，当所述图形特征为所述集装箱箱门的轮廓和高度时，所述获取所述集装箱箱门的图形特征，包括：

获取所述第一图像数据的灰度图；

根据k-means算法对所述灰度图中全部像素点的灰度值进行聚类计算，获取聚类计算后的第二图像数据；

对所述第二图像数据进行颜色分析，确定所述集装箱箱门的轮廓和高度。

上述方案中，当所述图形特征为所述集装箱箱门的文字密度时，所述获取所述集装箱箱门的图形特征，包括：

利用密度聚类算法，将所述文字区域中的文字外框分为点集合；

根据点集合的密度确定所述集装箱箱门的文字密度。

上述方案中，当所述图形特征为所述集装箱箱箱号的校验位时，所述获取所述集装箱箱门的图形特征，包括：

获取所述第一图像数据的灰度图；

对所述灰度图进行边缘检测，以获得边缘检测结果；

对所述边缘检测结果进行多边形拟合，以获得多个多边形；

根据所述集装箱箱号校验位的特征参数在各多边形中确定出所述集装箱箱号的校验位。

上述方案中，所述对所述箱号区域进行文字识别，输出所述集装箱的箱号，包括：

建立集装箱箱号特征库；

利用所述特征库对所述箱号区域进行文字识别，输出所述集装箱的箱号。

上述方案中，所述建立集装箱箱号特征库，包括：

获取不同集装箱箱号的样本数据；

合并所述样本数据，生成合并数据；

利用训练工具对所述合并数据进行训练，生成训练数据；

对所述训练数据进行校正；

根据特征库生成命令将校正后的训练数据生成集装箱箱号特征库。

本发明实施例还提供一种集装箱号的识别装置，所述装置包括：

采集单元，用于采集集装箱箱门的第一图像数据；

处理单元，用于利用基于卷积神经网络的文字检测算法对所述第一图像数据进行处理，确定出文字区域；

获取单元，用于获取所述集装箱箱门的图形特征，在所述文字区域对所述图形特征进行特征分析，以确定所述集装箱的箱号区域；

识别单元，用于对所述箱号区域进行文字识别，输出所述集装箱的箱号；其中，所述图形特征包括：所述集装箱箱门的轮廓和高度、所述集装箱箱门的文字密度、所述集装箱箱号的校验位。

上述方案中，当所述图形特征为所述集装箱箱门的轮廓和高度时，所述获取单元具体用于：

获取所述第一图像数据的灰度图；

上述方案中，当所述图形特征为所述集装箱箱门的的文字密度时，所述获取单元具体用于：

根据点集合的密度确定所述集装箱箱门的文字密度。

本发明实施例还提供一种移动终端，所述终端包括如上述任一项所述的方法。

本发明实施例提供了一种集装箱号的识别方法及装置，应用在移动终端中，所述方法包括：采集集装箱箱门的第一图像数据；利用基于卷积神经网络的文字检测算法对所述第一图像数据进行处理，确定出文字区域；获取所述集装箱箱门的图形特征，在所述文字区域对所述图形特征进行特征分析，以确定所述集装箱的箱号区域；对所述箱号区域进行文字识别，输出所述集装箱的箱号；其中，所述图形特征包括：所述集装箱箱门的轮廓和高度、所述集装箱箱门的文字密度、所述集装箱箱号的校验位；如此，利用可移动终端设备采集集装箱图像数据，降低了对设备、场地的要求，投入成本较低；利用基于卷积神经网络的文字检测算法对图像数据进行识别，降低对图像数据的拍摄要求，确保在自然环境下文字检测的成功率；利用集装箱箱门的图形特征进行特征分析，可以将干扰图像剔除，提高箱号的识别率，进而可以对无法移动的集装箱号进行高精度识别。

附图说明

图1为本发明实施例一提供的集装箱号的识别方法流程示意图；

图2为本发明实施例一提供的集装箱第一图像数据的灰度图；

图3为本发明实施例一提供的集装箱的第二图像数据；

图4为本发明实施例一提供的对第一图像数据的灰度图进行边缘检测的结果示意图；

图5为本发明实施例二提供的集装箱号的识别装置结构示意图。

具体实施方式

为了解决现有技术中无法对无法移动的集装箱号进行识别的技术问题，本发明提供了一种集装箱号的识别方法及装置，应用在移动终端中，所述方法包括：采集集装箱箱门的第一图像数据；利用基于卷积神经网络的文字检测算法对所述第一图像数据进行处理，确定出文字区域；获取所述集装箱箱门的图形特征，在所述文字区域对所述图形特征进行特征分析，以确定所述集装箱的箱号区域；对所述箱号区域进行文字识别，输出所述集装箱的箱号；其中，图形特征包括：所述集装箱箱门的轮廓和高度、所述集装箱箱门的文字密度、所述集装箱箱号的校验位。

下面通过附图及具体实施例对本发明的技术方案做进一步的详细说明。

实施例一

本实施例提供一种集装箱号的识别方法，应用在移动终端中，方法包括：

S110，采集集装箱箱门的第一图像数据。

本实施例中，可利用手持移动设备采集集装箱箱门的第一图像数据，移动设备可包括：智能手机、IPAD等一些智能终端。

S111，利用基于卷积神经网络的文字检测算法对所述第一图像数据进行处理，确定出文字区域。

获取到第一图像数据后，由于第一图像数据是在自然环境下采集的，因此为了提高图像中文字检测的成功率，本实施例是利用基于卷积神经网络的文字检测算法对第一图像数据进行处理的，以能高精度获取箱门上可能存在的文字区域。

其中，本实施例中的文字检测算法是基于深度学习的算法，可以直接从预先建立的图像训练数据中学习有效特征，来预测图像数据中的文本实例及几何形状。

作为一种可选的实施例，在利用基于卷积神经网络的文字检测算法对所述第一图像数据进行处理，确定出文字区域，具体实现如下：

构建主干特征提取网络，用于特征提取。

为了解决文本行尺度变换剧烈的问题，提高预测的准确率，本文利用主干特征提取网络提取第一图像数据中不同水平的特征映射图；其中，各特征映射图的尺寸分别为第一图像数据的1/32、1/16、1/8和1/4，这样就可以得到不同尺寸、不同角度的特征映射图。这样，就可以利用大尺度的特征映射图预测小的文本行，利用小尺度的特征映射图预测大的文本行。

提取到不同水平的特征映射图后，在特征合并层中将所有的特征映射图按照预先设置的合并规则从顶部向下进行合并，最终在全卷积网络(FCN，Fully ConvolutionalNetworks)的输出层获得大量的预测文字矩形区域及评分；

在预测出的多个文字矩形区域，利用非极大值抑制算法(NMS，Non-MaximumSuppression)，根据预设的重叠比率去除冗余的矩形，获得最终的预测结果，预测结果为矩形区域。

这里，在输出矩形区域时，同时还输出该矩形的得分。根据不同文本的形状，矩形区域可分为旋转矩形和水平矩形。

S112，获取所述集装箱箱门的图形特征，在所述文字区域对所述图形特征进行特征分析，以确定所述集装箱的箱号区域；

确定出文字区域之后，会获得集装箱箱门上可能的文字的全部位置，接下来就是要确定箱号区域，具体实现如下：

获取集装箱箱门的图形特征，在文字区域对图形特征进行特征分析，确定集装箱的箱号区域。其中，图形特征包括：集装箱箱门的轮廓和高度、集装箱箱门的文字密度、集装箱箱号的校验位。

本文获取的集装箱箱门必须是完整的箱门，为了提取箱门的轮廓和高度，根据箱门在第一图像数据中占有的最大区域，利用k-means算法对第一图像数据进行分割，获取箱门的轮廓。

作为一种可选的实施例，当图形特征为集装箱箱门的轮廓和高度时，获取集装箱箱门的图形特征，包括：

获取第一图像数据的灰度图，可参见图2；

对第二图像数据进行颜色分析，确定所述集装箱箱门的轮廓和高度。

具体地，本实施例中在k-means算法对灰度图中全部像素点的灰度值进行聚类计算时，按照预先的迭代次数进行迭代(比如10次)，将灰度值分成3种像素点的集合，把像素点数据点为第一的像素点颜色设置为白色，灰度值为255；把像素点数据点为第二的像素点颜色设置为黑色(灰度值为0)，把像素点数据点为第三的像素点颜色设置为不同于上述两种颜色的其他颜色(比如可以将灰度值设置为100)，那么聚类计算后的第二图像数据可以参见图3。

然后，通过第二图像数据中的颜色变化分析，可以确定出箱门高度和轮廓。这里，箱门高度有利于缩小箱号区域的方位，减少其他背景文字的干扰。并且由于箱门最低位置容易受地面染色或光线干扰，因此没有提取。左右两边容易受其他集装箱干扰，因此也没有提取。

作为一种可选的实施例，当确定出箱门高度和轮廓后，还要继续获取该箱门上的文字密度，那么获取集装箱箱门的图形特征，包括：

利用DBSCAN密度聚类算法，将所述文字区域中的文字外框分为点集合；

根据点集合的密度确定所述集装箱箱门的文字密度。

具体地，确定出文字区域后，可以获取到文字的外框(矩形框)，然后获取文字外框的四个顶点和一个中心点，利用DBSCAN密度聚类算法，按照点的疏密程度将各外框分成若干个点集合，点集合密度大的区域就是文字密度大的区域。

作为一种可选的实施例，获取到文字密度大的区域后，可以在该区域进行分析，以获取集装箱箱号的校验位，那么获取集装箱箱门的图形特征，包括：

获取第一图像数据的灰度图，可继续参见图2；

在文字密度大的区域对灰度图进行边缘检测，以获得边缘检测结果，边缘检测结果可参见图4；

对边缘检测结果进行多边形拟合，以获得多个最接近原始图形的多边形；

根据集装箱箱号校验位的特征参数在各多边形中确定出集装箱箱号的校验位。这里，集装箱箱号校验位的特征参数可以为：校验位的外框形状及外框的宽高比。

其中，因校验位的外框形状为矩形框。因此当获取到多个多边形后，再根据多边形的顶点数量确定出矩形框，根据校验位外方框宽高比排除干扰项，确定出校验位的外方框。

一旦确定出校验位的外方框相当于确定出了校验位的位置，那么就可以根据该校验位准确定位箱号所在的区域了。

S113，对所述箱号区域进行文字识别，输出所述集装箱的箱号。

上述步骤中，通过箱号定位，可以将箱号区域与第一图像数据分离，最终获得去除干扰图像的箱号区域。

确定出集装箱箱号区域后，可以利用文字识别算法对箱号区域进行文字识别，输出集装箱的箱号。

作为一种可选的实施例，为了提高文字识别率，对箱号区域进行文字识别，输出集装箱的箱号，包括：

建立集装箱箱号特征库；

利用特征库对所述箱号区域进行文字识别，输出集装箱的箱号。

作为一种可选的实施例，建立集装箱箱号特征库，包括：

获取不同集装箱箱号的样本数据；

合并所述样本数据，生成合并数据；

利用训练工具对所述合并数据进行训练，生成训练数据；

对训练数据进行校正；

具体地，在获取不同集装箱箱号的样本数据时，样本数据应该是较为清晰且相对水平的图形。为了提高特征库的预测精度，样本数据一般越多越好。

然后利用训练工具将各个样本数据进行合并，合并数据为.GIF格式文件。再利用训练工具将合并后的.GIF格式文件进行训练，生成训练文件，训练文件为.box格式文件。

训练数据生成后，难免会出现偏差，还需根据参考数据校正识别错误的内容及识别错误的区域。

然后利用特征库生成命令将校正后的训练数据生成集装箱箱号特征库，这样在利用该特征库进行识别时，可以提高识别精度。

基于同样的发明构思，本发明还提供一种集装箱号的识别装置，详见实施例二。

实施例二

本实施例提供一种集装箱号的识别装置，如图5所示，装置包括：采集单元51、处理单元52、获取单元53及识别单元54；其中，

采集单元51，用于采集集装箱箱门的第一图像数据；

本实施例中，采集单元51可以为手持移动设备的摄像头，移动设备可包括：智能手机、IPAD等一些智能终端。

获取到第一图像数据后，由于第一图像数据是在自然环境下采集的，因此为了提高图像中文字检测的成功率，本实施例的处理单元52是利用基于卷积神经网络的文字检测算法对第一图像数据进行处理的，以能高精度获取箱门上可能存在的文字区域。

作为一种可选的实施例，处理单元52具体用于：

构建主干特征提取网络，用于特征提取。

提取到不同水平的特征映射图后，在特征合并层中将所有的特征映射图按照预先设置的合并规则从顶部向下进行合并，最终在全卷积网络FCN的输出层获得大量的预测文字矩形区域及评分；

在预测出的多个文字矩形区域，利用非极大值抑制算法NMS，根据预设的重叠比率除去冗余的矩形，获得最终的预测结果，预测结果为矩形区域。

获取单元53获取集装箱箱门的图形特征，在文字区域对图形特征进行特征分析，确定集装箱的箱号区域。其中，图形特征包括：集装箱箱门的轮廓和高度、集装箱箱门的文字密度、集装箱箱号的校验位。

本文获取的集装箱箱门必须是完整的箱门，为了提取箱门的轮廓和高度，获取单元53根据箱门在第一图像数据中占有的最大区域，利用k-means算法对第一图像数据进行分割，获取箱门的轮廓。

作为一种可选的实施例，当图形特征为集装箱箱门的轮廓和高度时，获取单元53用于：

获取第一图像数据的灰度图，可参见图2；

作为一种可选的实施例，当确定出箱门高度和轮廓后，还要继续获取该箱门上的文字密度，那么获取单元53用于：

根据点集合的密度确定所述集装箱箱门的文字密度。

作为一种可选的实施例，获取到文字密度大的区域后，可以在该区域进行分析，以获取集装箱箱号的校验位，那么获取单元53用于：

获取第一图像数据的灰度图，可继续参见图2；

通过箱号定位，可以将箱号区域与第一图像数据分离，最终获得去除干扰图像的箱号区域。

识别单元54，用于对箱号区域进行文字识别，输出集装箱的箱号。

作为一种可选的实施例，为了提高文字识别率，识别单元54具体用于：

建立集装箱箱号特征库；

作为一种可选的实施例，识别单元54建立集装箱箱号特征库，包括：

获取不同集装箱箱号的样本数据；

合并样本数据，生成合并数据；

利用训练工具对合并数据进行训练，生成训练数据；

对训练数据进行校正；

基于同样的发明构思，本发明还提供一种移动终端，可以对无法移动的集装箱号进行识别，其识别方法与包括实施例一中的识别方法相同，故而不再赘述。

本发明实施例提供的集装箱号的识别方法、装置及移动终端能带来的有益效果至少是：

本发明实施例提供了一种集装箱号的识别方法及装置，应用在移动终端中，方法包括：采集集装箱箱门的第一图像数据；利用文字检测算法对所述第一图像数据进行处理，确定出文字区域；获取所述集装箱箱门的图形特征，在文字区域对所述图形特征进行特征分析，以确定集装箱的箱号区域；对箱号区域进行文字识别，输出集装箱的箱号；其中，图形特征包括：所述集装箱箱门的轮廓和高度、所述集装箱箱门的文字密度、所述集装箱箱号的校验位；如此，可以利用一台可移动终端设备采集集装箱图像数据，不同于传统方案中需要多个摄像头采集多个角度的图像再进行合并，进而降低了对设备、场地的要求，投入成本较低，扩展了应用场景；利用基于卷积神经网络的文字检测算法对图像数据进行识别，降低对图像数据的拍摄要求，确保在自然环境下文字检测的成功率；利用集装箱箱门的图形特征进行特征分析，可以将干扰图像剔除，提高箱号的识别率，进而可以对无法移动的集装箱号进行高精度识别。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种集装箱号的识别方法，其特征在于，应用在移动终端中，所述方法包括：

采集集装箱箱门的第一图像数据；

对所述箱号区域进行文字识别，输出所述集装箱的箱号；其中，所述图形特征包括：所述集装箱箱门的轮廓和高度、所述集装箱箱门的文字密度、所述集装箱箱号的校验位；

当所述图形特征为所述集装箱箱门的轮廓和高度时，所述获取所述集装箱箱门的图形特征，包括：

获取所述第一图像数据的灰度图；

对所述第二图像数据进行颜色分析，确定所述集装箱箱门的轮廓和高度；

当所述图形特征为所述集装箱箱门的文字密度时，所述获取所述集装箱箱门的图形特征，包括：

根据点集合的密度确定所述集装箱箱门的文字密度；

当所述图形特征为所述集装箱箱箱号的校验位时，所述获取所述集装箱箱门的图形特征，包括：

获取所述第一图像数据的灰度图；

对所述灰度图进行边缘检测，以获得边缘检测结果；

对所述边缘检测结果进行多边形拟合，以获得多个多边形；

根据所述集装箱箱号校验位的特征参数在各多边形中确定出所述集装箱箱号的校验位；

所述在所述文字区域对所述图形特征进行特征分析，以确定所述集装箱的箱号区域，包括：

确定所述集装箱箱门高度和轮廓；

获取所述集装箱箱门上的文字密度，确定箱门上文字密度最大的区域；

在箱门上文字密度最大的区域进行分析，获取所述集装箱箱号的校验位；

根据所述校验位定位所述集装箱的箱号区域。

2.如权利要求1所述的方法，其特征在于，所述对所述箱号区域进行文字识别，输出所述集装箱的箱号，包括：

建立集装箱箱号特征库；

3.如权利要求2所述的方法，其特征在于，所述建立集装箱箱号特征库，包括：

获取不同集装箱箱号的样本数据；

合并所述样本数据，生成合并数据；

利用训练工具对所述合并数据进行训练，生成训练数据；

对所述训练数据进行校正；

4.一种集装箱号的识别装置，其特征在于，所述装置包括：

采集单元，用于采集集装箱箱门的第一图像数据；

5.如权利要求4所述的装置，其特征在于，当所述图形特征为所述集装箱箱门的轮廓和高度时，所述获取单元具体用于：

获取所述第一图像数据的灰度图；

6.如权利要求4所述的装置，其特征在于，当所述图形特征为所述集装箱箱门的文字密度时，所述获取单元具体用于：

根据点集合的密度确定所述集装箱箱门的文字密度。

7.一种移动终端，其特征在于，所述终端包括如权利要求1至3任一项所述的方法。