CN108229506A

CN108229506A - 基于层次聚类和深度学习的箱号识别方法

Info

Publication number: CN108229506A
Application number: CN201611144568.6A
Authority: CN
Inventors: 崔鹏飞; 范柘
Original assignee: Shanghai Aware Information Technology Co ltd
Current assignee: Shanghai Aware Information Technology Co ltd
Priority date: 2016-12-13
Filing date: 2016-12-13
Publication date: 2018-06-29

Abstract

本发明涉及基于层次聚类和深度学习的箱号识别方法，识别步骤如下：步骤1，首先通过单个字符检测算法得到候选字符区域；步骤2，通过字符过滤和字符合并得到真正的集装箱号码字符；步骤3，集装箱号码字符通过层次聚类算法得到候选的文本行；步骤4，过文本行过滤得到最终的集装箱箱号文本行；步骤5，对文本行中的单个字符采用深度学习技术进行识别，最终得到箱号的识别结果。

Description

基于层次聚类和深度学习的箱号识别方法

技术领域

本发明涉及基于层次聚类和深度学习的箱号识别方法，特别是涉及基于层次聚类和深度学习的箱号识别方法。

背景技术

集装箱作为国际运输业的重要组成部分,其应用范围和数量都在大幅度的增加。目前中国的集装箱运输呈现出了飞跃式的发展,货物量的大幅度增加给集装箱的追踪和统计提出了更高的要求,使得智能集装箱识别系统的研究和开发成为迫切的需求。

集装箱箱号识别是智能集装箱识别系统的一个关键技术，在实际应用中集装箱图像较为复杂，主要表现在以下方面：1.货运车停泊位置不固定，拍摄视角难以固定，使集装箱图像产生畸变。2.夜晚、早晨、傍晚的光照条件不同，此外，白天常存在强光照射，使得图像复杂化。3.雨、雪天气，箱体污染等因素对图像产生干扰。4.由于拍摄设备等原因，图像清晰度较低。

发明内容

本发明针对实际应用中集装箱成像条件较为复杂的背景下，提出了一种基于层次聚类和深度学习的箱号识别方法。能够克服多种复杂条件的影响，保持较高的识别率。

技术方案

基于层次聚类和深度学习的箱号识别方法。首先通过单个字符检测算法得到候选字符区域，然后通过字符过滤和字符合并得到真正的集装箱号码字符；集装箱号码字符通过层次聚类算法得到候选的文本行，再通过文本行过滤得到最终的集装箱箱号文本行；最后对得到的文本行进行识别，得到箱号的识别结果。识别整体流程图图1所示。

所述的基于层次聚类和深度学习的箱号识别方法，单个字符检测利用最大稳定极值区域(MSER)算法得到候选的字符区域，MSER算法基于分水岭的思想，其公式为，表示为Q_i为第i个连通区域的面积，Δ为阈值的微小变化，v(i)小于阈值时，认为该区域为MSER。实际使用的时候，需要原图做一次MSER，原图取反后再做一次MSER，两次的结果取并。

所述的基于层次聚类和深度学习的箱号识别方法，因为箱体有些掉漆、破损、污渍等，也会被MSER算法误判为字符区域，所以要通过字符过滤规则进行过滤。字符过滤的规则如下：

(1)利用字符区域的高宽比、宽高比、最小面积、最大面积、最小高度、最大高度过滤非字符区域。满足规则的，即认为是字符区域，不满足，则是非字符区域。

(2)取出字符区域对应的灰度图像，利用方差特征过滤非字符区域。满足规则，即认为是字符区域，不满足，则是非字符区域。

(3)利用致密度(Solidity)特征过滤非字符区域，公式如下：

whiteNumber为MSER区域白色前景点的数目，contourNumber代表MSER区域白色前景点最小凸多边形的面积。

(4)利用Extent特征过滤非字符区域，公式如下：

whiteNumber为MSER区域白色前景点的数目，rectArea代表MSER区域白色前景点最小外接矩形的面积。

(5)利用离心率特征过滤非字符区域。

(6)取出MSER区域对应的灰度图像，提取方向梯度直方图(Hog)特征，然后利用线性支持向量机分类器进行过滤非字符区域

所述的基于层次聚类和深度学习的箱号识别方法，经过字符过滤后，如果两个字符之间有重叠，则需要利用合并规则进行合并。假如有两个MSER对应的外接矩形，分别为box1和box2。如果box1∩box2/box1∪box2＞th，th为对应的门限，则舍弃掉面积较小的mser。

所述的基于层次聚类和深度学习的箱号识别方法，经过字符检测、字符过滤、字符合并之后，会得到真正的字符区域。因为集装箱号码是以文本行的形式存在的，所以要使相邻的单个字符能够连起来，生成相应的文本行。文本行的生成基于下列的假设：

(1)集装箱号里面的字母和数字位于一条直线上。

(2)集装箱号里面的字母和数字的的高度是一致的。

(3)集装箱号里面的字母和数字间隔是相等的。

文本行的生成步骤如下：

(1)寻找相邻的字符对，连接相邻字符的中心形成线段。

(2)对相邻的字符对线段进行聚类。

(3)根据聚类结果生成文本行。

相邻字符对的形成条件如下：

(1)两字符中心点的Y(或X)坐标小于两者高度较小值th倍，th为对应的门限。

(2)两字符高度较小值和较大值的比值小于th，th为对应的门限。

(3)两字符之间的间隔小于两字符高度较小值的th倍，th为对应的门限

(4)设A，B为两个字符，A和B应该互不包含，即th为对应的门限。

所述的基于层次聚类和深度学习的箱号识别方法，字符对聚类的规则：如果两个线段有公共端点，并且以公共点为起点的两个向量夹角接近于180度，则认为这两个线段在同一条直线上，聚类方法采用层次聚类算法。图2为两个字符对聚类的示意图，左边的图满足字符对聚类规则(两个向量夹角接近于180度)，右边的图则不满足(两个向量夹角与180度相差太大)。

所述的基于层次聚类和深度学习的箱号识别方法，文层次聚类的结果可以以树状图体现出来，具有相同根节点的子节点可以认为是一类，如图3所示，AF为一类，BC为一类，DEG为一类。取出每个聚类结果包含的所有字符对，然后生成所有字符的最小外接矩形，即为文本行。

所述的基于层次聚类和深度学习的箱号识别方法，通常集装箱箱体会有一些干扰的字符，同样也会产生文本行，需要过滤掉由干扰产生的文本行，得到真正的集装箱字符区域。过滤方法是，对候选文本行对应区域的灰度图像提取方向梯度直方图特征，然后利用线性支持向量机分类器进行判别。

所述的基于层次聚类和深度学习的箱号识别方法，集装箱箱号的分布有两种类型：四位字母和六位数字是连接在一起的；四位字母连接在一起，六位数字连接在一起，字母和数字之间有较大的间隔。所以经过文本行过滤后，文本行的识别也会出现两种情况：六位数字和四位字母在一个文本行里面；六位数字在一个文本行里面，四位字母在一个文本行里面。

四位字母和六位数字是连接在一起的设为类型1，四位字母连接在一起，六位数字连接在一起，字母和数字之间有较大的间隔的设为类型2。箱号类型判断规则如下：

(1)利用噪声数字字母分类器寻找含有数字最多的文本行；

(2)如果(1)中文本行里面含有数字和字母的个数>＝10，则为类型1，返回；

(3)利用数字字母分类器寻找含有字母最多的文本行和含有数字最多的文本行，字母文本行和数字文本行融合得到类型2。

所述的基于层次聚类和深度学习的箱号识别方法，箱号识别的关键是对类型1或类型2文本行中的每一个MSER进行识别。字符识别采用基于深度学习的方法，深度网络采用卷积神经网络(CNN)。分别训练一个字符分类器和数字分类器，前四位字母利用字母分类器进行识别，后六位数字利用数字分类器进行识别。

CNN的输入为48*48的彩色图像，包括8个卷积层、4个下采样层，2个全连接层。卷积层参数为卷积核的大小为3*3，步长为1，pad为1。下采样层采用最大值池化，卷积核大小为2*2，步长为2，pad为0。CNN最后输出为1152维的特征，最后送入SoftMax分类器进行分类。

本发明的有益效果：

1、本发明在实际应用中达到了较高的识别率，白天的识别率可以95％；夜晚的识别率可以达到85％；适用于刮风、下雨、下雪等多种复杂的场景。

2、提高了集装箱码头的现代化管理水平，只能识别代替了传统的人工读取和记录集装箱号码，提高了集装箱的通关速度。

附图说明

图1：集装箱箱号识别流程示意图；

图2：符合字符对聚类和不符合字符对聚类规则示意图；

图3：层次聚类示意图；

具体实施方式

实施例一：参见图1，本发明基于层次聚类和深度学习的箱号识别方法。首先通过单个字符检测算法得到候选字符区域，然后通过字符过滤和字符合并得到真正的集装箱号码字符；集装箱号码字符通过层次聚类算法得到候选的文本行，再通过文本行过滤得到最终的集装箱箱号文本行；最后对得到的文本行进行识别，得到箱号的识别结果。

实施例二：本实施例基于层次聚类和深度学习的箱号识别方法，单个字符检测利用最大稳定极值区域(MSER)算法得到候选的字符区域，MSER算法基于分水岭的思想，其公式为，表示为Q_i为第i个连通区域的面积，Δ为阈值的微小变化，v(i)小于阈值时，认为该区域为MSER。实际使用的时候，需要原图做一次MSER，原图取反后再做一次MSER，两次的结果取并。

因为箱体有些掉漆、破损、污渍等，也会被MSER算法误判为字符区域，所以要通过字符过滤规则进行过滤。字符过滤的规则如下：

(3)利用致密度(Solidity)特征过滤非字符区域，公式如下：

(4)利用Extent特征过滤非字符区域，公式如下：

(5)利用离心率特征过滤非字符区域。

经过字符过滤后，如果两个字符之间有重叠，则需要利用合并规则进行合并。假如有两个MSER对应的外接矩形，分别为box1和box2。如果box1∩box2/box1∪box2＞th，th为对应的门限，则舍弃掉面积较小的mser。

实施例三：本实施例基于层次聚类和深度学习的箱号识别方法，在实施例二的基础上：经过字符检测、字符过滤、字符合并之后，会得到真正的字符区域。因为集装箱号码是以文本行的形式存在的，所以要使相邻的单个字符能够连起来，生成相应的文本行。文本行的生成基于下列的假设：

(1)集装箱号里面的字母和数字位于一条直线上。

(2)集装箱号里面的字母和数字的的高度是一致的。

(3)集装箱号里面的字母和数字间隔是相等的。

文本行的生成步骤如下：

(1)寻找相邻的字符对，连接相邻字符的中心形成线段。

(2)对相邻的字符对线段进行聚类。

(3)根据聚类结果生成文本行。

相邻字符对的形成条件如下：

字符对聚类的规则：如果两个线段有公共端点，并且以公共点为起点的两个向量夹角接近于180度，则认为这两个线段在同一条直线上，聚类方法采用层次聚类算法。图2为两个字符对聚类的示意图，左边的图满足字符对聚类规则(两个向量夹角接近于180度)，右边的图则不满足(两个向量夹角与180度相差太大)。

文层次聚类的结果可以以树状图体现出来，具有相同根节点的子节点可以认为是一类，如图3所示，AF为一类，BC为一类，DEG为一类。取出每个聚类结果包含的所有字符对，然后生成所有字符的最小外接矩形，即为文本行。

实施例四：本实施例基于层次聚类和深度学习的箱号识别方法，在实施例三的基础上：通常集装箱箱体会有一些干扰的字符，同样也会产生文本行，需要过滤掉由干扰产生的文本行，得到真正的集装箱字符区域。过滤方法是，对候选文本行对应区域的灰度图像提取方向梯度直方图特征，然后利用线性支持向量机分类器进行判别。

实施例五：本实施例基于层次聚类和深度学习的箱号识别方法，与施例二、三、四不同的是：集装箱箱号的分布有两种类型：四位字母和六位数字是连接在一起的；四位字母连接在一起，六位数字连接在一起，字母和数字之间有较大的间隔。所以经过文本行过滤后，文本行的识别也会出现两种情况：六位数字和四位字母在一个文本行里面；六位数字在一个文本行里面，四位字母在一个文本行里面。

(1)利用噪声数字字母分类器寻找含有数字最多的文本行；

实施例六：本实施例基于层次聚类和深度学习的箱号识别方法，在实施例五的基础上：箱号识别的关键是对类型1或类型2文本行中的每一个MSER进行识别。字符识别采用基于深度学习的方法，深度网络采用卷积神经网络(CNN)。分别训练一个字符分类器和数字分类器，前四位字母利用字母分类器进行识别，后六位数字利用数字分类器进行识别。

Claims

1.基于层次聚类和深度学习的箱号识别方法，其特征在于：识别步骤如下：

步骤1，首先通过单个字符检测算法得到候选字符区域；

步骤2，通过字符过滤和字符合并得到真正的集装箱号码字符；

步骤3，集装箱号码字符通过层次聚类算法得到候选的文本行；

步骤4，过文本行过滤得到最终的集装箱箱号文本行；

步骤5，对文本行中的单个字符采用深度学习技术进行识别，最终得到箱号的识别结果。

2.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法，其特征在于：单个字符检测利用最大稳定极值区域(MSER)算法得到候选的字符区域，MSER算法基于分水岭思想，其公式表示为Q_i为第i个连通区域的面积，Δ为阈值的微小变化，v(i)小于阈值时，认为该区域为MSER；实际使用的时候，需要原图做一次MSER，原图取反后再做一次MSER，两次的结果取并。

3.根据权利要求2所述的基于层次聚类和深度学习的箱号识别方法，其特征在于：所述单个字符检测算法还需要通过字符过滤规则进行过滤，字符过滤的规则如下：

步骤11，利用字符区域的高宽比、宽高比、最小面积、最大面积、最小高度、最大高度过滤非字符区域。满足规则的，即认为是字符区域，不满足，则是非字符区域。

步骤12，取出字符区域对应的灰度图像，利用方差特征过滤非字符区域。满足规则，即认为是字符区域，不满足，则是非字符区域。

步骤13，利用致密度(Solidity)特征过滤非字符区域，公式如下：

步骤14，利用Extent特征过滤非字符区域，公式如下：

步骤15，利用离心率特征过滤非字符区域。

步骤16提取MSER区域对应的灰度图像，提取方向梯度直方图(Hog)特征，然后利用线性支持向量机分类器过滤非字符区域。

4.根据权利要求3所述的基于层次聚类和深度学习的箱号识别方法，其特征是：经过字符过滤后，如果两个字符之间有重叠，则需要利用合并规则进行合并。假如有两个MSER对应的外接矩形，分别为box1和box2。如果box1∩box2/box1∪box2＞th，th为对应的门限，则舍弃掉面积较小的mser。

5.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法，其特征是：经过字符检测、字符过滤、字符合并之后，会得到真正的字符区域，因为集装箱号码是以文本行的形式存在的，所以要使相邻的单个字符能够连起来，生成相应的文本行。

6.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法，其特征是：文本行的生成基于下列的假设：

(1)集装箱号里面的字母和数字位于一条直线上。

(2)集装箱号里面的字母和数字的的高度是一致的。

(3)集装箱号里面的字母和数字间隔是相等的。

7.根据权利要求6所述的基于层次聚类和深度学习的箱号识别方法，其特征是：生成文本行的步骤：

步骤31，寻找相邻的字符对，连接相邻字符的中心形成线段。

步骤32，对相邻的字符对线段进行聚类。

步骤33，根据聚类结果生成文本行。

8.根据权利要求7所述的基于层次聚类和深度学习的箱号识别方法，其特征是：相邻字符对的形成条件：

步骤311，两字符中心点的Y(或X)坐标小于两者高度较小值th倍，th为对应的门限。

步骤312，两字符高度较小值和较大值的比值小于th，th为对应的门限

步骤313，两字符之间的间隔小于两字符高度较小值的th倍，th为对应的门限

步骤314，设A，B为两个字符，A和B应该互不包含，即th为对应的门限。

9.根据权利要求6-8任一项所述的基于层次聚类和深度学习的箱号识别方法，其特征是：字符对聚类的规则：如果两个线段有公共端点，并且以公共点为起点的两个向量夹角接近于180度，则认为这两个线段在同一条直线上，聚类方法采用层次聚类算法。

10.根据权利要求6-9任一项所述的基于层次聚类和深度学习的箱号识别方法，其特征是：文本行生成：层次聚类的结果可以以树状图体现出来，具有相同根节点的子节点可以认为是一类，如图3所示，AF为一类，BC为一类，DEG为一类。取出每个聚类结果包含的所有字符对，然后生成所有字符的最小外接矩形，即为文本行。

11.根据权利要求6-10任一项所述的基于层次聚类和深度学习的箱号识别方法，其特征是：文本行过滤：通常集装箱箱体会有一些干扰的字符，同样也会产生文本行，需要过滤掉由干扰产生的文本行，得到真正的集装箱字符区域。过滤方法是，对候选文本行对应区域的灰度图像提取方向梯度直方图特征，然后利用线性支持向量机分类器进行判别。

12.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法，其特征是：集装箱箱号的分布有两种类型：四位字母和六位数字是连接在一起的；四位字母连接在一起，六位数字连接在一起，字母和数字之间有较大的间隔。所以经过文本行过滤后，文本行的识别也会出现两种情况：六位数字和四位字母在一个文本行里面；六位数字在一个文本行里面，四位字母在一个文本行里面。

13.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法，其特征是：四位字母和六位数字是连接在一起的设为类型1，四位字母连接在一起，六位数字连接在一起，字母和数字之间有较大的间隔的设为类型2。箱号类型判断规则如下：

(1)利用噪声数字字母分类器寻找含有数字最多的文本行；

14.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法，其特征是：箱号识别的关键是对类型1或类型2文本行中的每一个MSER进行识别。字符识别采用基于深度学习的方法，深度网络采用卷积神经网络(CNN)。分别训练一个字符分类器和数字分类器，前四位字母利用字母分类器进行识别，后六位数字利用数字分类器进行识别。

15.根据权利要求1所述的基于层次聚类和深度学习的箱号识别方法，其特征是：CNN的输入为48*48的彩色图像，包括8个卷积层、4个下采样层，2个全连接层。卷积层参数为卷积核的大小为3*3，步长为1，pad为1。下采样层采用最大值池化，卷积核大小为2*2，步长为2，pad为0。CNN经过全连接层后的输出为1152维特征，最后送入SoftMax分类器进行分类。