CN101650780A - 一种集装箱箱号识别方法 - Google Patents

一种集装箱箱号识别方法 Download PDF

Info

Publication number
CN101650780A
CN101650780A CN200910170227A CN200910170227A CN101650780A CN 101650780 A CN101650780 A CN 101650780A CN 200910170227 A CN200910170227 A CN 200910170227A CN 200910170227 A CN200910170227 A CN 200910170227A CN 101650780 A CN101650780 A CN 101650780A
Authority
CN
China
Prior art keywords
character
image
container number
pixel
gray
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910170227A
Other languages
English (en)
Inventor
任梁
杨亮
刘国庆
郭寒军
徐勇军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NINGBO ZHONGKE IC DESIGN CENTER CO Ltd
Original Assignee
NINGBO ZHONGKE IC DESIGN CENTER CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NINGBO ZHONGKE IC DESIGN CENTER CO Ltd filed Critical NINGBO ZHONGKE IC DESIGN CENTER CO Ltd
Priority to CN200910170227A priority Critical patent/CN101650780A/zh
Publication of CN101650780A publication Critical patent/CN101650780A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明公开了一种集装箱箱号识别方法,包括以下步骤:集装箱箱号的提取:将得到包含集装箱箱号的图片经过图像处理技术切割出有用的箱号,并对切割出的箱号再次经过图像标准化处理;字符识别:得到经过图像标准化处理后的信息,使用神经网络技术和欧氏距离法对切割后的字符进行识别。本发明有益效果:大大减少了人力成本,加快了工作效率以及提高了工作准确率。

Description

一种集装箱箱号识别方法
技术领域
本发明主要涉及光学字符识别(OCR)领域,尤其涉及一种集装箱箱号识别方法。
背景技术
随着电脑技术的不断发展,越来越多的人期望机器能够自动快速并且正确的阅读字符和数字用以提高人类的工作效率,一个方面是汽车车牌的自动识别技术,它被广泛的应用在交通部门,帮助有需要的部门日夜不停的检测通过视频抓取系统抓取到的车牌号码,从而大大减少了人力成本,加快了工作效率以及提高了工作准确率。而另一个方面就是集装箱的箱号识别系统。
每一个集装箱都拥有它们独一无二的箱号,这些箱号在集装箱每一次的进出港口,仓库,海关时都会被用到,箱号会出现在集装箱的五个面上(底面没有箱号),而现阶段多数的码头,港口,海关和仓库都使用操作员去记录这些箱号,然后输入到电脑中,这不仅浪费了大量时间与人力而且也会由于操作员的各种疏忽导致记录错误。所以设计一款可以自动识别箱号并且可以将它与控制系统紧密结合的软件是十分必要的。
然而自动识别系统的实现也面临着诸多困难,集装箱的箱号没有固定的字体和大小,箱号的位置也会随着箱子的不同而发生变化,即使同一个箱子中,不同面上箱号的排列方向和位置也会不同,这些都会给识别带来一定的困难。系统最初的带有箱号的集装箱图片来自于视频抓取装置(比较常用的是有自动调焦性能的照相机,也可以使用摄像机等),可是白天的太阳光照强度,晚上自动曝光系统的曝光能力,甚至集装箱箱面涂层的反光率都会大大影响系统最后的识别结果,所以为了代替现有人手动记录箱号方式,一款的稳定的,精确地,对周围环境可适应强的自动字符识别系统的开发是极其有必要的。
发明内容
本发明的目的在于提供一种集装箱箱号识别方法,从而大大减少了人力成本,加快了工作效率以及提高了工作准确率。
本发明所述的一种集装箱箱号识别方法,包括以下步骤:
集装箱箱号的提取:将得到包含集装箱箱号的图片经过图像处理技术切割出有用的箱号,并对切割出的箱号再次经过图像标准化处理;
所述集装箱箱号的提取包括图像预处理、图像处理以及字符的切割与提取;其中所述图像预处理包括图像的读取,图像灰度化以及为了降低噪音保持图像平滑所使用的二维中值滤波器;所述图像处理包括图像去噪以及字符定位、初次字符排列方向确定、图像二值化和最终字符排列方向确定;所述字符的切割与提取包括字符提取、字符粘连部分切割以及抓取字符标准化处理;
字符识别:得到经过图像标准化处理后的信息,使用神经网络技术和欧氏距离法对切割后的字符进行识别。
本发明有益效果:大大减少了人力成本,加快了工作效率以及提高了工作准确率。
附图说明
图1为本发明具体实施例所述的集装箱箱号识别方法的字符抓取流程图;
图2为本发明具体实施例所述的集装箱箱号识别方法中图像外拓和收窄的示意图;
图3为本发明具体实施例所述的集装箱箱号识别方法中中值滤波的示意图;
图4为本发明具体实施例所述的集装箱箱号识别方法中半径为二的星型膨胀的方法;
图5为本发明具体实施例所述的集装箱箱号识别方法中被认为是处于一条直线(竖向)上的白色块状区域;
图6为本发明具体实施例所述的集装箱箱号识别方法中被认为是处于一条横线(横向)上的白色块状区域;
图7本发明具体实施例所述的集装箱箱号识别方法中字符切割示意图;
图8为普通神经网络构造;
图9为本发明具体实施例所述的集装箱箱号识别方法中的第一层粗分神经网络构造。
具体实施方式
下面结合附图来说明本发明的具体实施方式。
如图1所示本发明实施例所述的一种集装箱箱号识别方法,包括以下步骤:
集装箱箱号的提取:将得到包含集装箱箱号的图片经过图像处理技术切割出有用的箱号,并对切割出的箱号再次经过图像标准化处理。
所述集装箱箱号的提取包括图像预处理、图像处理以及字符的切割与提取。其中
所述图像预处理包括图像的读取和标准化、图像灰度化以及图像中值滤波。
所述图像的读取和标准化,是将照片输入格式全部转化为24位的BMP图片格式作为输入样本,图像尺寸都会被缩放到768*576(水平方向*竖直方向)。
所述图像灰度化,使用的灰度计算公式是:
gray(i,j)=0.11×r(i,j)+0.59×g(i,j)+0.3*b(i,j)
以上方程式中gray(i,j)为图像处理后的点(i,j)处的灰度值,r(i,j)是原图中点(i,j)处的红色像素值,g(i,j),b(i,j)分别是原图中点(i,j)处的绿色和蓝色的像素值。由以上方程式可以看出在经过灰度处理后的新图中,绿色所占的比例最大,所以也有一些算法是直接使用绿色位面的像素值作为整幅图像的灰度值来进行运算处理的,灰度化后,图片中任意坐标点所对应的灰度值范围都在(0~255)之间,其中0为纯黑,255为纯白。
所述图像中值滤波,采用一个3*3的二维中值滤波器,首先对整张灰度化后的图片进行扩边,如图2所示,将原图片最外面的那个像素进行了复制拓边,结果使图像上下左右各个边缘像素向外拓了一个像素。新的边界像素值与原来边界像素值的完全相同。图2中粗线包围部分所框的数据为原始数据,原始数据外面包裹的一层‘壳’是拓边以后复制出来的数据,拓边以后的图像的尺寸为770*578,即水平方向为(768+2),竖直方向为(576+2),在拓边以后的新图中做3*3的中值滤波。所述3*3中值滤波是指把以图像中一个点(x,y)为中心的3*3小窗内的所有像素的灰度从小到大的顺序排列,将中间大小的值作为(x,y)处的灰度值,如图3所示。完成滤波以后全图像需要进行收窄已达到和原始图像的一样的尺寸,即768*576,收窄图像是指去掉原先加上去的‘壳’,相当于一个逆向的外拓,从而减少了图像噪音平缓突兀的色相变换。
所述图像处理包括图像去噪以及字符定位,求边阈值设定,边缘膨胀,填充,和腐蚀,区域描边和第一次逻辑去噪,初次字符排列方向判断、图像二值化以及最终字符排列方向确定、滤噪与字符提取。
所述图像去噪以及字符定位,是过滤器使用一个边缘探测技术,求边阈值设定,边框膨胀,填充,腐蚀技术,区域描边以及特定的逻辑判断技术。
所述边缘探测技术采用Sobel因子求边算法,Sobel因子其实是一对因子,其中包括横向检测因子g1=[-1-π-1;0 0 0;1π1]和竖向检测因子g2=[-1 0 1;-π0π;-1 0 1];主要的计算公式如下:
| Σ j = 0 length ( Σ i = 0 width g 1 * Image ( ( ( i - 1 ) : ( i + 1 ) ) , ( ( j - 1 ) : ( j + 1 ) ) ) ) |
+ | Σ j = 0 length ( Σ i = 0 width g 2 * Image ( ( ( i - 1 ) : ( i + 1 ) ) , ( ( j - 1 ) : ( j + 1 ) ) ) ) |
公式中Image是指要求被求边的灰度图像。即使相同的Sobel算法,不同的求边因子对会产生不同的效果,经过实际的检验,发现使用g1=[-1-3.1415-1;000;13.1415 1]和g2=[-1 0 1;-3.1415 0 3.1415;-1 0 1]来计算,所得到的图像边缘会比较清晰。经过Sobel因子求边之后的图像是一个具有特殊意义的灰度图。图中的像素依然位于0到255之间,但与原来的灰度图略有差异,原图中坐标点所对应的像素与相邻坐标点所对应的像素越接近,那么在新图中该点所对应的像素就越接近0,反之,如果原图中坐标点所对应的像素与相邻坐标点所对应的像素相差越大,那么在sobel因子求边后的新图中该点所对应的像素就越接近255(白色)。但是它仍然不是一个二值图,所以在这里需要加入一个阈值来区分边缘。
所述求边阈值设定采用迭代法的算法,迭代法是一种用于求取平均权重的方法,首先求取全图像的最大和最小像素,将它们的平均值作为迭代法的初始变量threshold=(Px_max-Px_min)/2。然后在全图中求出大于初始变量的像素平均数Px_p_ave,即大于初始变量的像素总(sum_p)和除以它的个数(p_count),和小于于初始变量的像素平均数Px_n_ave,即小于初始变量的像素总和(sum_n)除以它的个数(n_count)。
Px_p_ave=sum_p/P_count,Px_n_ave=sum_n/n_count。
如果Px_p_ave和Px_n_ave的平均值等于threshold,那么阈值就是(Px_p_ave+Px_n_ave)/2,否者将(Px_p_ave+Px_n_ave)/2代替threshold重新开始计算,一直到threshold与(Px_p_ave+Px_n_ave)/2相等。最后将得到阈值对经过Sobel算法求边后的灰度图进行二值化处理,得到一张边际明显的轮廓图。
所述边缘膨胀,填充,和腐蚀,其中边缘膨胀使用星型膨胀方法,膨胀半径是2个像素,即将原图中凡是像素是255的点都向上下左右拓展2个像素,此膨胀方法是为了弥补求边算法的不足,目的是将非闭合的字符轮廓闭合,如图4所示,经过边缘膨胀步骤以后,绝大多数的字符轮廓已经闭合,所述填充是将封闭轮廓中的位图填白,也就是从左到右,从下到上开始检测填充图像,首先将最左下角填白,如果已经是白色的话就不需要改变颜色,然后判断它的相邻4个方位中是否有白色(255)的像素点,如果没有,就把相邻的方向上(来的方向除外,即到达这个像素点的上一个像素点不算,否则会形成死循环)填白,然后再以四个方向继续散射,如果遇到白色像素点或者是图片边界,那么就不需要填白,也不可以越过边界或者白色轮廓,也就是说假设上方是边界或者白色像素,那么对于本次检测而言就上方就不用散射了。重复执行直到没有可以填白的地方为止,记录填白的个数,然后从左到右下到上检测是否有还有黑色部分(例如被白色轮廓包围的封闭空间内没有填白),如果有再执行,记录每个被填白区域的像素总量,将大于像素总量预设值的图像区域和它的轮廓变回成黑色(因为可能是背景或者其他不可能包含字符的区域)。填充完毕以后使用腐蚀的步骤,尽可能的将由膨胀所产生的噪音消除,将粘连的字符断开,这里使用了一个半径为1的星型腐蚀法,即扫描图像,寻找白色像素点,一旦发现,判断该像素点前后左右四个方向是否都是白色,如果是的话,那么就在新图中将该点所对应的坐标填白,都则的话就在新图中该点所对应的坐标点填黑。
所述区域描边和第一次逻辑去噪,其中区域描边是将可能是字符的白色区域用长方形矩形框起来,记录可能是字符的白色区域所对应的图像位置,面积大小,中心点位置等等信息,根据字符特点将那些完全不可能是字符的白色区域去掉(比如说太小的区域和太大的区域)。
所述初次字符排列方向判断,将字符预设为竖向,将被矩形边框框住的可能是字符的白色区域(以后简称白色块状区域)的最小X坐标按照从小到大排列,将相邻X最小值只相差半个字符宽度的首尾X最小值相差不超过1.5个字符宽度的白色块状区域认为是处于一条直线上的(如图5所示),如果在包含最多块状区域个数的那条直线上块状区域个数大于6个,那么就认为在照片中该集装箱的字符排列方向是竖向。如果个数小于2个那么直接认为是横向,如果白色块状区域个数在2-6个之间那么需要判断,这几个白色块状区域的长度相加是否大于7个字符高度之和,如果是,也被认定是竖向排列,如果不是那么就认定为横向。如果是竖向排列的话,选取包含白色块状区域个数最多且长度相加大于300(像素)的那一段为以后分段式二值化所用,如果是横向排列的话,将所有被矩形边框框住的可能是字符的白色区域(以后简称白色块状区域)的最小Y坐标或者中心点Y轴坐标按照从小到大排列,将相邻Y值小于半个字符长度,首尾Y值相差不超过1.5个字符长度的白色块状区域认为是处于一条横线上的如图6所示。选取包含白色块状区域个数最多且宽度相加大于250(像素)的那一段为以后分段式二值化所用。
所述图像二值化使用的是分段二值化方法。由于白天日光强弱和照射角度不同导致照片表面光照分布不同,而在晚上或者光线灰暗的时候自动曝光系统会开启,由于各个集装箱表面涂层的反光率不同,所以会导致集装箱表面亮暗分布不均,这样如果在整张图像中使用同一个二值化阈值来二值化图像的话根本无法保证清楚地将所需的集装箱字符完整的显示出来,基于这个原因,一个高适性的二值化方法是必须的。首先将已经选取了的被方框框住的白色区域映射到灰度图中,求取单个方框内的平均灰度值,在这里本发明需要做一个判定,在包含白色区域最多的那条线上,中间块状区域(如果有6个块状区域的话,那么就是第三个6/2=3,如果有7个块状区域的话,那么就是第四个(7+1)/2=4。)的像素决定了字符二值化后的颜色。如果平均像素<127,那么二值化后字符就是黑色,否则就是白色。如果箱号是竖向排列,那么横向分段二值化,如果是横向排列的话就进行竖向分段二值化。其中PX1是字符E的平均灰度值,它的二值化范围是从图像最左边到E和M的中间,PX2是字符M的平均灰度值,它的二值化范围是从E和M的中间到M和C的中间,以此类图得到一张分段式的二值化图。
所述最终字符排列方向确定、滤噪与字符提取,再一次使用了与初次字符排列方法类似的方法,但是如果字符的颜色是黑色时,那么将全图反色,就是黑变白,白变黑,如果字符是白色则不变。然后判断字符排列方向,首先将所有可能是字符的白色区域用矩形框框住,经完全不可能的矩形框删去(比如说是特别大的或者特别小的)将方向预设为横向,将余下的被矩形边框框住的可能是字符的白色区域(以后简称白色块状区域)的最小Y坐标或者中心点Y轴坐标按照从小到大排列,将相邻Y值小于半个字符长度,首尾Y值相差不超过1.5个字符长度的白色块状区域认为是处于一条横线上的如图6所示。如果有一条横线上方框个数大于等于6个且宽度相加大于250,如果有,那么就认为是横向排列,且这条横线上就包含了箱号。那么再此横线上最小的Y值(MINY)为起始Y值,(MINY-100)为终点,寻找在这个范围之内是不是存在在同一横线上的大于三个的字符串。如果有那么就是箱主代码。以横线上最大的Y值(MAXY)为起始Y值,(MAXY+100)为终点,寻找在这个范围之内是不是存在在同一横线上的大于三个的字符串。如果有那么就是箱型代码。如果最初的横向上没有6个以上的矩形框的就被认为是竖直排列。将被矩形边框框住的可能是字符的白色区域(以后简称白色块状区域)的最小X坐标按照从小到大排列,将相邻X最小值只相差半个字符宽度的首尾X最小值相差不超过1.5个字符宽度的白色块状区域认为是处于一条直线上的(如图5所示),如果直线上的矩形块个数没有超过6个,那么就认为字符不全或者没有包含箱号直接退出系统,如果在一条竖线上有超过6个矩形框的字符串那么就认为是竖直排列,并且该竖直线上包含了箱主和箱号信息。以该竖直线上矩形框的最大X坐标(MAXX)为起始坐标,(MAXX+100)为终点坐标检查是否存在同一竖线上的大于三个的字符串。如果有那么就是箱型代码。将这些可能拥有箱主信息,箱号,和箱型的矩形区域保存下来,其他的地方全部作为噪音滤掉(去掉原先有的矩形框)。
所述字符的切割与提取包括粘连以及切割,字符标准化处理。
所述粘连以及切割,由于集装箱箱号的排列方式,箱主代码一共有四位,箱号是六位,验证码是一位,箱型是四位或者六位(其中两位是国家代码),当横向排列是如果是三行排列方式,那么最上一行是箱主信息(四个字符),如果该行大于四个字符,假设是五个的话,那么需要判断最左边和左边第二个矩形框之间的间距D1和最右边与最右边第二个矩形框之间的间距D2的大小是否有一个超过2个字符宽度.如果D1超过了,那么最左边那一个被认为是噪音,应该去掉,如果D2则将最右边的字符作为噪音去掉。如果都没有超过那么判断D1与D2之间的大小,大的那一行则作为存在噪音的部分。如果大于五个矩形框那么判断相邻字符的间距,如果有任意两个矩形框间距大于两个字符宽度的就证明这两个矩形框中有一边存在着是非字符的噪音,判断左右两边矩形框的数量,大于三个矩形框的那一边被认为是包含箱主代码的部分。如果该行矩形框是三个,那么就要判断是否有两个字符相粘连,判断最大宽度的那个矩形框的宽度是否超过另外两个矩形框宽度平均值的1.5倍。如果有(S1)那么就认为宽度最大的那一个矩形框中包含了两个字符。求取该矩形框的灰度直方图,如图7所示,可以在灰度图中求,也可以在二值化后的图中求,如果要在灰度图中求那么就要将该矩形根据相同的坐标点映射到灰度图中,找到最低的波谷地区,记录X坐标点作为切割点将该矩形框切开。其他的箱号和箱型部分与前面的箱主部分判断与去粘连类似只是所包含的字符个数不同。
所述字符标准化处理,是切割后的二值化字符在进入识别系统之前需要经过缩放从而达到字符标准化,以供神经网络识别,在本发明中输入的字符标准格式是12(宽度)*20(长度)。它的具体计算公式如下
P ( x , y ) = Q ( int ( x × w 12 ) , int ( y × h 12 ) )
其中P代表缩放以后的字符,Q代表缩放以前的字符,w是指缩放前字符的宽度,h是指缩放前字符的长度。Int()方程是一个用四舍五入法取整的方程,即小数位小于0.5以下的将小数位去掉,整数位不变。小数位大于等于0.5的小数位也去掉。整数位加一,x,y是标准化后字符网格的坐标。P(x,y)是指位于新字符网格坐标(x,y)上的像素。在所有字符中有一个字符比较特别说以需要经过特殊处理,这个字符就是验证码,箱号代码的后面,即最长字符的最后一位。
字符识别:得到经过图像标准化处理后的信息,使用神经网络技术和欧氏距离法对切割后的字符进行识别。
所述神经网络,如图8所示普通神经网络包括输入层,隐藏层和输出层。在本发明中,输入层一共拥有241个输入点,由于标准字符大小是12*20,所以一共有240个点,然后加入一个偏移量(B),所以是241个在输入点,对于一个隐藏层的神经元来讲241个输入点依次对应了241个权值,由于神经网络的设计不同,隐藏层的层数不同,每层的神经元个数不同,会导致不一样的识别效果,在本发明中一共使用了一个隐藏层20个隐藏神经元,那么输入层所对应的权值个数是241*20=4820个,对于一般的神经网络而言,输出层只有一个输出元,因此输出层的权值等于隐藏层的神经元个数。输出层的数据最后会进入一个活化函数F,最基础的活化函数是一个阶跃函数,即如果输入大于等于0那么输出就是1如果输入小于0,那么输出就是0。
如图9所示是本发明使用的包含欧氏距离法的两次神经网络字符识别方法,在第一次神经网络中,我们将字符粗分为A-Z,0-9一共36个字符组,这些字符组中的字符不一定就是当前字符,比如说3,B,6,9,8,0,这些字符都有可能被划分到字符组8中,这时因为第一次需要将输入字符在识别36个字符中识别出来,对于一个只有一个隐藏层的回馈式的BP神经网络而言识别精确度并不会很高,因此在这里本发明引入了第二个细分神经网络(也是一个带有回馈功能的BP神经网络),将粗分后的字符组再次细分,由于细分网络中只需要识别有限的几个字符,那么它的识别精度将会大大提高。以下将会阐述神经网络的技术细节,在这里用在第一个粗分系统来作为例子,首先是训练过程。粗分系统中输出层一共有6个神经元,因为2的六次方是64,完全可以包含A~Z和0~9最多36个字符.输入层一共包含241个输入点,其中字符网格点上的输入为240个(X1...X240),偏置为1个(-1),第一层权值数量是241个输入*20个神经元一共是4820个(W1.1.1...W1.1.241,W1.2.1...W1.2.241...W1.20.241),如图9所示每一个神经元都对应了241个输入,W1,1,1中第一个1表示隐藏层,第二个1表示第一个神经元,第三个1表示第一个输入点所对应的权值,那么隐藏层中第二个神经元第一个输入点所对应的权值应该是W1.2.1,以此类推。输出层的神经元所对应的权值是120个(即20*6),W2.1.1...W2.6.20,所有权值的初始的大小是在-1到1之间随机的数值。隐藏层的输出更具以下公式可以求得
Y = 1 1 + exp ( V ) = 1 1 + exp ( Σ ( W 1 × X ) )
输出层公式可以表达为:
Z = 1 1 + exp ( V ′ ) = 1 1 + exp ( Σ W 2 × Y )
根据期望值可以求出输出误差,假设期望值是A
δ输出=(A-Z)×Z×(1-Z)
由此可以求出隐藏层误差
δ隐藏层=Y×(1-Y)×δ输出×W2
根据输出层与隐藏层的误差和学习率可以改变输出层与隐藏层的权值变化从而使结果不停地接近期望值A。将训练好的参数(W)放到系统中那么就可以进行识别了。识别网络和训练网络区分在于,识别网络不需要回馈,这也就意味着识别系统不会改变权值以及偏置。
系统输出会通过欧氏距离法进行计算,欧氏距离法其实是将输出神经元的输出值与以上每一个的期望值进行比较,即将一到六个输出神经元的实际输出与期望输出的差的平方相加,在36个字符中找到最小的一个值,与之对应的那个就是所求的字符了。方程如下:
Min ( Σ i = 1 6 ( Z i - A x , i ) 2 ) X ∈ ( 1 ~ 36 )
其中Zi是第i个输出神经元的实际输出值,Ax,i是指表格一中第X(36个字符之内)个字符的第i个输出神经元的期望输出值。Min()方程是求出这36个比较结果中的最小值,那么最小值所对应的X就是欧氏距离中最接近的相似度最高的字符。
第二层神经网络与第一层类似,只是将以分类的字符和其相似的字符再次进行精确分类,字符在第一层网络识别结束以后需要根据识别结果分别进入所对应的第二次识别系统。

Claims (11)

1、一种集装箱箱号识别方法,包括以下步骤:
集装箱箱号的提取:将得到包含集装箱箱号的图片经过图像处理技术切割出有用的箱号,并对切割出的箱号再次经过图像标准化处理;
所述集装箱箱号的提取包括图像预处理、图像处理以及字符的切割与提取;其中所述图像预处理包括图像的读取,图像灰度化以及为了降低噪音保持图像平滑所使用的二维中值滤波器;所述图像处理包括图像去噪以及字符定位、初次字符排列方向确定、图像二值化和最终字符排列方向确定;所述字符的切割与提取包括字符提取、字符粘连部分切割以及抓取字符标准化处理;
字符识别:得到经过图像标准化处理后的信息,使用神经网络技术和欧氏距离法对切割后的字符进行识别。
2、如权利要求1所述的集装箱箱号识别方法,其特征在于:所述图像灰度化,使用的灰度计算公式是:
gray(i,j)=0.11×r(i,j)+0.59×g(i,j)+0.3*b(i,j)
以上方程式中gray(i,j)为图像处理后的点(i,j)处的灰度值,r(i,j)是原图中点(i,j)处的红色像素值,g(i,j),b(i,j)分别是原图中点(i,j)处的绿色和蓝色的像素值,图片中任意坐标点所对应的灰度值范围都在(0~255)之间,其中0为纯黑,255为纯白。
3、如权利要求1所述的集装箱箱号识别方法,其特征在于:所述图像预处理中的图像读取将所读入的图片转化为BMP格式。
4、如权利要求1所述的集装箱箱号识别方法,其特征在于:所述图像处理中的字符定位使用了半径为2的星型膨胀法将二值化的轮廓图进行膨胀从而得到封闭区域,将封闭区域填充后使用半径为1的星型腐蚀法将图像腐蚀出独立的包含字符的白色区域,将白色区域用矩形框框住以备后用。
5、如权利要求4所述的集装箱箱号识别方法,其特征在于:所述图像去噪以及字符定位,是过滤器使用一个边缘探测技术,求边阈值设定,边框膨胀,填充,腐蚀技术,区域描边以及特定的逻辑判断技术。
6、如权利要求1-3任一条所述的集装箱箱号识别方法,其特征在于:所述图像处理使用了分段二值化,具体步骤如下:首先根据集装箱箱号排列规律找到包含字符的白色区域,将包含所述白色区域的边框映射到灰度图中,求取单个方框内的平均灰度值,根据像素值进行分段二值化;再根据像素平均值大小来判断字符颜色,将由于字符像素较小而被判断字符颜色是黑色的二值化图像全部反色,保证二值化后字体颜色是白色,背景颜色是黑色;最后将二值化以后的白色区域用矩形框框住,根据字符特点通过过滤器将非字符的区域删掉。
7、如权利要求5所述的集装箱箱号识别方法,其特征在于:所述边缘探测技术采用Sobel因子求边算法,其中包括横向检测因子g1=[-1-π-1;0 0 0;1π1]和竖向检测因子g2=[-1 0 1;-π0π;-1 0 1];主要的计算公式如下:
| Σ j = 0 length ( Σ u = 0 width g 1 * Image ( ( ( i - 1 ) : ( i + 1 ) ) , ( ( j - 1 ) : ( j + 1 ) ) ) ) |
+ | Σ j = 0 length ( Σ i = 0 width g 2 * Image ( ( ( i - 1 ) : ( i + 1 ) ) , ( ( j - 1 ) : ( j + 1 ) ) ) ) |
公式中Image是指要求被求边的灰度图像,图中的像素位于0到255之间。
8、如权利要求5所述的集装箱箱号识别方法,其特征在于:所述求边阈值设定采用迭代法的算法,首先求取全图像的最大和最小像素,将它们的平均值作为迭代法的初始变量threshold=(Px_max-Px_min)/2;然后在全图中求出大于初始变量的像素平均数Px_p_ave,即大于初始变量的像素总(sum_p)和除以它的个数(p_count),和小于于初始变量的像素平均数Px_n_ave,即小于初始变量的像素总和(sum_n)除以它的个数(n_count):
Px_p_ave=sum_p/P_count,Px_n_ave=sum_n/n_count。
9、如权利要求1所述的集装箱箱号识别方法,其特征在于:所述字符标准化处理方法如下:将被方框框住的字符保存到数组中,按照原始大小数组与标准化后的数组大小之间关系进行缩放,主要的计算公式如下:
P ( x , y ) = Q ( int ( x × w 12 ) , int ( y × h 12 ) )
其中P代表缩放以后的字符,Q代表缩放以前的字符,w是指缩放前字符的宽度,h是指缩放前字符的长度,Int()方程是一个用四舍五入法取整的方程,x,y是标准化后字符网格的坐标。P(x,y)是指位于新字符网格坐标(x,y)上的像素。
10、如权利要求9所述的集装箱箱号识别方法,其特征在于:对所述字符标准化处理标准化设计特殊双次神经网络,包括以下步骤:
1)设计一个神经网络,一次性粗略识别0~9,A~Z一共36个字符,使用欧氏距离法来简化网络;
2)归一化标准化以后的字符数组,即将所有255变为1,以便运用在字符识别中;
3)设计了另外一组神经网络,再一次对比较接近的字符进行识别,也使用欧氏距离法简化网络。
11、如权利要求10所述的集装箱箱号识别系统中,特征在于:所述欧氏距离法使一个网络一次性识别36个字符;输出层使用了6个神经元,可以表达64个不同的输出结果;所述欧氏距离法是将输出神经元的输出值与每一个期望值进行比较,在36个字符中找到误差最小的一个值,与之对应的那个就是所求的字符了,方程如下:
Min ( Σ i = 1 6 ( Z i - A x , i ) 2 ) , X ∈ ( 1 ~ 36 )
其中Zi是第i个输出神经元的实际输出值,Ax,i是指表格一中第X个字符的第i个输出神经元的期望输出值,Min()方程是求出这36个比较结果中的最小值。
CN200910170227A 2009-09-08 2009-09-08 一种集装箱箱号识别方法 Pending CN101650780A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910170227A CN101650780A (zh) 2009-09-08 2009-09-08 一种集装箱箱号识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910170227A CN101650780A (zh) 2009-09-08 2009-09-08 一种集装箱箱号识别方法

Publications (1)

Publication Number Publication Date
CN101650780A true CN101650780A (zh) 2010-02-17

Family

ID=41673016

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910170227A Pending CN101650780A (zh) 2009-09-08 2009-09-08 一种集装箱箱号识别方法

Country Status (1)

Country Link
CN (1) CN101650780A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894277A (zh) * 2010-06-13 2010-11-24 电子科技大学 基于多分类支持向量机的集装箱箱号识别方法
CN102024144A (zh) * 2010-11-23 2011-04-20 上海海事大学 集装箱箱号自动识别方法
CN102184398A (zh) * 2011-06-17 2011-09-14 电子科技大学 一种基于边缘检测的集装箱号码定位方法
CN102184390A (zh) * 2011-05-17 2011-09-14 姜雨枫 面向集装箱箱号的字符图像识别方法
CN102306283A (zh) * 2011-07-23 2012-01-04 浙江大学 Lcd数显仪示值的图像识别方法
CN103020621A (zh) * 2012-12-25 2013-04-03 深圳深讯和科技有限公司 中英文混排文字图像的切割方法及装置
CN103530758A (zh) * 2013-10-31 2014-01-22 郑恒强 基于智能终端、ocr技术的集装箱信息自动采集系统
CN103854024A (zh) * 2012-12-04 2014-06-11 百度国际科技(深圳)有限公司 一种图像中的字符提取方法及装置
CN104376322A (zh) * 2014-12-01 2015-02-25 上海海事大学 一种集装箱箱号预处理质量的智能评测方法
CN105701490A (zh) * 2016-02-24 2016-06-22 上海海事大学 一种基于图像熵的集装箱箱号自适应定位方法
CN107423731A (zh) * 2017-04-06 2017-12-01 云南小鹰科技有限公司 航空单据的数据处理方法及系统
CN107832767A (zh) * 2017-11-14 2018-03-23 深圳码隆科技有限公司 集装箱箱号识别方法、装置及电子设备
CN108596166A (zh) * 2018-04-13 2018-09-28 华南师范大学 一种基于卷积神经网络分类的集装箱箱号识别方法
CN109344828A (zh) * 2018-09-30 2019-02-15 中铁武汉勘察设计研究院有限公司 一种集装箱图像采集系统及集装箱装载状态检测方法
CN109919040A (zh) * 2019-02-15 2019-06-21 北京清瞳时代科技有限公司 货物的品规信息识别方法及装置
CN110634222A (zh) * 2019-08-27 2019-12-31 河海大学 一种银行票据信息识别方法
CN111044988A (zh) * 2020-01-06 2020-04-21 青梧桐有限责任公司 一种激光雷达扫描户型图的精细化处理方法
CN111144309A (zh) * 2019-12-27 2020-05-12 苏州海管家物流科技有限公司 一种集装箱箱门图像自动识别方法
CN111382733A (zh) * 2018-12-28 2020-07-07 同方威视技术股份有限公司 多通道集装箱号识别方法、装置和系统

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894277A (zh) * 2010-06-13 2010-11-24 电子科技大学 基于多分类支持向量机的集装箱箱号识别方法
CN102024144A (zh) * 2010-11-23 2011-04-20 上海海事大学 集装箱箱号自动识别方法
CN102184390A (zh) * 2011-05-17 2011-09-14 姜雨枫 面向集装箱箱号的字符图像识别方法
CN102184390B (zh) * 2011-05-17 2013-01-23 姜雨枫 面向集装箱箱号的字符图像识别方法
CN102184398A (zh) * 2011-06-17 2011-09-14 电子科技大学 一种基于边缘检测的集装箱号码定位方法
CN102184398B (zh) * 2011-06-17 2012-07-18 电子科技大学 一种基于边缘检测的集装箱号码定位方法
CN102306283A (zh) * 2011-07-23 2012-01-04 浙江大学 Lcd数显仪示值的图像识别方法
CN102306283B (zh) * 2011-07-23 2013-06-12 浙江大学 Lcd数显仪示值的图像识别方法
CN103854024A (zh) * 2012-12-04 2014-06-11 百度国际科技(深圳)有限公司 一种图像中的字符提取方法及装置
CN103020621B (zh) * 2012-12-25 2016-02-24 深圳深讯和科技有限公司 中英文混排文字图像的切割方法及装置
CN103020621A (zh) * 2012-12-25 2013-04-03 深圳深讯和科技有限公司 中英文混排文字图像的切割方法及装置
CN103530758A (zh) * 2013-10-31 2014-01-22 郑恒强 基于智能终端、ocr技术的集装箱信息自动采集系统
CN104376322B (zh) * 2014-12-01 2017-11-17 上海海事大学 一种集装箱箱号预处理质量的智能评测方法
CN104376322A (zh) * 2014-12-01 2015-02-25 上海海事大学 一种集装箱箱号预处理质量的智能评测方法
CN105701490B (zh) * 2016-02-24 2018-11-30 上海海事大学 一种基于图像熵的集装箱箱号自适应定位方法
CN105701490A (zh) * 2016-02-24 2016-06-22 上海海事大学 一种基于图像熵的集装箱箱号自适应定位方法
CN107423731A (zh) * 2017-04-06 2017-12-01 云南小鹰科技有限公司 航空单据的数据处理方法及系统
CN107832767A (zh) * 2017-11-14 2018-03-23 深圳码隆科技有限公司 集装箱箱号识别方法、装置及电子设备
CN108596166A (zh) * 2018-04-13 2018-09-28 华南师范大学 一种基于卷积神经网络分类的集装箱箱号识别方法
CN108596166B (zh) * 2018-04-13 2021-10-26 华南师范大学 一种基于卷积神经网络分类的集装箱箱号识别方法
CN109344828A (zh) * 2018-09-30 2019-02-15 中铁武汉勘察设计研究院有限公司 一种集装箱图像采集系统及集装箱装载状态检测方法
CN111382733A (zh) * 2018-12-28 2020-07-07 同方威视技术股份有限公司 多通道集装箱号识别方法、装置和系统
CN111382733B (zh) * 2018-12-28 2023-09-15 同方威视技术股份有限公司 多通道集装箱号识别方法、装置和系统
CN109919040A (zh) * 2019-02-15 2019-06-21 北京清瞳时代科技有限公司 货物的品规信息识别方法及装置
CN110634222A (zh) * 2019-08-27 2019-12-31 河海大学 一种银行票据信息识别方法
CN110634222B (zh) * 2019-08-27 2021-07-09 河海大学 一种银行票据信息识别方法
CN111144309A (zh) * 2019-12-27 2020-05-12 苏州海管家物流科技有限公司 一种集装箱箱门图像自动识别方法
CN111144309B (zh) * 2019-12-27 2023-06-20 苏州海管家物流科技有限公司 一种集装箱箱门图像自动识别方法
CN111044988A (zh) * 2020-01-06 2020-04-21 青梧桐有限责任公司 一种激光雷达扫描户型图的精细化处理方法

Similar Documents

Publication Publication Date Title
CN101650780A (zh) 一种集装箱箱号识别方法
CN105354572B (zh) 一种基于简化卷积神经网络的车牌自动识别系统
Arévalo et al. Shadow detection in colour high‐resolution satellite images
CN108596166A (zh) 一种基于卷积神经网络分类的集装箱箱号识别方法
CN102306384B (zh) 一种基于单幅图像的颜色恒常性处理方法
CN106846011A (zh) 营业执照识别方法和装置
CN104915972A (zh) 图像处理装置、图像处理方法以及程序
WO2005022465A2 (en) Detecting and correcting redeye in an image
US10803116B2 (en) Logo detection system for automatic image search engines
US8744177B2 (en) Image processing method and medium to extract a building region from an image
CN107194393A (zh) 一种检测临时车牌的方法及装置
Tahseen et al. Binarization Methods in Multimedia Systems when Recognizing License Plates of Cars
CN116279592A (zh) 一种用于无人物流车的可行驶区域划分方法
CN112200789B (zh) 一种图像识别的方法及装置、电子设备和存储介质
CN111179289B (zh) 一种适用于网页长图宽图的图像分割方法
Roeksukrungrueang et al. An implementation of automatic container number recognition system
Arévalo et al. Detecting shadows in QuickBird satellite images
US9269126B2 (en) System and method for enhancing the legibility of images
CN111402185A (zh) 一种图像检测方法及装置
CN112837329B (zh) 一种藏文古籍文档图像二值化方法及系统
Kashef et al. Adaptive enhancement and binarization techniques for degraded plate images
Miah A real time road sign recognition using neural network
CN114529906A (zh) 基于字符识别的输电设备数字仪表异常检测方法及系统
Delgado et al. Methodology for generating synthetic labeled datasets for visual container inspection
Kumari et al. A novel methodology for vehicle number plate recognition using artificial neural network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20100217