CN101894277A - 基于多分类支持向量机的集装箱箱号识别方法 - Google Patents
基于多分类支持向量机的集装箱箱号识别方法 Download PDFInfo
- Publication number
- CN101894277A CN101894277A CN 201010202168 CN201010202168A CN101894277A CN 101894277 A CN101894277 A CN 101894277A CN 201010202168 CN201010202168 CN 201010202168 CN 201010202168 A CN201010202168 A CN 201010202168A CN 101894277 A CN101894277 A CN 101894277A
- Authority
- CN
- China
- Prior art keywords
- support vector
- image
- container
- category support
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
基于多分类支持向量机的集装箱箱号识别方法,属于图像处理技术领域。本发明首先采集集装箱箱号字符图像,经二值化和归一化处理后分成字母图像集和数字图像集;然后构建两个多分类支持向量机,分别采用字母图像集的特征向量矩阵和数字图像集的特征向量矩阵进行训练,得到两个多分类支持向量机分类器SVC和SVN;在箱号识别过程中,将待识别集装箱箱号分割成11个字符图像,经二值化和归一化处理后,将计算所得的第1至第4个特征向量输入到多分类支持向量机分类器SVC进行识别,第5至第11个特征向量输入到多分类支持向量机分类器SVN进行识别。本发明创新性地将支持向量机应用于集装箱箱号字符识别,相比于其他同领域的技术方案具有更高的识别率和较小的计算量。
Description
技术领域
本发明属于图像处理技术领域,涉及模式识别技术,特别涉及集装箱箱号识别方法。
背景技术
集装箱是一种综合性的大型周转货箱,全球所有的集装箱都具有一个唯一的箱号与之对应。集装箱箱号通常用不同于箱体本身颜色的油漆印刷于集装箱箱体两侧和后侧。由于每个集装箱都具有一个唯一的箱号与之对应,所以对集装箱的识别就可以归结为对箱号的识别。
本发明中集装箱箱号识别是指利用计算机视觉技术来完成对集装箱箱号的识别。集装箱箱号识别系统一般要求能实时识别通过卡口的集装箱箱号并通过计算机检索系统查询集装箱的信息。通常,集装箱箱号识别方法可以分为四个过程:图像采集、箱号定位、箱号字符分割和字符识别,而如何进行精确的字符识别是影响集装箱箱号识别系统识别率高低的一个关键问题。
全球的集装箱有统一的编号标准:箱号由四个大写英文字母表示公司简称,六个阿拉伯数字表示编号,最后还有一个被框起来的数字校验位。
虽然集装箱箱号识别可以借鉴现有的一些计算机字符识别方法,但集装箱箱号字符识别具有自身的特点:小字符集(数字和字母)、箱号字体没有统一的印刷标准(箱号字体的印刷因集装箱所属公司而有所不同)、干扰和几何变形较多(如集装箱背面还存在着很多非箱号的其他字符)、甚至出现箱号破损的情况。而且集装箱箱号字符识别要求更高的识别率,上下文字符也没有语义和概率上的相关性。
现有的计算机字符识别主要有以下几种方法:
1.模板匹配的方法,利用字符轮廓、骨干、网络或者投影等特征,与标准字符比对分类。但是,由于实际应用中存在的干扰和变形,实用中常常没有很高的识别率。
2.按字符特征分类的方法,找出能够区别字符集中字符的特征集,如:字符像素比例、孔洞数、字形结构、笔画特征等。由于特征算法的实现困难,而且同样由于噪声干扰的问题,这一方法的识别率不高。
3.神经网络的方法是目前比较成功的方法。但是存在输入数据选择和网络结构设计等问题。
发明内容
本发明的目的是提供一种基于多分类支持向量机的集装箱箱号识别方法。本发明基于多分类支持向量机,利用其良好的分类能力,直接对提取出来的字符分类,相比于其他同领域的方案具有更高的识别率。
为方便描述本发明内容,这里首先对一些术语进行必要的定义:
定义1.集装箱箱号。对应于全球唯一的集装箱,由4个大写英文字母和7个阿拉伯数字组成,共11个字符。其中4个字母分为箱主(经营人代码)和设备识别码两部分,7个数字分为序号和校验码两部分。
定义2.灰度图像的二值化。在灰度图像中,常采用一个字节表示一个像素点,其灰度级为0~255,其二值化方法为构造用一个二进制位表示一个像素点的图像,设置二值化阈值T,将大于T的像素点设置为1,小于等于T的点设为0。
本发明技术方案如下:
基于多分类支持向量机的集装箱箱号识别方法,如图1所示,包括多分类支持向量机的训练过程和使用多分类支持向量机进行集装箱箱号的识别过程:
一、多分类向量机的训练过程,包括如下步骤:
步骤1:采集足够多的集装箱箱号字符图像;然后对集装箱箱号字符图像进行二值化处理,并归一化成宽度为M个像素、高度为N个像素大小的尺寸。归一化后的二值化集装箱箱号字符图像集记为图像集Train。
步骤2:将步骤1所得的图像集Train分成字母图像集Train_C_I和数字图像集Train_N_I,其中字母图像集Train_C_I包括26个子集,数字图像集Train_N_I包括10个子集。
步骤3:计算步骤2所得各个图像集中所有图像的特征向量,得到字母特征向量集Train_C_V和数字特征向量集Train_N_V,其中字母特征向量集Train_C_V包括26个子集,数字特征向量集Train_N_V包括10个子集。所述特征向量为一个M×N+1维的行向量,其中前M×N维由每幅图像的灰度值按行依次排列成,第M×N+1维是区别36个子集的标签。
步骤4:将字母特征向量集Train_C_V中所有特征向量组合成字母特征向量矩阵Train_C_V_M,同时将数字特征向量集Train_N_V中所有特征向量组合成数字特征向量矩阵Train_N_V_M。
步骤5:建立两个多分类支持向量机分类器SVC和SVN。
构建两个多分类支持向量机,分别采用字母特征向量矩阵Train_C_V_M和数字特征向量矩阵Train_N_V_M进行训练,得到两个多分类支持向量机分类器SVC和SVN。
二、使用多分类支持向量机进行集装箱箱号识别的过程,具体包括以下步骤:
步骤6:采集待识别集装箱箱号图像,经定位、分割处理后得到11个的待识别的集装箱箱号字符图像;再对11个待识别的集装箱箱号字符图像进行步骤1所述的二值化和归一化处理。
步骤7:计算11个归一化后的二值化待识别集装箱箱号字符图像的特征向量,并将11个特征向量按待识别集装箱箱号字符图像在待识别集装箱箱号中的位置顺序依次定义为X1、X2、、…、X11。所述特征向量由每幅图像的灰度值按行依次排列成。
步骤8:对11个特征向量进行分类识别。
由于集装箱箱号由11个字符组成,11个字符中,前4个字符为英文字母,后7个字符为阿拉伯数字;所以对X1~X4这4个特征向量,采用多分类支持向量机分类器SVC进行识别,得到待识别集装箱箱号第1至第4个的标签,进而得到待识别集装箱箱号第1至第4个字符识别结果;对X5~X11这7个特征向量,采用多分类支持向量机分类器SVN进行识别,得到待识别集装箱箱号第5至第11个的标签,进而得到待识别集装箱箱号第5至第11个字符识别结果。
需要说明的是:
1、步骤1中,采集集装箱箱号字符图像时,应当在各种光照条件下采集,且保证每种字符的采集数量在20个以上;对集装箱箱号字符图像进行二值化处理时,图像灰度等级按255级灰度计算,二值化阈值的取值范围为[90,130];归一化后的二值化集装箱箱号字符图像宽度M为16像素,高度N为32像素。
2、本发明所述的多分类支持向量机,对于内核函数并没有特别的限定,但若采用径向基核函数,会使得最终的识别准确率更高。
3、考虑到多分类支持向量机的特性,本发明在多分类向量机的训练过程中,采集集装箱箱号字符图像时,所采集的各种字符图像的数量应基本一致,以保证各字符平等地参与训练,从而减少由于训练次数差异带来的识别偏差。
本发明的有益效果是:
本发明创新性地将支持向量机应用于集装箱箱号识别,利用其良好的分类能力,直接对提取出来的字符分类,相比于其他同领域的方案具有更高的识别率。本发明区别对待集装箱箱号字符的前4位和后7位字符,将字符二值化图像特征向量分成两个集合,分别构造两个多分类支持向量机,并在识别过程中采用不同的支持向量机对需要识别的集装箱箱号字符进行逐一识别,大大减少了计算量。
附图说明
本发明提供的基于多分类支持向量机的集装箱箱号识别方法的流程示意图。
具体实施方式
基于多分类支持向量机的集装箱箱号识别方法,如图1所示,包括多分类支持向量机的训练过程和使用多分类支持向量机进行集装箱箱号的识别过程:
一、多分类向量机的训练过程,包括如下步骤:
步骤1:采集足够多的集装箱箱号字符图像;然后对集装箱箱号字符图像进行二值化处理,并归一化成宽度为M个像素、高度为N个像素大小的尺寸。归一化后的二值化集装箱箱号字符图像集记为图像集Train。
步骤2:将步骤1所得的图像集Train分成字母图像集Train_C_I和数字图像集Train_N_I,其中字母图像集Train_C_I包括26个子集,数字图像集Train_N_I包括10个子集。
步骤3:计算步骤2所得各个图像集中所有图像的特征向量,得到字母特征向量集Train_C_V和数字特征向量集Train_N_V,其中字母特征向量集Train_C_V包括26个子集,数字特征向量集Train_N_V包括10个子集。所述特征向量为一个M×N+1维的行向量,其中前M×N维由每幅图像的灰度值按行依次排列成,第M×N+1维是区别36个子集的标签。
步骤4:将字母特征向量集Train_C_V中所有特征向量组合成字母特征向量矩阵Train_C_V_M,同时将数字特征向量集Train_N_V中所有特征向量组合成数字特征向量矩阵Train_N_V_M。
步骤5:建立两个多分类支持向量机分类器SVC和SVN。
构建两个多分类支持向量机,分别采用字母特征向量矩阵Train_C_V_M和数字特征向量矩阵Train_N_V_M进行训练,得到两个多分类支持向量机分类器SVC和SVN。
二、使用多分类支持向量机进行集装箱箱号识别的过程,具体包括以下步骤:
步骤6:采集待识别集装箱箱号图像,经定位、分割处理后得到11个的待识别的集装箱箱号字符图像;再对11个待识别的集装箱箱号字符图像进行步骤1所述的二值化和归一化处理。
步骤7:计算11个归一化后的二值化待识别集装箱箱号字符图像的特征向量,并将11个特征向量按待识别集装箱箱号字符图像在待识别集装箱箱号中的位置顺序依次定义为X1、X2、…、X11。所述特征向量由每幅图像的灰度值按行依次排列成。
步骤8:对11个特征向量进行分类识别。
由于集装箱箱号由11个字符组成,11个字符中,前4个字符为英文字母,后7个字符为阿拉伯数字;所以对X1~X4这4个特征向量,采用多分类支持向量机分类器SVC进行识别,得到待识别集装箱箱号第1至第4个的标签,进而得到待识别集装箱箱号第1至第4个字符识别结果;对X5~X11这7个特征向量,采用多分类支持向量机分类器SVN进行识别,得到待识别集装箱箱号第5至第11个的标签,进而得到待识别集装箱箱号第5至第11个字符识别结果。
需要说明的是:
1、步骤1中,采集集装箱箱号字符图像时,应当在各种光照条件下采集,且保证每种字符的采集数量在20个以上;对集装箱箱号字符图像进行二值化处理时,图像灰度等级按255级灰度计算,二值化阈值的取值范围为[90,130];归一化后的二值化集装箱箱号字符图像宽度M为16像素,高度N为32像素。
2、本发明所述的多分类支持向量机,对于内核函数并没有特别的限定,但若采用径向基核函数,会使得最终的识别准确率更高。
3、考虑到多分类支持向量机的特性,本发明在多分类向量机的训练过程中,采集集装箱箱号字符图像时,所采集的各种字符图像的数量应基本一致,以保证各字符平等地参与训练,从而减少由于训练次数差异带来的识别偏差。
经试验验证,本发明对英文字母字符识别率达到98.98%,对数字字符识别率达到99.57%,各字符统计平均识别率98.60%。
Claims (3)
1.基于多分类支持向量机的集装箱箱号识别方法,包括多分类支持向量机的训练过程和使用多分类支持向量机进行集装箱箱号的识别过程:
一、多分类向量机的训练过程,包括如下步骤:
步骤1:采集足够多的集装箱箱号字符图像;然后对集装箱箱号字符图像进行二值化处理,并归一化成宽度为M个像素、高度为N个像素大小的尺寸;归一化后的二值化集装箱箱号字符图像集记为图像集Train;
步骤2:将步骤1所得的图像集Train分成字母图像集Train_C_I和数字图像集Train_N_I,其中字母图像集Train_C_I包括26个子集,数字图像集Train_N_I包括10个子集;
步骤3:计算步骤2所得各个图像集中所有图像的特征向量,得到字母特征向量集Train_C_V和数字特征向量集Train_N_V,其中字母特征向量集Train_C_V包括26个子集,数字特征向量集Train_N_V包括10个子集;所述特征向量为一个M×N+1维的行向量,其中前M×N维由每幅图像的灰度值按行依次排列成,第M×N+1维是区别36个子集的标签;
步骤4:将字母特征向量集Train_C_V中所有特征向量组合成字母特征向量矩阵Train_C_V_M,同时将数字特征向量集Train_N_V中所有特征向量组合成数字特征向量矩阵Train_N_V_M;
步骤5:建立两个多分类支持向量机分类器SVC和SVN;
构建两个多分类支持向量机,分别采用字母特征向量矩阵Train_C_V_M和数字特征向量矩阵Train_N_V_M进行训练,得到两个多分类支持向量机分类器SVC和SVN;
二、使用多分类支持向量机进行集装箱箱号识别的过程,具体包括以下步骤:
步骤6:采集待识别集装箱箱号图像,经定位、分割处理后得到11个的待识别的集装箱箱号字符图像;再对11个待识别的集装箱箱号字符图像进行步骤1所述的二值化和归一化处理;
步骤7:计算11个归一化后的二值化待识别集装箱箱号字符图像的特征向量,并将11个特征向量按待识别集装箱箱号字符图像在待识别集装箱箱号中的位置顺序依次定义为X1、X2、…、X11;所述特征向量由每幅图像的灰度值按行依次排列成;
步骤8:对11个特征向量进行分类识别;
由于集装箱箱号由11个字符组成,11个字符中,前4个字符为英文字母,后7个字符为阿拉伯数字;所以对X1~X4这4个特征向量,采用多分类支持向量机分类器SVC进行识别,得到待识别集装箱箱号第1至第4个的标签,进而得到待识别集装箱箱号第1至第4个字符识别结果;对X5~X11这7个特征向量,采用多分类支持向量机分类器SVN进行识别,得到待识别集装箱箱号第5至第11个的标签,进而得到待识别集装箱箱号第5至第11个字符识别结果。
2.根据权利要求1所述的基于多分类支持向量机的集装箱箱号识别方法,其特征在于,步骤1中:采集集装箱箱号字符图像时,应当在各种光照条件下采集,且保证每种字符的采集数量在20个以上;对集装箱箱号字符图像进行二值化处理时,图像灰度等级按255级灰度计算,二值化阈值的取值范围为[90,130];归一化后的二值化集装箱箱号字符图像宽度M为16像素,高度N为32像素。
3.根据权利要求1所述的基于多分类支持向量机的集装箱箱号识别方法,其特征在于,所述多分类支持向量机采用径向基核函数的多分类支持向量机。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010202168 CN101894277A (zh) | 2010-06-13 | 2010-06-13 | 基于多分类支持向量机的集装箱箱号识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010202168 CN101894277A (zh) | 2010-06-13 | 2010-06-13 | 基于多分类支持向量机的集装箱箱号识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101894277A true CN101894277A (zh) | 2010-11-24 |
Family
ID=43103465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010202168 Pending CN101894277A (zh) | 2010-06-13 | 2010-06-13 | 基于多分类支持向量机的集装箱箱号识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101894277A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102289683A (zh) * | 2011-06-22 | 2011-12-21 | 电子科技大学 | 一种基于多分类支持向量机的集装箱箱号识别方法 |
CN103530758A (zh) * | 2013-10-31 | 2014-01-22 | 郑恒强 | 基于智能终端、ocr技术的集装箱信息自动采集系统 |
CN105117740A (zh) * | 2015-08-21 | 2015-12-02 | 北京旷视科技有限公司 | 字体识别方法及装置 |
CN111553888A (zh) * | 2020-04-15 | 2020-08-18 | 成都飞机工业(集团)有限责任公司 | 一种基于机器学习的钛合金锻件显微组织图像识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1659090A (zh) * | 2002-04-09 | 2005-08-24 | 佩斯科公司 | 基于码头集装箱起重机的利用位置标识进行自动光学集装箱代码识别的方法和设备 |
CN101604381A (zh) * | 2009-05-20 | 2009-12-16 | 电子科技大学 | 基于多分类支持向量机的车牌字符识别方法 |
CN101650780A (zh) * | 2009-09-08 | 2010-02-17 | 宁波中科集成电路设计中心有限公司 | 一种集装箱箱号识别方法 |
-
2010
- 2010-06-13 CN CN 201010202168 patent/CN101894277A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1659090A (zh) * | 2002-04-09 | 2005-08-24 | 佩斯科公司 | 基于码头集装箱起重机的利用位置标识进行自动光学集装箱代码识别的方法和设备 |
CN101604381A (zh) * | 2009-05-20 | 2009-12-16 | 电子科技大学 | 基于多分类支持向量机的车牌字符识别方法 |
CN101650780A (zh) * | 2009-09-08 | 2010-02-17 | 宁波中科集成电路设计中心有限公司 | 一种集装箱箱号识别方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102289683A (zh) * | 2011-06-22 | 2011-12-21 | 电子科技大学 | 一种基于多分类支持向量机的集装箱箱号识别方法 |
CN103530758A (zh) * | 2013-10-31 | 2014-01-22 | 郑恒强 | 基于智能终端、ocr技术的集装箱信息自动采集系统 |
CN105117740A (zh) * | 2015-08-21 | 2015-12-02 | 北京旷视科技有限公司 | 字体识别方法及装置 |
CN111553888A (zh) * | 2020-04-15 | 2020-08-18 | 成都飞机工业(集团)有限责任公司 | 一种基于机器学习的钛合金锻件显微组织图像识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yu et al. | A generic system for form dropout | |
CN112528863A (zh) | 表格结构的识别方法、装置、电子设备及存储介质 | |
Karthick et al. | Steps involved in text recognition and recent research in OCR; a study | |
CN101604381B (zh) | 基于多分类支持向量机的车牌字符识别方法 | |
CN102081731B (zh) | 一种从图像中提取文本的方法和装置 | |
CN110619274A (zh) | 基于印章和签名的身份验证方法、装置和计算机设备 | |
CN112508011A (zh) | 一种基于神经网络的ocr识别方法及设备 | |
CN116071763B (zh) | 基于文字识别的教辅图书智能校编系统 | |
CN105117741A (zh) | 一种书法字风格的识别方法 | |
CN103295009A (zh) | 基于笔画分解的车牌字符识别方法 | |
CN101894277A (zh) | 基于多分类支持向量机的集装箱箱号识别方法 | |
CN104834891A (zh) | 一种中文图像型垃圾邮件过滤方法及系统 | |
Kefali et al. | Evaluation of several binarization techniques for old Arabic documents images | |
CN100485711C (zh) | 手写字体的计算机识别与自动输入方法 | |
Rodrigues et al. | Cursive character recognition–a character segmentation method using projection profile-based technique | |
CN108427954B (zh) | 一种标牌信息采集与识别系统 | |
CN111414917B (zh) | 一种低像素密度文本的识别方法 | |
Aravinda et al. | Template matching method for Kannada handwritten recognition based on correlation analysis | |
Haghighi et al. | A new large-scale multi-purpose handwritten Farsi database | |
CN110032999A (zh) | 一种汉字结构退化的低分辨率车牌识别方法 | |
Sathisha | Bank automation system for Indian currency-a novel approach | |
CN113283299A (zh) | 基于cgan网络增强局部放电信号prpd图谱数据的方法 | |
CN105809160B (zh) | 一种基于交点数判定手写数字的方法 | |
CN111738255A (zh) | 一种基于深度学习的路牌文本检测与识别算法 | |
CN102289683A (zh) | 一种基于多分类支持向量机的集装箱箱号识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20101124 |