CN113903018A - 一种基于神经网络的集装箱号识别方法 - Google Patents

一种基于神经网络的集装箱号识别方法 Download PDF

Info

Publication number
CN113903018A
CN113903018A CN202110299988.6A CN202110299988A CN113903018A CN 113903018 A CN113903018 A CN 113903018A CN 202110299988 A CN202110299988 A CN 202110299988A CN 113903018 A CN113903018 A CN 113903018A
Authority
CN
China
Prior art keywords
container number
neural network
container
rectangular area
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110299988.6A
Other languages
English (en)
Other versions
CN113903018B (zh
Inventor
吴存忠
李斌
陈建武
鱼兆生
李勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Zhongli Outer Ship Tallying Co ltd
Original Assignee
Nanjing Zhongli Outer Ship Tallying Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Zhongli Outer Ship Tallying Co ltd filed Critical Nanjing Zhongli Outer Ship Tallying Co ltd
Priority to CN202110299988.6A priority Critical patent/CN113903018B/zh
Publication of CN113903018A publication Critical patent/CN113903018A/zh
Application granted granted Critical
Publication of CN113903018B publication Critical patent/CN113903018B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于神经网络的集装箱号识别方法,包括,通过MSER策略提取集装箱号所在的矩形区域,并对矩形区域进行聚类,根据聚类结果确定集装箱号的位置;通过神经网络EAST模型检测所述集装箱号所在矩形区域,而后将所述神经网络EAST模型的检测结果与所述集装箱号的初始位置进行比较,确定集装箱号的实际区域;对集装箱号的实际区域图片进行预处理,而后利用单程分裂与归并策略对所述预处理的图片进行字符分割;设计BP网络分类器,利用设计的BP网络分类器识别集装箱箱号。本发明通过结合MSER策略和EAST模型提高了定位集装箱号的准确率,同时通过结合单程分裂与归并策略和自设定的BP网络分类器提高了集装箱号的识别率。

Description

一种基于神经网络的集装箱号识别方法
技术领域
本发明涉及的技术领域,尤其涉及一种基于神经网络的集装箱号识别方法。
背景技术
随着科技进步与世界各国贸易的巨大增长,物流运输行业逐年加速发展,其中全球海运量逐年创下新高。集装箱作为海运的主要运输装载方式,在海运中有着十分重要的地位。在海运繁荣的同时,对集装箱的管理需要更加现代化的手段,实现对巨量的集装箱进行追踪、货物中转与货船存储规划等目的。
集装箱箱号是每个集装箱的专有标识码,对箱号进行自动识别是对集装箱进行各种高效管理操作的基础,如:所属公司、集装箱追踪、货物中转等。然而,由于全球对于集装箱箱号自动化识别并没有制定统一的标准,目前主要是使用图像处理技术实现对箱号的自动识别,但由于集装箱流转环境变化大与使用时间长,对集装箱的箱体及字符区域会造成一定影响,如字符残缺、污渍遮挡等,这些因素对集装箱箱号的识别准确率都存在重大影响。
目前,箱号识别系统对于箱号中残缺、粘连等字符,不能进行完整分割;同时对于分割出的残缺字符识别准确率低,而对于错误识别的集装箱仍然只能通过人工识别记录与校对箱号,增加了人力成本与流转时间。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了一种神经网络的集装箱号识别方法,能够解决集装箱号识别效果差的问题。
为解决上述技术问题,本发明提供如下技术方案:包括,通过MSER策略提取集装箱图片中集装箱号所在的矩形区域,并对所述矩形区域进行聚类,根据聚类结果确定所述集装箱号的位置;通过神经网络EAST模型检测所述集装箱号所在矩形区域,而后将所述神经网络EAST模型的检测结果与所述集装箱号的位置进行比较,确定集装箱号的实际区域;对集装箱号的实际区域图片进行预处理,而后利用单程分裂与归并策略对所述预处理的图片进行分割;利用BP网络分类器对所述分割后的图片进行字符识别训练,当识别误差满足设定阈值时停止训练,输出BP网络分类器参数;根据所述参数设置所述BP网络分类器,利用所述设置后的BP网络分类器识别集装箱箱号。
作为本发明所述的基于神经网络的集装箱号识别方法的一种优选方案,其中:随机选取K个初始质心,分别计算所有矩形区域样本到所述K个初始质心的距离;若所述矩形区域样本离质心S最近,则判定所述矩形区域样本属于所述S;若所述矩形区域样本到多个质心的距离相等,则可将所述矩形区域样本划分到任意组;所述所有矩形区域样本完成后,将每个所述矩形区域样本的每个维度的平均值作为新的质心,直至新的质心等于所述初始质心,结束所述聚类。
作为本发明所述的基于神经网络的集装箱号识别方法的一种优选方案,其中:根据集装箱号的印刷规则对聚类中的文字候选区域进行匹配,从而确定所述集装箱号的位置。
作为本发明所述的基于神经网络的集装箱号识别方法的一种优选方案,其中:所述匹配包括,定义匹配度M:
Figure BDA0002985831920000021
其中,h为聚类候选区域的一个缩放因子,v表示第i个候选区域的坐标信息,表示箱号中第j个字符在标准集装箱箱号印刷中对应的坐标信息,n为需要计算相似度的聚类的候选区域数量,m表示实际集装箱箱号印刷的字符数量,γ表示坐标误差,ε表示候选区域数量和标准数量的误差在所述匹配度M中的占比。
作为本发明所述的基于神经网络的集装箱号识别方法的一种优选方案,其中:所述比较包括,分别通过下式进行边界情况的比较,以确定集装箱号的实际区域:
Figure BDA0002985831920000022
Figure BDA0002985831920000023
若AL≤0且AR≤0时,将所述MSER提取的矩形区域作为所述集装箱号的实际区域;若AL≤0且AR>0时,将所述神经网络EAST模型检测的集装箱号所在矩形区域的最右边界作为集装箱号的实际区域的右边界,将所述MSER提取的矩形区域的最左边界作为集装箱号的实际区域的左边界;若AL≥0且AR≤0时,将所述神经网络EAST模型检测的集装箱号所在矩形区域的最左边界作为集装箱号的实际区域的左边界,将所述MSER提取的矩形区域的最右边界作为集装箱号的实际区域的右边界;若AL≥0且AR<0时,将所述神经网络EAST模型检测的集装箱号所在矩形区域作为所述集装箱号的实际区域;其中,cl和cr分别表示所述MSER提取的矩形区域中最左和最右的候选框的水平方向坐标,
Figure BDA0002985831920000031
Figure BDA0002985831920000032
分别表示所述神经网络EAST模型检测的集装箱号所在矩形区域的左边界和右边界的水平方向坐标。
作为本发明所述的基于神经网络的集装箱号识别方法的一种优选方案,其中:所述预处理包括,图像灰度化:利用加权平均策略将所述集装箱号的实际区域图片的R、G、B三个通道分量根据重要性及其他指标以不同的权重进行加权平均;图像平滑:利用均值滤波法对所述灰度化图像进行降噪处理。
作为本发明所述的基于神经网络的集装箱号识别方法的一种优选方案,其中:所述分割包括,计算分割阈值T,当分割结果大于所述分割阈值时,根据八邻域策略确定分割结果的像素;归并所述分割结果的像素并更新其区域特征;删除所述归并结果的大块区域;若细小区域过多,则增大阈值,重新确定区域号的像素;否则,结束所述分割。
作为本发明所述的基于神经网络的集装箱号识别方法的一种优选方案,其中:所述分割阈值T包括,
T=a·(max(f(x,y))-min(f(x,y)))
其中,f(x,y)表示坐标为(x,y)的图像像素灰度值,a取0.15。
作为本发明所述的基于神经网络的集装箱号识别方法的一种优选方案,其中:所述设定阈值包括,当连续3次误差小于0.01时停止训练。
作为本发明所述的基于神经网络的集装箱号识别方法的一种优选方案,其中:所述BP网络分类器参数包括,设置大写英文字母和阿拉伯数字的输入层节点数分别为21和17;大写英文字母和阿拉伯数字的输出层节点数分别为6和4;大写英文字母和阿拉伯字母的隐含层节点数分别为11和12。
本发明的有益效果:本发明通过结合MSER策略和EAST模型提高了定位集装箱号的准确率,同时通过结合单程分裂与归并策略和自设定的BP网络分类器提高了集装箱号的识别率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一个实施例所述的一种基于神经网络的集装箱号识别方法的流程示意图;
图2为本发明第一个实施例所述的一种基于神经网络的集装箱号识别方法的字符分割结果示意图;
图3为本发明第一个实施例所述的一种基于神经网络的集装箱号识别方法的识别结果示意图;
图4为本发明第二个实施例所述的一种基于神经网络的集装箱号识别方法的LeNet方法识别集装箱号结果示意图;
图5为本发明第二个实施例所述的一种基于神经网络的集装箱号识别方法的集装箱号识别结果示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1~图3,为本发明的第一个实施例,该实施例提供了一种基于神经网络的集装箱号识别方法,包括:
S1:通过MSER策略提取集装箱图片中集装箱号所在的矩形区域,并对矩形区域进行聚类,根据聚类结果确定集装箱号的位置。
其中需要说明的是,MSER(Maximally Stable Extremal Regions)为一种文字检测算法,该算法通过提取图片中的所有MSER区域作为文字候选区域,然后釆用提前训练好的分类器来过滤非文字的区域,接着通过连接规则将候选文字区域进行合并形成合理的文字线。
其提取过程如下:
①使用一系列灰度阈值对图像进行二值化处理;
②对于每个阈值得到的二值图像,得到相应的黑色区域与白色区域;
③在比较宽的灰度阈值范围内保持形状稳定的区域就是MSERs,即集装箱号所在的矩形区域;
④评判提取区域的标准:dA/dt;A为二值图像区域面积,t为灰度阈值。
进一步的,利用k均值聚类算法进行聚类操作,其具体步骤如下:
①预将所有矩形区域样本分为K组,随机选取K个对象作为初始的聚类质心,分别计算所有矩形区域样本到K个初始质心的距离;
②若矩形区域样本离质心S最近,则判定矩形区域样本属于S;若矩形区域样本到多个质心的距离相等,则可将矩形区域样本划分到任意组;
③所有矩形区域样本完成后,将每个矩形区域样本的每个维度的平均值作为新的质心,直至新的质心等于初始质心,结束聚类。
通过聚类,可以将连续的文字合并在一起,形成一个完整的字符串区域;当需要定位集装箱箱号的位置,可以根据集装箱箱号的印刷规则来对聚类中的文字候选区域进行匹配,从而确定集装箱号的位置。
需要说明的是,集装箱号的印刷信息编码方式一般遵循ISO6346标准,标准集装箱箱号由11位编码组成,包括以下三个部分:
①第一部分由4位英文字母组成;前三位代码(Owner Code)主要说明箱主、经营人,第四位代码说明集装箱的类型。
②第二部分由6位数字组成;是箱体注册码(Registration Code),用于一个集装箱箱体持有的唯一标识。
③第三部分为校验码(Check Digit),由前4位字母和6位数字经过校验规则运算得到,用于识别在校验时是否发生错误,即第11位数字。
考虑到集装箱箱号印刷有几种固定的标准,因此可以评估所有聚类中的候选区域排布与印刷标准的匹配度,匹配度越高,则表示这个聚类越有可能是集装箱箱号,具体的,定义匹配度M:
Figure BDA0002985831920000061
Figure BDA0002985831920000062
其中,
Figure BDA0002985831920000063
为候选区域和标准集装箱箱号印刷的坐标误差,
Figure BDA0002985831920000064
为聚类中的候选区域数量与实际集装箱号的数量差,h为聚类候选区域的一个缩放因子,由于实际拍照会使得候选区域出现缩放,旋转等变化,因此直接使用原始的坐标信息来计算相似度会出现很大错误,因此需要用一个缩放因子来调整候选区域的坐标;v表示第i个候选区域的坐标信息,w表示箱号中第j个字符在标准集装箱箱号印刷中对应的坐标信息,n为需要计算相似度的聚类的候选区域数量,m表示实际集装箱箱号印刷的字符数量,γ表示坐标误差,ε表示候选区域数量和标准数量的误差在匹配度M中的占比。
S2:通过EAST模型检测集装箱号所在矩形区域,将EAST模型的检测结果与集装箱号的初始位置进行比较,确定集装箱号的实际区域。
其中需要说明的是,EAST(an Efficient and Accurate Scene Text detector)中采用的神经网络是一个全卷积的神经网络,用于对输入图片中的每个像素点进行预测,判断其是否为文字区域;利用这样的神经网络模型,可以抛弃许多其他文字检测框架中的候选区域生成,文字区域组合,单词切割的模块,使得整体框架更加简洁,EAST在检测网络后,仅仅需要通过阈值判断,以及利用NMS(Non-Maximum Suppression)算法对文字区域进行几何形状判断,NMS输出的结果将作为最终的文字检测结果。
分别通过下式将EAST模型的检测结果与集装箱号的初始位置进行比较(边界情况的比较),以确定集装箱号的实际区域:
Figure BDA0002985831920000071
Figure BDA0002985831920000072
根据不同的情况,需要对集装箱箱号的边界做不同的处理,具体的:
①若AL≤0且AR≤0时,将MSER提取的矩形区域作为集装箱号的实际区域;
②若AL≤0且AR>0时,将神经网络EAST模型检测的集装箱号所在矩形区域的最右边界作为集装箱号的实际区域的右边界,将MSER提取的矩形区域的最左边界作为集装箱号的实际区域的左边界;
③若AL≥0且AR≤0时,将神经网络EAST模型检测的集装箱号所在矩形区域的最左边界作为集装箱号的实际区域的左边界,将MSER提取的矩形区域的最右边界作为集装箱号的实际区域的右边界;
④若AL≥0且AR<0时,将神经网络EAST模型检测的集装箱号所在矩形区域作为集装箱号的实际区域;
其中,cl和cr分别表示MSER提取的矩形区域中最左和最右的候选框的水平方向坐标,
Figure BDA0002985831920000073
Figure BDA0002985831920000074
分别表示神经网络EAST模型检测的集装箱号所在矩形区域的左边界和右边界的水平方向坐标。
S3:对集装箱号的实际区域图片进行预处理,而后利用单程分裂与归并策略对预处理的图片进行分割。
预处理操作包括图像灰度化和图像平滑。
图像灰度化:利用加权平均法将集装箱号的实际区域图片的R、G、B三个通道分量根据重要性及其他指标以不同的权重进行加权平均,公式如下:
Gray=0.229R+0.587G+0.114B
其中,Gray表示图像灰度值,R、G、B分别表示红、绿、蓝三个通道的颜色分量。
图像平滑:利用均值滤波法对灰度化图像进行降噪处理。
需要说明的是,均值滤波也称为线性滤波,其采用的主要方法为邻域平均法,线性滤波的基本原理是用均值代替原图像中的各个像素值,即对待处理的当前像素点(x,y),选择一个模板,该模板由其近邻的若干像素组成,求模板中所有像素的均值,再把该均值赋予当前像素点(x,y),作为处理后图像在该点上的灰度g(x,y),即g(x,y)=∑f(x,y)/m,m为该模板中包含当前像素在内的像素总个数。
进一步的,利用单程分裂与归并策略对预处理完成的图片进行分割,分割结果参照图2,分割的步骤如下:
①计算分割阈值T,当分割结果大于分割阈值时,根据八邻域策略确定分割结果的像素;
分割阈值T包括,
T=a·(max(f(x,y))-min(f(x,y)))
其中,f(x,y)表示坐标为(x,y)的图像像素灰度值,a取0.15;
需要说明的是,八邻域策略是利用点的八邻域信息,选择下一个点作为边界点,这个算法需要选择一个开始点,可以选择图像上是目标点,在最上,最左的点,然后查看它的八邻域的点,从右下方45°的位置开始寻找,如果是目标点,将沿顺时针90°作为下一次寻找的方向,如果不是,则逆时针45°继续寻找,一旦找到就重复上面的过程;
②归并分割结果的像素并更新其区域特征:
对当前像素及其4个邻接像素所构成的5个像素的区域,应考察其相似归并的可能性,当存在归并的可能性时,则将两个区域归并,并更新相应的区域特征;
③删除归并结果的大块区域;
④若细小区域过多,则增大阈值,重新确定区域号的像素;否则,结束分割。
S4:利用BP网络分类器对分割后的图片进行字符识别训练,当识别误差满足设定阈值时停止训练,输出BP网络分类器参数。
BP(Back Propagation)网络分类器是一种按误差反向传播(简称误差反传)训练的多层前馈网络,其算法称为BP算法,包括输入层、隐藏层、输出层,它的基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方差为最小。
本实施例设定BP网络分类器的训练阈值为0.01,若连续3次训练得到的误差小于0.01,则停止训练,输出BP网络分类器参数。
参数如下:大写英文字母和阿拉伯数字的输入层节点数分别为21和17;大写英文字母和阿拉伯数字的输出层节点数分别为6和4;大写英文字母和阿拉伯字母的隐含层节点数分别为11和12。
S5:根据参数设置BP网络分类器,利用设置后的BP网络分类器识别集装箱箱号。
BP网络分类器识别判别规则为:在所有输出值中,值大于等于0.5的输岀期望值为1,小于0.5的输出期望值为0;识别结果如图3所示。
本发明在定位集装箱号的区域时同时结合了MSER策略和EAST模型,提高了定位的准确度;通过单程分裂与归并策略,解决了由于字符模糊、粘连难以分割的问题,为后续字符识别提高了准确度;最后通过自设定BP网络分类器的参数,实现了集装箱箱号的准确识别。
实施例2
对本方法中采用的技术效果加以验证说明,本实施例选择的LeNet识别方法和采用本方法进行对比测试,以科学论证的手段对比试验结果,以验证本方法所具有的真实效果。
LeNet识别方法虽然对手写数字达到非常高的识别率,但易受环境干扰,网络易出现欠拟合现象。
为验证本方法相对LeNet识别方法具有较优的抗干扰能力和识别效果,本实施例中将采用LeNet识别方法和本方法在PC端分别对1000张集装箱号样本图像进行识别对比。
本实施例的试验样本来自海关现场采集的1000张图像,图像大小为568×312pixels,包括各种光照条件下的图像(白天、夜晚、箱体有污渍、字符有缺损)。
将采集的图像分别采用LeNet识别方法、本方法(使用匹配度)和本方法(不使用匹配度)进行识别,采用LeNet方法获得的识别结果如图4所示,采用本方法(使用匹配度)获得的识别结果如图5所示,总体识别结果如下表所示。
表1:集装箱号识别结果对比表。
定位率 识别率 识别时间
LeNet识别方法 81.2% 91.6% 163ms
本方法(不使用匹配度) 92.5% 93.1% 154ms
本方法(使用匹配度) 98.7% 97.8% 101ms
结合如图4、图5和表1所示,LeNet识别方法识别集装箱号的误差较大,而本方法(使用匹配度)能准确地识别集装箱号,且本方法的识别效果均优于LeNet识别方法,平均识别时间仅需花费101ms。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种基于神经网络的集装箱号识别方法,其特征在于:包括,
通过MSER策略提取集装箱图片中集装箱号所在的矩形区域,并对所述矩形区域进行聚类,根据聚类结果确定所述集装箱号的位置;
通过神经网络EAST模型检测所述集装箱号所在矩形区域,而后将所述神经网络EAST模型的检测结果与所述集装箱号的位置进行比较,确定集装箱号的实际区域;
对集装箱号的实际区域图片进行预处理,而后利用单程分裂与归并策略对所述预处理的图片进行字符分割;
利用BP网络分类器对所述分割后的图片进行字符识别训练,当识别误差满足设定阈值时停止训练,输出BP网络分类器参数;
根据所述参数设置所述BP网络分类器,利用所述设置后的BP网络分类器识别集装箱箱号。
2.如权利要求1所述的基于神经网络的集装箱号识别方法,其特征在于:所述聚类包括,
随机选取K个初始质心,分别计算所有矩形区域样本到所述K个初始质心的距离;
若所述矩形区域样本离质心S最近,则判定所述矩形区域样本属于所述S;若所述矩形区域样本到多个质心的距离相等,则可将所述矩形区域样本划分到任意组;
所述所有矩形区域样本完成后,将每个所述矩形区域样本的每个维度的平均值作为新的质心,直至新的质心等于所述初始质心,结束所述聚类。
3.如权利要求2所述的基于神经网络的集装箱号识别方法,其特征在于:还包括,
根据集装箱号的印刷规则对聚类中的文字候选区域进行匹配,从而确定所述集装箱号的位置。
4.如权利要求3所述的基于神经网络的集装箱号识别方法,其特征在于:所述匹配包括,
定义匹配度M:
Figure FDA0002985831910000011
其中,h为聚类候选区域的一个缩放因子,v表示第i个候选区域的坐标信息,表示箱号中第j个字符在标准集装箱箱号印刷中对应的坐标信息,n为需要计算相似度的聚类的候选区域数量,m表示实际集装箱箱号印刷的字符数量,γ表示坐标误差,ε表示候选区域数量和标准数量的误差在所述匹配度M中的占比。
5.如权利要求1、2、4任一所述的基于神经网络的集装箱号识别方法,其特征在于:所述比较包括,
分别通过下式进行边界情况的比较,以确定集装箱号的实际区域:
Figure FDA0002985831910000021
Figure FDA0002985831910000022
若AL≤0且AR≤0时,将所述MSER提取的矩形区域作为所述集装箱号的实际区域;
若AL≤0且AR>0时,将所述神经网络EAST模型检测的集装箱号所在矩形区域的最右边界作为集装箱号的实际区域的右边界,将所述MSER提取的矩形区域的最左边界作为集装箱号的实际区域的左边界;
若AL≥0且AR≤0时,将所述神经网络EAST模型检测的集装箱号所在矩形区域的最左边界作为集装箱号的实际区域的左边界,将所述MSER提取的矩形区域的最右边界作为集装箱号的实际区域的右边界;
若AL≥0且AR<0时,将所述神经网络EAST模型检测的集装箱号所在矩形区域作为所述集装箱号的实际区域;
其中,cl和cr分别表示所述MSER提取的矩形区域中最左和最右的候选框的水平方向坐标,
Figure FDA0002985831910000023
Figure FDA0002985831910000024
分别表示所述神经网络EAST模型检测的集装箱号所在矩形区域的左边界和右边界的水平方向坐标。
6.如权利要求5所述的基于神经网络的集装箱号识别方法,其特征在于:所述预处理包括,
图像灰度化:利用加权平均策略将所述集装箱号的实际区域图片的R、G、B三个通道分量根据重要性及其他指标以不同的权重进行加权平均;
图像平滑:利用均值滤波法对所述灰度化图像进行降噪处理。
7.如权利要求2或6所述的基于神经网络的集装箱号识别方法,其特征在于:所述字符分割包括,
计算分割阈值T,当分割结果大于所述分割阈值时,根据八邻域策略确定分割结果的像素;
归并所述分割结果的像素并更新其区域特征;
删除所述归并结果的大块区域;
若细小区域过多,则增大阈值,重新确定区域号的像素;否则,结束所述字符分割。
8.如权利要求7述的基于神经网络的集装箱号识别方法,其特征在于:所述分割阈值T包括,
T=a.(max(f(x,y))-min(f(x,y)))
其中,f(x,y)表示坐标为(x,y)的图像像素灰度值,α取0.15。
9.如权利要求8所述的基于神经网络的集装箱号识别方法,其特征在于:所述设定阈值包括,
当连续3次误差小于0.01时停止训练。
10.如权利要求8或9所述的基于神经网络的集装箱号识别方法,其特征在于:所述BP网络分类器参数包括,
设置大写英文字母和阿拉伯数字的输入层节点数分别为21和17;大写英文字母和阿拉伯数字的输出层节点数分别为6和4;大写英文字母和阿拉伯字母的隐含层节点数分别为11和12。
CN202110299988.6A 2021-03-22 2021-03-22 一种基于神经网络的集装箱号识别方法 Active CN113903018B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110299988.6A CN113903018B (zh) 2021-03-22 2021-03-22 一种基于神经网络的集装箱号识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110299988.6A CN113903018B (zh) 2021-03-22 2021-03-22 一种基于神经网络的集装箱号识别方法

Publications (2)

Publication Number Publication Date
CN113903018A true CN113903018A (zh) 2022-01-07
CN113903018B CN113903018B (zh) 2023-04-07

Family

ID=79187425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110299988.6A Active CN113903018B (zh) 2021-03-22 2021-03-22 一种基于神经网络的集装箱号识别方法

Country Status (1)

Country Link
CN (1) CN113903018B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229506A (zh) * 2016-12-13 2018-06-29 上海安维尔信息科技股份有限公司 基于层次聚类和深度学习的箱号识别方法
CN108596166A (zh) * 2018-04-13 2018-09-28 华南师范大学 一种基于卷积神经网络分类的集装箱箱号识别方法
CN110348451A (zh) * 2019-07-18 2019-10-18 西南交通大学 铁路集装箱装卸过程中的箱号自动采集及识别方法
CN110414318A (zh) * 2019-06-13 2019-11-05 北京数智源科技有限公司 大场景下集装箱号识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229506A (zh) * 2016-12-13 2018-06-29 上海安维尔信息科技股份有限公司 基于层次聚类和深度学习的箱号识别方法
CN108596166A (zh) * 2018-04-13 2018-09-28 华南师范大学 一种基于卷积神经网络分类的集装箱箱号识别方法
CN110414318A (zh) * 2019-06-13 2019-11-05 北京数智源科技有限公司 大场景下集装箱号识别方法
CN110348451A (zh) * 2019-07-18 2019-10-18 西南交通大学 铁路集装箱装卸过程中的箱号自动采集及识别方法

Also Published As

Publication number Publication date
CN113903018B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN108596166B (zh) 一种基于卷积神经网络分类的集装箱箱号识别方法
CN111626190B (zh) 基于聚类分区进行刻度识别的水位监测方法
CN108596066B (zh) 一种基于卷积神经网络的字符识别方法
Louloudis et al. Text line and word segmentation of handwritten documents
US10817741B2 (en) Word segmentation system, method and device
Yu et al. An approach to Korean license plate recognition based on vertical edge matching
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
CN109389121B (zh) 一种基于深度学习的铭牌识别方法及系统
US6327386B1 (en) Key character extraction and lexicon reduction for cursive text recognition
WO2017031716A1 (zh) 自然场景图像中手写体数学公式结构分析与识别方法
CN114332650B (zh) 一种遥感图像道路识别方法及系统
CN111460927B (zh) 对房产证图像进行结构化信息提取的方法
CN106203539B (zh) 识别集装箱箱号的方法和装置
CN110210433B (zh) 一种基于深度学习的集装箱箱号检测与识别方法
CN111652213A (zh) 一种基于深度学习的船舶水尺读数识别方法
CN110647795A (zh) 一种表格识别方法
CN111783757A (zh) 一种基于ocr技术的复杂场景下身份证识别方法
Obaidullah et al. A system for handwritten script identification from Indian document
CN111259893A (zh) 一种基于深度学习的智能工具管理方法
CN113033558A (zh) 一种用于自然场景的文本检测方法及装置、存储介质
CN116740758A (zh) 一种防止误判的鸟类图像识别方法及系统
CN113657377B (zh) 一种机打票据图像结构化识别方法
CN107392115B (zh) 一种基于分层特征提取的交通标志识别方法
CN114387592B (zh) 一种复杂背景下字符定位和识别方法
CN110378337B (zh) 金属切削刀具图纸标识信息视觉输入方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant