CN111382733A - 多通道集装箱号识别方法、装置和系统 - Google Patents

多通道集装箱号识别方法、装置和系统 Download PDF

Info

Publication number
CN111382733A
CN111382733A CN201811632508.8A CN201811632508A CN111382733A CN 111382733 A CN111382733 A CN 111382733A CN 201811632508 A CN201811632508 A CN 201811632508A CN 111382733 A CN111382733 A CN 111382733A
Authority
CN
China
Prior art keywords
candidate frame
candidate
arrangement direction
channel
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811632508.8A
Other languages
English (en)
Other versions
CN111382733B (zh
Inventor
刘永春
姚彦洁
张*
王志明
李苇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuctech Co Ltd
Original Assignee
Nuctech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nuctech Co Ltd filed Critical Nuctech Co Ltd
Priority to CN201811632508.8A priority Critical patent/CN111382733B/zh
Publication of CN111382733A publication Critical patent/CN111382733A/zh
Application granted granted Critical
Publication of CN111382733B publication Critical patent/CN111382733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

本公开的实施例公开了一种多通道集装箱号识别方法,包括:通过多个通道中的每一个通道向集装箱号检测模型输入待识别箱号图像,以生成与多个建议框相关的信息,所述信息包括所述建议框的位置和所述建议框包含相应字符的概率;对与每个通道相对应的多个建议框进行箱号字符提取,以获得与每个通道相对应的通道识别结果;以及利用最大概率和法分别计算与所述多个通道相对应的多个通道识别结果的概率和,以选择与概率和最大的通道相对应的通道识别结果作为集装箱号识别结果。

Description

多通道集装箱号识别方法、装置和系统
技术领域
本公开涉及图像识别领域,具体地,涉及基于目标检测的多通道集装箱号识别方法、装置和系统。
背景技术
集装箱是一种用于装载货物以进行运输,并便于用机械设备进行装卸搬运的工具。每一个集装箱都拥有其唯一的箱号,箱号可能出现在集装箱的任何一个面上。箱号通常由操作员记录然后输入到电脑中,这不仅浪费了大量时间与人力而且还会由于操作员的各种疏忽而导致记录错误。
为了克服上述问题,已经开始研究能够智能地识别集装箱箱号的技术。
例如,申请号为201611144568.6的题为“基于层次聚类和深度学习的箱号识别方法”的专利公开了一种基于层次聚类和深度学习的箱号识别方法。在该方法中,首先采用MSER算法进行区域分割,得到候选字符区域;然后通过规则进行字符过滤与合并得到真实的集装箱号字符;接着通过层次聚类算法将箱号字符连接成候选的文本行,对文本行进行过滤得到最终的文本行;最后对文本行中的单个字符采用深度学习CNN网络进行识别,得到箱号的识别结果。该专利公开的识别方法具有如下缺点。首先,该箱号识别方法采用的是传统计算机视觉中的MSER算法进行箱号字元区域的定位,MSER算法容易受光照的影响。特别地,当箱号存在光照不均匀、遮挡、字符缺失、模糊等情况时,利用MSER算法进行箱号字符区域定位往往会遗漏字符,最终无法识别出正确的箱号,导致算法的综合识别率低。其次,该方法在白天的识别率为95%左右,但在夜间的识别率仅有85%左右。最后,该方法只考虑了两种文本行的情况:(1)四位箱号字母与六位箱号数字连在一起,(2)四位箱号字母连在一起,六位箱号数字连在一起,字母与数字之间有较大间隔。而实际的箱号共有11位:四位字母与7位数字,其中最后一位数字为校验位(专利中并未提及)。实际的箱号分布情况要更多,据统计,实际的箱号分布情况有水平与垂直两种。其中水平分布又分为一行、两行、多行等情况;垂直分布有一列、两列两种情况。
在题为“Container-code recognition system based on computer vision anddeep neural networks”(AIP Conference Proceedings 1955,040118,2018)的文献中提出了一种基于计算机视觉与深度神经网络的箱号识别系统,该箱号识别系统包含检测模块和识别模块两个部分。在检测模块中,采用了基于计算机视觉技术的MSER算法和深度神经网络CTPN两种检测方法,并对两种方法进行了结合。识别模块同样也采用了两种方法,一种是采用ResNet对分割后的单个字符进行识别,第二种是采用CRNN进行整个箱号文本行的识别,直接输出箱号字符串。然而,该系统具有如下缺点。首先,在检测模块中,可以利用MSER定位准确性来优化CTPN文本检测框的位置,具体是利用MSER定位出的文本高度和文本区域的水平线来确定文本线的位置和箱号的文本高度。该方法(CTPN)适用于箱号是水平排列的情况,但是并未考虑箱号在大幅度倾斜或垂直排列情况下的解决方案,然而箱号垂直排列的情况在实际箱号图像中更加普遍。其次,与检测模块相同,识别模块中的CRNN方法同样不能识别垂直分布的箱号序列。再次,该系统融合了多种算法,因此识别系统的时效性得不到保证,在实际的应用中,识别时效性是很重要的因素。最后,该识别系统的识别率为93%,并不是很高,实际的应用中普遍需要95%的识别率。
因此,需要一种能够克服上述问题的新的多通道集装箱号识别方法。
公开内容
根据本公开的一个方面,提供了一种多通道集装箱号识别方法,包括:
通过多个通道中的每一个通道向集装箱号检测模型输入待识别箱号图像,以生成与多个建议框相关的信息,所述信息包括所述建议框的位置和所述建议框包含相应字符的概率;
对与每个通道相对应的多个建议框进行箱号字符提取,以获得与每个通道相对应的通道识别结果;以及
利用最大概率和法分别计算与所述多个通道相对应的多个通道识别结果的概率和,以选择与概率和最大的通道相对应的通道识别结果作为集装箱号识别结果。
在一个实施例中,对与每个通道相对应的多个建议框进行箱号字符提取,以获得与每个通道相对应的通道识别结果包括:
选择所述多个建议框中的所述建议框包含相应字符的概率大于概率阈值的建议框作为候选框;
确定所述候选框的排列方向;
根据所确定的排列方向,确定所述候选框的排序;
根据所确定的候选框的排序,确定所述候选框中的满足预定的箱号设计规则的候选框;以及
选择所述满足预定的箱号设计规则的候选框中的候选框间距大于最小间距阈值且小于最大间距阈值的候选框,并且将与所选择的候选框相对应的字符作为与所述通道相对应的通道识别结果。
在一个实施例中,确定所述候选框的排列方向包括:
在水平方向和垂直方向上分别统计所有候选框中像素的数量,计算所述水平方向和所述垂直方向上的候选框中像素的分布均值,以分别确定水平分布方差和垂直分布方差;以及
当所述水平分布方差大于所述垂直分布方差时,确定所述候选框的排列方向为水平排列方向;否则确定所述候选框的排列方向为垂直排列方向。
在一个实施例中,根据所确定的排列方向,确定所述候选框的排序包括:
当所述排列方向是水平排列方向时,将所述多个候选框作为候选框集合,找出所述候选框集合中位于最上端的候选框作为参考候选框,并且将所述参考候选框确定为位于第i行(i=1);
确定所述候选框集合中的与所述参考候选框的高度差小于高度阈值的候选框与所述参考候选框都位于第i行,对所述高度差小于高度阈值的候选框从左到右进行排序,将所述多个候选框中除了所述第i行的候选框以外的剩余候选框作为候选框集合,找出所述候选框集合中的位于最上端的候选框作为参考候选框,并且将i递增1;以及
重复所述确定过程,直到所述多个候选框都被排序为止。
在一个实施例中,根据所确定的排列方向,确定所述候选框的排序包括:
当所述排列方向是垂直排列方向时,将所述多个候选框作为候选框集合,找出所述候选框集合中位于最左侧的候选框作为参考候选框,并且将所述参考候选框确定为位于第j列(j=1);
确定所述候选框集合中的与所述参考候选框的宽度差小于宽度阈值的候选框与所述参考候选框都位于第j列,对所述宽度差小于宽度阈值的候选框从上到下进行排序,将所述多个候选框中除了所述第j列的候选框以外的剩余候选框作为候选框集合,找出所述候选框集合中的位于最左侧的候选框作为参考候选框,并且将j递增1;以及
重复所述确定过程,直到所述多个候选框都被排序为止。
在一个实施例中,当所述排列方向是水平排列方向时,所述箱号设计规则包括四种设计规则,并且当所述排列方向是垂直排列方向时,所述箱号设计规则包括两种设计规则。
根据本公开的另一方面,提供了一种多通道集装箱号识别装置,包括:
输入模块,被配置为通过多个通道中的每一个通道向集装箱号检测模型输入待识别箱号图像,以生成与多个建议框相关的信息,所述信息包括所述建议框的位置和所述建议框包含相应字符的概率;
提取模块,被配置为对与每个通道相对应的多个建议框进行箱号字符提取,以获得与每个通道相对应的通道识别结果;以及
计算模块,被配置为利用最大概率和法分别计算与所述多个通道相对应的多个通道识别结果的概率和,以选择与概率和最大的通道相对应的通道识别结果作为集装箱号识别结果。
在一个实施例中,所述提取模块还被配置为:
选择所述多个建议框中的所述建议框包含相应字符的概率大于概率阈值的建议框作为候选框;
确定所述候选框的排列方向;
根据所确定的排列方向,确定所述候选框的排序;
根据所确定的候选框的排序,确定所述候选框中的满足预定的箱号设计规则的候选框;以及
选择所述满足预定的箱号设计规则的候选框中的候选框间距大于最小间距阈值且小于最大间距阈值的候选框,并且将与所选择的候选框相对应的字符作为与所述通道相对应的通道识别结果。
在一个实施例中,所述提取模块还被配置为:
在水平方向和垂直方向上分别统计所有候选框中像素的数量,计算所述水平方向和所述垂直方向上的候选框中像素的分布均值,以分别确定水平分布方差和垂直分布方差;以及
当所述水平分布方差大于所述垂直分布方差时,确定所述候选框的排列方向为水平排列方向;否则确定所述候选框的排列方向为垂直排列方向。
在一个实施例中,所述提取模块还被配置为:
当所述排列方向是水平排列方向时,将所述多个候选框作为候选框集合,找出所述候选框集合中位于最上端的候选框作为参考候选框,并且将所述参考候选框确定为位于第i行(i=1);
确定所述候选框集合中的与所述参考候选框的高度差小于高度阈值的候选框与所述参考候选框都位于第i行,对所述高度差小于高度阈值的候选框从左到右进行排序,将所述多个候选框中除了所述第i行的候选框以外的剩余候选框作为候选框集合,找出所述候选框集合中的位于最上端的候选框作为参考候选框,并且将i递增1;以及
重复所述确定过程,直到所述多个候选框都被排序为止。
在一个实施例中,所述提取模块还被配置为:
当所述排列方向是垂直排列方向时,将所述多个候选框作为候选框集合,找出所述候选框集合中位于最左侧的候选框作为参考候选框,并且将所述参考候选框确定为位于第j列(j=1);
确定所述候选框集合中的与所述参考候选框的宽度差小于宽度阈值的候选框与所述参考候选框都位于第j列,对所述宽度差小于宽度阈值的候选框从上到下进行排序,将所述多个候选框中除了所述第j列的候选框以外的剩余候选框作为候选框集合,找出所述候选框集合中的位于最左侧的候选框作为参考候选框,并且将j递增1;以及
重复所述确定过程,直到所述多个候选框都被排序为止。
在一个实施例中,当所述排列方向是水平排列方向时,所述箱号设计规则包括四种设计规则,并且当所述排列方向是垂直排列方向时,所述箱号设计规则包括两种设计规则。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示出了根据本公开的实施例的获得箱号检测模型的方法的流程图;
图2示出了根据本公开的实施例的多通道集装箱号识别方法的流程图;
图3示出了根据本公开的实施例的多通道集装箱号识别装置的示意图;以及
图4示出了根据本公开的实施例的多通道集装箱号识别系统的示意图。
附图没有对实施例的所有电路或结构进行显示。贯穿所有附图相同的附图标记表示相同或相似的部件或特征。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。这里使用的词语“一”、“一个(种)”和“该”等也应包括“多个”、“多种”的意思,除非上下文另外明确指出。此外,在此使用的术语“包括”、“包含”等表明了特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
图1示出了根据本公开的实施例的获得箱号检测模型的方法100的流程图。首先,在步骤S110中,可以由特征提取网络(CNN)(例如,Inception-Resnet-v2-atrous网络)对集装箱号图像进行特征提取以得到特征图。这里,可以例如使用9000张集装箱号图像进行特征提取。然后,在步骤S120,可以由区域建议网络(RPN)根据得到的特征图生成多种尺寸的区域建议框。在步骤S130,可以将多种尺寸的区域建议框映像到特征图上以得到多种尺寸的区域特征图,所有的区域特征图经过感兴趣区域(ROI)池化得到相同尺寸的区域特征图。在步骤S140中,所有的区域特征图可以经过全连接网络层(FC)/或卷积网络层(Conv)后结合标签的监督进行目标位置框回归(Lreg)与目标分类(Lcls)的训练。目前,存在36个目标检测类别,包括10个数字类别和26个字母类别。当迭代次数满足设定值时训练结束,得到最终的目标检测模型。在训练箱号检测模型时,可以设置建议框与真实框之间的重叠度,例如,0.7。
图2示出了根据本公开的实施例的多通道集装箱号识别方法200的流程图。应当注意的是,本文所述的多通道是指针对集装箱号检测模型的多个输入通道,通过每一个通道,可以向集装箱号检测模型输入待识别箱号图像。在步骤S210中,可以通过多个通道中的每一个通道向集装箱号检测模型输入待识别箱号图像,以生成与多个建议框相关的信息,该信息包括建议框的位置和建议框包含相应字符的概率。这里,可以选择4个通道和1000张待识别箱号图像(包含250个箱号)。在一个示例中,建议框的数量为300。在步骤S220中,可以对与每个通道相对应的多个建议框进行箱号字符提取,以获得与每个通道相对应的通道识别结果。在步骤S230中,可以利用最大概率和法分别计算与多个通道相对应的多个通道识别结果的概率和,以选择与概率和最大的通道相对应的通道识别结果作为集装箱号识别结果。
步骤S220可以包括:选择多个建议框中的建议框包含相应字符的概率大于概率阈值(例如,0.5)的建议框作为候选框(例如,25个候选框);确定候选框的排列方向;根据所确定的排列方向,确定候选框的排序;根据所确定的候选框的排序,确定候选框中的满足预定的箱号设计规则的候选框;以及选择满足预定的箱号设计规则的候选框中的候选框间距大于最小间距阈值且小于最大间距阈值的候选框,并且将与所选择的候选框相对应的字符作为与通道相对应的通道识别结果。这里,可以根据具体情况或根据经验来设置最小间距阈值和最大间距阈值。
目前,箱号设计规则根据排列方向的不同而不同。当排列方向是水平排列方向时,箱号设计规则可以包括四种设计规则,例如,一行(具有11个字符)、两行(第一行具有4个字符,并且第二行具有7个字符)、三行(第一行具有4个字符,第二行具有3个字符,并且第三行具有4个字符)、以及四行(第一行具有4个字符,第二行具有3个字符,第三行具有3个字符,并且第四行具有1个字符)。当排列方向是垂直排列方向时,箱号设计规则包括两种设计规则,例如,一列(具有11个字符)和两列(第一列具有4个字符,并且第二列具有7个字符)。当然,箱号设计规则不限于此,可以视情况设计其他的箱号设计规则。
确定候选框的排列方向可以包括:在水平方向和垂直方向上分别统计所有候选框中像素的数量,计算所述水平方向和所述垂直方向上的候选框中像素的分布均值(即,像素的横坐标均值和纵坐标均值),以分别确定水平分布方差(即,像素的横坐标方差)和垂直分布方差(即,像素的纵坐标方差);当所述水平分布方差大于所述垂直分布方差时,确定所述候选框的排列方向为水平排列方向;否则确定所述候选框的排列方向为垂直排列方向。
根据所确定的排列方向,确定候选框的排序可以包括:当排列方向是水平排列方向时,将多个候选框作为候选框集合,找出候选框集合中位于最上端的候选框作为参考候选框,并且将参考候选框确定为位于第i行(i=1);确定候选框集合中的与参考候选框的高度差小于高度阈值的候选框与参考候选框都位于第i行,对高度差小于高度阈值的候选框从左到右进行排序,将多个候选框中除了第i行的候选框以外的剩余候选框作为候选框集合,找出候选框集合中的位于最上端的候选框作为参考候选框,并且将i递增1;以及重复所述确定过程,直到多个候选框都被排序为止。
备选地,根据所确定的排列方向,确定候选框的排序包括:当排列方向是垂直排列方向时,将多个候选框作为候选框集合,找出候选框集合中位于最左侧的候选框作为参考候选框,并且将参考候选框确定为位于第j列(j=1);确定候选框集合中的与参考候选框的宽度差小于宽度阈值的候选框与参考候选框都位于第j列,对宽度差小于宽度阈值的候选框从上到下进行排序,将多个候选框中除了第j列的候选框以外的剩余候选框作为候选框集合,找出候选框集合中的位于最左侧的候选框作为参考候选框,并且将j递增1;以及重复所述确定过程,直到多个候选框都被排序为止。
根据本公开的实施例的多通道集装箱号识别方法200还可以包括:利用校验码对集装箱号识别结果进行校验。具体地,首先,计算集装箱号识别结果中的前十位字符的代码值之和,其中前十位字符中的每个字符的代码值由该字符的对应值与该字符所在位置的2次幂乘积计算得到。然后,将前十位字符的代码值之和对11取模后再对10取模以得到第十一位字符作为校验码。最后,将校验码与最后一位字符的对应值进行比较,如果校验码与最后一位字符的对应值相同,则指示集装箱号识别结果是正确的,否则指示集装箱号识别结果是错误的,并且需要重新执行多通道集装箱号识别。
图3示出了根据本公开的实施例的多通道集装箱号识别装置300的示意图。多通道集装箱号识别装置300可以包括输入模块310、提取模块320和计算模块330。输入模块310可以被配置为通过多个通道中的每一个通道向集装箱号检测模型输入待识别箱号图像,以生成与多个建议框相关的信息,该信息包括建议框的位置和建议框包含相应字符的概率。提取模块320可以被配置为对与每个通道相对应的多个建议框进行箱号字符提取,以获得与每个通道相对应的通道识别结果。计算模块330可以被配置为利用最大概率和法计算与多个通道相对应的多个通道识别结果的概率和,以选择与概率和最大的通道相对应的通道识别结果作为集装箱号识别结果。
提取模块320还可以被配置为:选择多个建议框中的建议框包含相应字符的概率大于概率阈值的建议框作为候选框;确定候选框的排列方向;根据所确定的排列方向,确定候选框的排序;根据所确定的候选框的排序,确定候选框中的满足预定的箱号设计规则的候选框;以及选择满足预定的箱号设计规则的候选框中的候选框间距大于最小间距阈值且小于最大间距阈值的候选框,并且将与所选择的候选框相对应的字符作为与通道相对应的通道识别结果。这里,可以根据具体情况或根据经验来设置最小间距阈值和最大间距阈值。
目前,箱号设计规则根据排列方向的不同而不同。当排列方向是水平排列方向时,箱号设计规则可以包括四种设计规则,例如,一行(具有11个字符)、两行(第一行具有4个字符,并且第二行具有7个字符)、三行(第一行具有4个字符,第二行具有3个字符,并且第三行具有4个字符)、以及四行(第一行具有4个字符,第二行具有3个字符,第三行具有3个字符,并且第四行具有1个字符)。当排列方向是垂直排列方向时,箱号设计规则包括两种设计规则,例如,一列(具有11个字符)和两列(第一列具有4个字符,并且第二列具有7个字符)。当然,箱号设计规则不限于此,可以视情况设计其他的箱号设计规则。
提取模块320还可以被配置为:在水平方向和垂直方向上分别统计所有候选框中像素的数量,计算所述水平方向和所述垂直方向上的候选框中像素的分布均值,以分别确定水平分布方差和垂直分布方差;当所述水平分布方差大于所述垂直分布方差时,确定所述候选框的排列方向为水平排列方向;否则确定所述候选框的排列方向为垂直排列方向。
提取模块320还可以被配置为:当排列方向是水平排列方向时,将多个候选框作为候选框集合,找出候选框集合中位于最上端的候选框作为参考候选框,并且将参考候选框确定为位于第i行(i=1);确定候选框集合中的与参考候选框的高度差小于高度阈值的候选框与参考候选框都位于第i行,对高度差小于高度阈值的候选框从左到右进行排序,将多个候选框中除了第i行的候选框以外的剩余候选框作为候选框集合,找出候选框集合中的位于最上端的候选框作为参考候选框,并且将i递增1;以及重复确定过程,直到多个候选框都被排序为止。
提取模块320还可以被配置为:当排列方向是垂直排列方向时,将多个候选框作为候选框集合,找出候选框集合中位于最左侧的候选框作为参考候选框,并且将参考候选框确定为位于第j列(j=1);确定候选框集合中的与参考候选框的宽度差小于宽度阈值的候选框与参考候选框都位于第j列,对宽度差小于宽度阈值的候选框从上到下进行排序,将多个候选框中除了第j列的候选框以外的剩余候选框作为候选框集合,找出候选框集合中的位于最左侧的候选框作为参考候选框,并且将j递增1;以及重复所述确定过程,直到多个候选框都被排序为止。
与传统的基于计算机视觉的图像处理技术(MSER图像区域分割等)相比,根据本公开的技术方案采用基于目标检测的深度神经网络实现集装箱号字符的检测与识别,从而可以有效地解决传统识别方法在箱号光照不均匀、箱号字符模糊、断裂等情况下识别率低的问题。与基于文本行的智慧识别方法(CPTN、CRNN、LSTM、CTC等算法)相比,根据本公开的技术方案可以应用于集装箱号垂直排列的情况,并且可以实现95%以上的综合识别准确率。例如,在实际的实验中,选择4个通道和10000张箱号图像(其中一共有2500个箱号),10000张箱号图像中的9000张图像(2250个箱号)用于集装箱号检测模型的训练,在未参与训练的1000张测试图像(250个箱号)中正确识别了240个箱号,识别准确率为96%。此外,在计算硬件满足要求的情况下,根据本公开的技术方案的识别时间为2-3秒,可以满足各种应用场合下(海关、卡口等)的集装箱号识别任务需要。
图4示意性地示出了根据本公开的实施例的多通道集装箱号识别系统400的示意图。系统400可以包括处理器410,例如,数字信号处理器(DSP)。处理器410可以是用于执行本文所描述的过程的不同动作的单个装置或多个装置。系统400还可以包括输入/输出(I/O)装置430,用于从其他实体接收信号或者向其他实体发送信号。
此外,系统400可以包括存储器420,该存储器420可以具有以下形式:非易失性或易失性存储器,例如,电可擦除可编程只读存储器(EEPROM)、闪存等。存储器420可以存储计算机可读指令,当处理器410执行该计算机可读指令时,该计算机可读指令可以使处理器执行本文所述的动作。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。
因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统(例如,一个或多个处理器)使用或者结合指令执行系统使用。在本公开的上下文中,计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。计算机可读介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
以上的详细描述通过使用示意图、流程图和/或示例,已经阐述了基于目标检测的多通道集装箱号识别方法、装置和系统的众多实施例。在这种示意图、流程图和/或示例包含一个或多个功能和/或操作的情况下,本领域技术人员应理解,这种示意图、流程图或示例中的每一功能和/或操作可以通过各种结构、硬件、软件、固件或实质上它们的任意组合来单独和/或共同实现。在一个实施例中,本公开的实施例所述主题的若干部分可以通过专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、或其他集成格式来实现。然而,本领域技术人员应认识到,这里所公开的实施例的一些方面在整体上或部分地可以等同地实现在集成电路中,实现为在一台或多台计算机上运行的一个或多个计算机程序(例如,实现为在一台或多台计算机系统上运行的一个或多个程序),实现为在一个或多个处理器上运行的一个或多个程序(例如,实现为在一个或多个微处理器上运行的一个或多个程序),实现为固件,或者实质上实现为上述方式的任意组合,并且本领域技术人员根据本公开,将具备设计电路和/或写入软件和/或固件代码的能力。此外,本领域技术人员将认识到,本公开所述主题的机制能够作为多种形式的程序产品进行分发,并且无论实际用来执行分发的信号承载介质的具体类型如何,本公开所述主题的示例性实施例均适用。信号承载介质的示例包括但不限于:可记录型介质,如软盘、硬盘驱动器、紧致盘(CD)、数字通用盘(DVD)、数字磁带、计算机存储器等;以及传输型介质,如数字和/或模拟通信介质(例如,光纤光缆、波导、有线通信链路、无线通信链路等)。

Claims (12)

1.一种多通道集装箱号识别方法,包括:
通过多个通道中的每一个通道向集装箱号检测模型输入待识别箱号图像,以生成与多个建议框相关的信息,所述信息包括所述建议框的位置和所述建议框包含相应字符的概率;
对与每个通道相对应的多个建议框进行箱号字符提取,以获得与每个通道相对应的通道识别结果;以及
利用最大概率和法分别计算与所述多个通道相对应的多个通道识别结果的概率和,以选择与概率和最大的通道相对应的通道识别结果作为集装箱号识别结果。
2.根据权利要求1所述的多通道集装箱号识别方法,其中,对与每个通道相对应的多个建议框进行箱号字符提取,以获得与每个通道相对应的通道识别结果包括:
选择所述多个建议框中的所述建议框包含相应字符的概率大于概率阈值的建议框作为候选框;
确定所述候选框的排列方向;
根据所确定的排列方向,确定所述候选框的排序;
根据所确定的候选框的排序,确定所述候选框中的满足预定的箱号设计规则的候选框;以及
选择所述满足预定的箱号设计规则的候选框中的候选框间距大于最小间距阈值且小于最大间距阈值的候选框,并且将与所选择的候选框相对应的字符作为与所述通道相对应的通道识别结果。
3.根据权利要求2所述的多通道集装箱号识别方法,其中,确定所述候选框的排列方向包括:
在水平方向和垂直方向上分别统计所有候选框中像素的数量,计算所述水平方向和所述垂直方向上的候选框中像素的分布均值,以分别确定水平分布方差和垂直分布方差;以及
当所述水平分布方差大于所述垂直分布方差时,确定所述候选框的排列方向为水平排列方向;否则确定所述候选框的排列方向为垂直排列方向。
4.根据权利要求3所述的多通道集装箱号识别方法,其中,根据所确定的排列方向,确定所述候选框的排序包括:
当所述排列方向是水平排列方向时,将所述多个候选框作为候选框集合,找出所述候选框集合中位于最上端的候选框作为参考候选框,并且将所述参考候选框确定为位于第i行(i=1);
确定所述候选框集合中的与所述参考候选框的高度差小于高度阈值的候选框与所述参考候选框都位于第i行,对所述高度差小于高度阈值的候选框从左到右进行排序,将所述多个候选框中除了所述第i行的候选框以外的剩余候选框作为候选框集合,找出所述候选框集合中的位于最上端的候选框作为参考候选框,并且将i递增1;以及
重复所述确定过程,直到所述多个候选框都被排序为止。
5.根据权利要求3所述的多通道集装箱号识别方法,其中,根据所确定的排列方向,确定所述候选框的排序包括:
当所述排列方向是垂直排列方向时,将所述多个候选框作为候选框集合,找出所述候选框集合中位于最左侧的候选框作为参考候选框,并且将所述参考候选框确定为位于第j列(j=1);
确定所述候选框集合中的与所述参考候选框的宽度差小于宽度阈值的候选框与所述参考候选框都位于第j列,对所述宽度差小于宽度阈值的候选框从上到下进行排序,将所述多个候选框中除了所述第j列的候选框以外的剩余候选框作为候选框集合,找出所述候选框集合中的位于最左侧的候选框作为参考候选框,并且将j递增1;以及
重复所述确定过程,直到所述多个候选框都被排序为止。
6.根据权利要求1所述的多通道集装箱号识别方法,其中,当所述排列方向是水平排列方向时,所述箱号设计规则包括四种设计规则,并且当所述排列方向是垂直排列方向时,所述箱号设计规则包括两种设计规则。
7.一种多通道集装箱号识别装置,包括:
输入模块,被配置为通过多个通道中的每一个通道向集装箱号检测模型输入待识别箱号图像,以生成与多个建议框相关的信息,所述信息包括所述建议框的位置和所述建议框包含相应字符的概率;
提取模块,被配置为对与每个通道相对应的多个建议框进行箱号字符提取,以获得与每个通道相对应的通道识别结果;以及
计算模块,被配置为利用最大概率和法分别计算与所述多个通道相对应的多个通道识别结果的概率和,以选择与概率和最大的通道相对应的通道识别结果作为集装箱号识别结果。
8.根据权利要求7所述的多通道集装箱号识别装置,其中,所述提取模块还被配置为:
选择所述多个建议框中的所述建议框包含相应字符的概率大于概率阈值的建议框作为候选框;
确定所述候选框的排列方向;
根据所确定的排列方向,确定所述候选框的排序;
根据所确定的候选框的排序,确定所述候选框中的满足预定的箱号设计规则的候选框;以及
选择所述满足预定的箱号设计规则的候选框中的候选框间距大于最小间距阈值且小于最大间距阈值的候选框,并且将与所选择的候选框相对应的字符作为与所述通道相对应的通道识别结果。
9.根据权利要求8所述的多通道集装箱号识别装置,其中,所述提取模块还被配置为:
在水平方向和垂直方向上分别统计所有候选框中像素的数量,计算所述水平方向和所述垂直方向上的候选框中像素的分布均值,以分别确定水平分布方差和垂直分布方差;以及
当所述水平分布方差大于所述垂直分布方差时,确定所述候选框的排列方向为水平排列方向;否则确定所述候选框的排列方向为垂直排列方向。
10.根据权利要求9所述的多通道集装箱号识别装置,其中,所述提取模块还被配置为:
当所述排列方向是水平排列方向时,将所述多个候选框作为候选框集合,找出所述候选框集合中位于最上端的候选框作为参考候选框,并且将所述参考候选框确定为位于第i行(i=1);
确定所述候选框集合中的与所述参考候选框的高度差小于高度阈值的候选框与所述参考候选框都位于第i行,对所述高度差小于高度阈值的候选框从左到右进行排序,将所述多个候选框中除了所述第i行的候选框以外的剩余候选框作为候选框集合,找出所述候选框集合中的位于最上端的候选框作为参考候选框,并且将i递增1;以及
重复所述确定过程,直到所述多个候选框都被排序为止。
11.根据权利要求9所述的多通道集装箱号识别装置,其中,所述提取模块还被配置为:
当所述排列方向是垂直排列方向时,将所述多个候选框作为候选框集合,找出所述候选框集合中位于最左侧的候选框作为参考候选框,并且将所述参考候选框确定为位于第j列(j=1);
确定所述候选框集合中的与所述参考候选框的宽度差小于宽度阈值的候选框与所述参考候选框都位于第j列,对所述宽度差小于宽度阈值的候选框从上到下进行排序,将所述多个候选框中除了所述第j列的候选框以外的剩余候选框作为候选框集合,找出所述候选框集合中的位于最左侧的候选框作为参考候选框,并且将j递增1;以及
重复所述确定过程,直到所述多个候选框都被排序为止。
12.根据权利要求7所述的多通道集装箱号识别装置,其中,当所述排列方向是水平排列方向时,所述箱号设计规则包括四种设计规则,并且当所述排列方向是垂直排列方向时,所述箱号设计规则包括两种设计规则。
CN201811632508.8A 2018-12-28 2018-12-28 多通道集装箱号识别方法、装置和系统 Active CN111382733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811632508.8A CN111382733B (zh) 2018-12-28 2018-12-28 多通道集装箱号识别方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811632508.8A CN111382733B (zh) 2018-12-28 2018-12-28 多通道集装箱号识别方法、装置和系统

Publications (2)

Publication Number Publication Date
CN111382733A true CN111382733A (zh) 2020-07-07
CN111382733B CN111382733B (zh) 2023-09-15

Family

ID=71217804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811632508.8A Active CN111382733B (zh) 2018-12-28 2018-12-28 多通道集装箱号识别方法、装置和系统

Country Status (1)

Country Link
CN (1) CN111382733B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112446822A (zh) * 2021-01-29 2021-03-05 聚时科技(江苏)有限公司 一种污损集装箱号图片的生成方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101650780A (zh) * 2009-09-08 2010-02-17 宁波中科集成电路设计中心有限公司 一种集装箱箱号识别方法
US20120033852A1 (en) * 2010-08-06 2012-02-09 Kennedy Michael B System and method to find the precise location of objects of interest in digital images
CN107832767A (zh) * 2017-11-14 2018-03-23 深圳码隆科技有限公司 集装箱箱号识别方法、装置及电子设备
CN108229506A (zh) * 2016-12-13 2018-06-29 上海安维尔信息科技股份有限公司 基于层次聚类和深度学习的箱号识别方法
CN108875744A (zh) * 2018-03-05 2018-11-23 南京理工大学 基于矩形框坐标变换的多方向文本行检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101650780A (zh) * 2009-09-08 2010-02-17 宁波中科集成电路设计中心有限公司 一种集装箱箱号识别方法
US20120033852A1 (en) * 2010-08-06 2012-02-09 Kennedy Michael B System and method to find the precise location of objects of interest in digital images
CN108229506A (zh) * 2016-12-13 2018-06-29 上海安维尔信息科技股份有限公司 基于层次聚类和深度学习的箱号识别方法
CN107832767A (zh) * 2017-11-14 2018-03-23 深圳码隆科技有限公司 集装箱箱号识别方法、装置及电子设备
CN108875744A (zh) * 2018-03-05 2018-11-23 南京理工大学 基于矩形框坐标变换的多方向文本行检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YI LIU等: "Container-code recognition system based on computer vision and deep neural networks", pages 1 - 10 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112446822A (zh) * 2021-01-29 2021-03-05 聚时科技(江苏)有限公司 一种污损集装箱号图片的生成方法

Also Published As

Publication number Publication date
CN111382733B (zh) 2023-09-15

Similar Documents

Publication Publication Date Title
CN110570389B (zh) 车辆损伤识别方法及装置
US10474713B1 (en) Learning method and learning device using multiple labeled databases with different label sets and testing method and testing device using the same
CN109189767B (zh) 数据处理方法、装置、电子设备及存储介质
US10956673B1 (en) Method and system for identifying citations within regulatory content
US10262214B1 (en) Learning method, learning device for detecting lane by using CNN and testing method, testing device using the same
CN109801260B (zh) 牲畜个数的识别方法、装置、控制装置及可读存储介质
CN108805128B (zh) 一种字符分割方法和装置
CN109740689B (zh) 一种图像语义分割的错误标注数据筛选方法及系统
US10438083B1 (en) Method and system for processing candidate strings generated by an optical character recognition process
WO2023010758A1 (zh) 一种动作检测方法、装置、终端设备和存储介质
US10275667B1 (en) Learning method, learning device for detecting lane through lane model and testing method, testing device using the same
CN111460927B (zh) 对房产证图像进行结构化信息提取的方法
CN111476210B (zh) 基于图像的文本识别方法、系统、设备及存储介质
CN112949476B (zh) 基于图卷积神经网络的文本关系检测方法、装置及存储介质
CN111539417B (zh) 一种基于深度神经网络的文本识别训练优化方法
Colter et al. Tablext: A combined neural network and heuristic based table extractor
CN112883795A (zh) 一种基于深度神经网络的表格快速自动提取方法
CN111382733B (zh) 多通道集装箱号识别方法、装置和系统
US8787676B2 (en) Image processing apparatus, computer readable medium storing program, and image processing method
CN111832497B (zh) 一种基于几何特征的文本检测后处理方法
CN113223011A (zh) 基于引导网络和全连接条件随机场的小样本图像分割方法
CN115861993A (zh) 字符识别方法、系统、设备及存储介质
WO2023207535A1 (zh) 一种伪标签框生成方法、装置及电子设备
CN110659648A (zh) 一种字符识别方法及装置
CN107330470B (zh) 识别图片的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant