CN111414844A - 一种基于卷积循环神经网络的集装箱箱号识别方法 - Google Patents

一种基于卷积循环神经网络的集装箱箱号识别方法 Download PDF

Info

Publication number
CN111414844A
CN111414844A CN202010188543.6A CN202010188543A CN111414844A CN 111414844 A CN111414844 A CN 111414844A CN 202010188543 A CN202010188543 A CN 202010188543A CN 111414844 A CN111414844 A CN 111414844A
Authority
CN
China
Prior art keywords
image
perspective transformation
neural network
container
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010188543.6A
Other languages
English (en)
Other versions
CN111414844B (zh
Inventor
张聪
靳松直
周斌
张辉
王浩
韦海萍
郑文娟
高仕博
郑智辉
郝梦茜
丛龙剑
刘严羊硕
李少军
刘燕欣
高琪
张艺明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Aerospace Automatic Control Research Institute
Original Assignee
Beijing Aerospace Automatic Control Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Aerospace Automatic Control Research Institute filed Critical Beijing Aerospace Automatic Control Research Institute
Priority to CN202010188543.6A priority Critical patent/CN111414844B/zh
Publication of CN111414844A publication Critical patent/CN111414844A/zh
Application granted granted Critical
Publication of CN111414844B publication Critical patent/CN111414844B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于卷积循环神经网络的集装箱箱号识别方法,所述方法包括如下步骤:步骤1:采集集装箱样本图像,根据集装箱样本图像构建循环卷积神经网络模型,对循环卷积神经网络模型训练后得到分类器;步骤2:计算图像透视变换矩阵;步骤3:利用步骤2得到的图像透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像;步骤4:使用步骤1的分类器对透视变换后的图像进行字符识别得到字符识别结果;步骤5:利用集装箱箱号规则对字符识别结果进行核对校验,输出最终的箱号检测结果。本发明对神经网络结构和参数进行优化,具有更高的识别率和可靠性;对图像进行透视变换,提高不同角度安装摄像头应用该方法的鲁棒性。

Description

一种基于卷积循环神经网络的集装箱箱号识别方法
技术领域
本发明属于集装箱箱号识别技术领域,尤其涉及一种基于卷积循环神经网络的集装箱箱号识别方法。
背景技术
集装箱箱号是集装箱的唯一身份标识,是智慧港口、集装箱自动化系统的重要基础信息。基于光学字符识别的箱号识别系统,无需对集装箱增加额外设备,只需获取包含集装箱箱号的图像即可实现,已成为现代化港口箱号识别的主流。
目前较为流行的光学字符识别算法主要分为两种,一种是基于模板匹配的算法,另一种是基于神经网络的算法。前者方法较为简单易于实现,但由于集装箱箱体的凹凸折纹、光照或恶劣天气等因素的影响,其准确率和可靠性较低。后者具有一定的自学习能力,尤其近年来随着深度学习算法和硬件的飞速发展,基于神经网络的字符识别受到越来越多的关注。
然而实际应用场景下,我们所能获取的集装箱箱号图像通常还受摄像头安装位置影响,图像存在较大角度的透视变形,传统的基于神经网络无法直接得到较好的结果。
发明内容
本发明解决的技术问题是:克服现有技术的不足,提供了一种基于卷积循环神经网络的集装箱箱号识别方法,对神经网络结构和参数进行优化,具有更高的识别率和可靠性;对图像进行透视变换,提高不同角度安装摄像头应用该方法的鲁棒性。
本发明目的通过以下技术方案予以实现:一种基于卷积循环神经网络的集装箱箱号识别方法,所述方法包括如下步骤:步骤1:采集集装箱样本图像,根据集装箱样本图像构建循环卷积神经网络模型,对循环卷积神经网络模型训练后得到分类器;步骤2:计算图像透视变换矩阵;步骤3:利用步骤2得到的图像透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像;步骤4:使用步骤1的分类器对透视变换后的图像进行字符识别得到字符识别结果;步骤5:利用集装箱箱号规则对字符识别结果进行核对校验,输出最终的箱号检测结果。
上述基于卷积循环神经网络的集装箱箱号识别方法中,在步骤1中,采集集装箱样本图像,根据集装箱样本图像构建循环卷积神经网络模型,对循环卷积神经网络模型训练后得到分类器包括如下步骤:(11)采集集装箱样本图像;(12)将集装箱样本图像缩放至高度32像素和宽度160像素的第二样本图像;将第二样本图像输入卷积神经网络,其中,卷积神经网络包括7层卷积层和4层最大池化;卷积神经网络输出512个特征图,每个特征图高度为1,宽度为40;(13)从步骤(12)得到的特征图中提取特征向量,其中,每个特征向量在特征图上按列从左到右生成,每一列包含512维特征,即第i个特征向量是所有特征图第i列像素的连接,共产生40个特征向量;(14)循环神经网络采用两层各256单元的双向长短型网络,在双向长短型网络的每个时间步传入一个特征向量,其中,时间步的数量为40个,每个时间步输出40个长度为37(26个英文字母+10个阿拉伯数字+1个空字符,其中空字符用“-”表示)的向量,40个向量构成后验概率矩阵;(15)由后验概率矩阵计算损失函数,其中,损失函数定义为概率的负最大似然函数;(16)通过损失函数对卷积循环神经网络进行训练,达到设定的学习次数>100000和精度<0.0001时完成训练,得到分类器。
上述基于卷积循环神经网络的集装箱箱号识别方法中,在步骤2中,计算图像透视变换矩阵包括如下步骤:(21)在待检测集装箱图像中选取4个点(x1,y1),(x2,y2),(x3,y3),(x4,y4),其中,4个点构成的区域包含箱号区域,并在真实空间中为矩形;(22)根据(x1,y1),(x2,y2),(x3,y3),(x4,y4)得到待变换后图像上对应点坐标(X1,Y1)、(X2,Y2)、(X3,Y3)、(X4,Y4);(23)将待变换后图像上对应点坐标(X1,Y1)、(X2,Y2)、(X3,Y3)、(X4,Y4)带入透视变换矩阵计算公式得到透视变换矩阵。
上述基于卷积循环神经网络的集装箱箱号识别方法中,在步骤3中,利用步骤2得到的图像透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像包括如下步骤:(31)根据步骤(23)中的透视变换矩阵对待检测集装箱图像进行透视变换得到透视变换后的图像;(32)将透视变换后的图像缩放至高度32像素、宽度160像素得到32*160的图像。
上述基于卷积循环神经网络的集装箱箱号识别方法中,在步骤4中,使用步骤1的分类器对透视变换后的图像进行字符识别得到字符识别结果包括如下步骤:(41)将步骤(32)中的32*160的图像输入步骤(16)中训练好的分类器,分类器输出40个时间步的37种字符类别的概率分布;(42)每个时间步取最大概率的字符作为该时间步的输出字符,所有时间步的输出字符组成一个字符序列;(43)删除字符序列中连续重复字符,然后删除所有“-”字符,得到字符识别结果。
上述基于卷积循环神经网络的集装箱箱号识别方法中,在步骤5中,利用集装箱箱号规则对字符识别结果进行核对校验,输出最终的箱号检测结果包括如下步骤:根据集装箱箱号规则对步骤(43)中的字符识别结果进行校验,满足集装箱箱号规则时输出最终的箱号识别结果,否则认为识别错误,输出识别错误信号;其中,集装箱箱号规则为:a)集装箱箱号的前4位是大写英文字母,集装箱箱号的后7位是阿拉伯数字;b)集装箱箱号的第11位是校验字符,能够由前10位字符计算得出。
上述基于卷积循环神经网络的集装箱箱号识别方法中,在步骤(11)中,装箱样本图像的样本训练集为S={(x1,z1),(x2,z2),...(xN,zN)};其中,x1为第一个样本,x2为第二个样本,xN为第N个样本,z1为第一个样本的标注结果,z2为第二个样本的标注结果,zN为第N个样本的标注结果,N为样本总数。
上述基于卷积循环神经网络的集装箱箱号识别方法中,步骤(15)中,损失函数为:
Figure BDA0002415048120000031
其中,O为损失函数,x为样本,l为可能的字符,S为样本集,p(l|x)表示后验概率矩阵中x为字符l的后验概率。
上述基于卷积循环神经网络的集装箱箱号识别方法中,在步骤(22)中,(X1,Y1)=(min(x1,x3),min(y1,y2))(X2,Y2)=(max(x2,x4),Y1)(X3,Y3)=(X1,max(y3,y4))(X4,Y4)=(X2,Y3);
在步骤(23)中,透视变换矩阵计算公式为:
Figure BDA0002415048120000041
其中,x为透视变换前图像某点的横坐标,y为透视变换前图像某点的纵坐标,X为透视变换后图像对应点的横坐标,Y为透视变换后图像对应点的纵坐标,a11、a12…a32均为透视变换矩阵系数。
上述基于卷积循环神经网络的集装箱箱号识别方法中,在步骤(31)中,透视变换后的图像为:
Figure BDA0002415048120000042
其中,m为待检测集装箱图像,M为透视变换后的图像,
Figure BDA0002415048120000043
为透视变换矩阵。
本发明与现有技术相比具有如下有益效果:
本发明对神经网络结构和参数进行优化,具有更高的识别率和可靠性;对图像进行透视变换,提高不同角度安装摄像头应用该方法的鲁棒性。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例提供的基于卷积循环神经网络的集装箱箱号识别方法的流程图;
图2是本发明实施例提供的卷积神经网络的结构框架图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
图1是本发明实施例提供的基于卷积循环神经网络的集装箱箱号识别方法的流程图。如图1所示,该方法包括如下步骤:
步骤1:采集集装箱样本图像,根据集装箱样本图像构建循环卷积神经网络模型,对循环卷积神经网络模型训练后得到分类器;
步骤2:计算图像透视变换矩阵;
步骤3:利用步骤2得到的图像透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像;
步骤4:使用步骤1的分类器对透视变换后的图像进行字符识别得到字符识别结果;
步骤5:利用集装箱箱号规则对字符识别结果进行核对校验,输出最终的箱号检测结果。
第一部分:卷积循环神经网络模型训练的具体步骤为:
11)人工标注样本图像,样本训练集S={(x1,z1),(x2,z2),...(xN,zN)},表示有N个训练样本,x是输入样本,z是对应的真实字符;其中,x1为第一个样本,x2为第二个样本,xN为第N个样本,z1为第一个样本的标注结果,z2为第二个样本的标注结果,zN为第N个样本的标注结果,N为样本总数。
12)将样本图像缩放至高度32像素、宽度160像素;图像输入卷积神经网络,包括7层卷积层和4层最大池化,卷积神经网络如表1;卷积神经网络输出512个特征图,每个特征图高度为1,宽度为40;
表1
Figure BDA0002415048120000061
13)从步骤12)得到的特征图中提取特征向量,每个特征向量在特征图上按列从左到右生成,每一列包含512维特征,即第i个特征向量是所有特征图第i列像素的连接,共产生40个特征向量;如图2所示。
14)循环神经网络采用两层各256单元的双向LSTM(Long Short Term长短型网络),在LSTM的每个时间步传入一个特征向量,本发明共40个时间步,每个时间步输出所有可能字符的概率分布,这里输出40个长度为37(26个英文字母+10个阿拉伯数字+1个空字符,其中空字符用“-”表示)的向量,40个向量构成后验概率矩阵;如图2所示。
15)由后验概率矩阵计算损失函数,损失函数定义为概率的负最大似然函数,为方便计算,对似然函数取对数。
Figure BDA0002415048120000071
其中,O为损失函数,x为样本,l为可能的字符,S为样本集,p(l|x)表示后验概率矩阵中x为字符l的后验概率。
16)通过最小化损失函数的方法对卷积循环神经网络进行训练,达到设定的学习次数和精度时完成训练,得到分类器。达到设定的学习次数为学习次数>100000,达到的精度为精度<0.0001。
第二部分:计算图像透视变换的具体步骤为:
21)假设原始图像上一点的坐标为(x,y),(X,Y)为变换后图像上对应点坐标,透视变换公式为:
Figure BDA0002415048120000072
其中,
Figure BDA0002415048120000073
为透视变换矩阵,通常设a33=1,公式1可改写为
Figure BDA0002415048120000074
上式8个未知数需要4个点坐标即可求解;
22)在待检测集装箱图像中手动选取4个点,4个点构成的区域必须包含箱号区域,并在真实空间中尽量为矩形。4个点由左到右,由上到下坐标记为(x1,y1),(x2,y2),(x3,y3),(x4,y4);根据(x1,y1),(x2,y2),(x3,y3),(x4,y4)得到待变换后图像上对应点坐标(X1,Y1)、(X2,Y2)、(X3,Y3)、(X4,Y4);
23)将待变换后图像上对应点坐标(X1,Y1)、(X2,Y2)、(X3,Y3)、(X4,Y4)带入透视变换矩阵计算公式得到透视变换矩阵;
取(X1,Y1)=(min(x1,x3),min(y1,y2))(X2,Y2)=(max(x2,x4),Y1)(X3,Y3)=(X1,max(y3,y4))(X4,Y4)=(X2,Y3),带入公式(21-2)中可得到透视变换矩阵。
第三部分:利用步骤2得到的透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像的具体步骤为:
31)利用步骤23)中得到的透视变换矩阵,对待检测集装箱图像进行透视变换得到透视变换后的图像;
Figure BDA0002415048120000081
式中m为原始输入图像,M为透视变换后的图像;
32)将透视变换后的图像缩放至高度32像素、宽度160像素得到32*160的图像;
第四部分:字符识别的具体步骤为:
41)将32*160的图像输入步骤16)中训练好的分类器,分类器输出40个时间步的37种字符类别的概率分布;
42)每个时间步取最大概率的字符作为该时间步的输出字符,所有时间步的输出字符组成一个字符序列;
43)删除字符序列中连续重复字符,然后删除所有“-”字符,得到字符识别结果;
第五部分:利用集装箱箱号规则对字符识别结果进行核对校验,输出最终结果包括如下步骤:
51)集装箱箱号具备以下两条规则:a)前4位是大写英文字母,后7位是阿拉伯数字;b)集装箱箱号的第11位是校验字符,能够由前10位字符计算得出。
52)根据集装箱箱号规则对步骤43)中的字符识别结果进行校验,满足51)中两条规则时输出最终的箱号识别结果,否则认为识别错误,输出识别错误信号。
本发明对神经网络结构和参数进行优化,具有更高的识别率和可靠性;对图像进行透视变换,提高不同角度安装摄像头应用该方法的鲁棒性。
本发明虽然已以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以利用上述揭示的方法和技术内容对本发明技术方案做出可能的变动和修改,因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化及修饰,均属于本发明技术方案的保护范围。

Claims (10)

1.一种基于卷积循环神经网络的集装箱箱号识别方法,其特征在于,所述方法包括如下步骤:
步骤1:采集集装箱样本图像,根据集装箱样本图像构建循环卷积神经网络模型,对循环卷积神经网络模型训练后得到分类器;
步骤2:计算图像透视变换矩阵;
步骤3:利用步骤2得到的图像透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像;
步骤4:使用步骤1的分类器对透视变换后的图像进行字符识别得到字符识别结果;
步骤5:利用集装箱箱号规则对字符识别结果进行核对校验,输出最终的箱号检测结果。
2.根据权利要求1所述的基于卷积循环神经网络的集装箱箱号识别方法,其特征在于:在步骤1中,采集集装箱样本图像,根据集装箱样本图像构建循环卷积神经网络模型,对循环卷积神经网络模型训练后得到分类器包括如下步骤:
(11)采集集装箱样本图像;
(12)将集装箱样本图像缩放至高度32像素和宽度160像素的第二样本图像;将第二样本图像输入卷积神经网络,卷积神经网络输出512个特征图;
(13)从步骤(12)得到的特征图中提取特征向量;
(14)循环神经网络采用两层各256单元的双向长短型网络,在双向长短型网络的每个时间步传入一个特征向量,其中,时间步的数量为40个,每个时间步输出40个长度为37的向量,40个向量构成后验概率矩阵;
(15)由后验概率矩阵计算损失函数;
(16)通过损失函数对卷积循环神经网络进行训练,达到设定的学习次数>100000和精度<0.0001时完成训练,得到分类器。
3.根据权利要求2所述的基于卷积循环神经网络的集装箱箱号识别方法,其特征在于:在步骤2中,计算图像透视变换矩阵包括如下步骤:
(21)在待检测集装箱图像中选取4个点(x1,y1),(x2,y2),(x3,y3),(x4,y4),其中,4个点构成的区域包含箱号区域,并在真实空间中为矩形;
(22)根据(x1,y1),(x2,y2),(x3,y3),(x4,y4)得到待变换后图像上对应点坐标(X1,Y1)、(X2,Y2)、(X3,Y3)、(X4,Y4);
(23)将待变换后图像上对应点坐标(X1,Y1)、(X2,Y2)、(X3,Y3)、(X4,Y4)带入透视变换矩阵计算公式得到透视变换矩阵。
4.根据权利要求3所述的基于卷积循环神经网络的集装箱箱号识别方法,其特征在于:在步骤3中,利用步骤2得到的图像透视变换矩阵对待检测集装箱图像进行透视变换得到视变换后的图像包括如下步骤:
(31)根据步骤(23)中的透视变换矩阵对待检测集装箱图像进行透视变换得到透视变换后的图像;
(32)将透视变换后的图像缩放至高度32像素、宽度160像素得到32*160的图像。
5.根据权利要求4所述的基于卷积循环神经网络的集装箱箱号识别方法,其特征在于:在步骤4中,使用步骤1的分类器对透视变换后的图像进行字符识别得到字符识别结果包括如下步骤:
(41)将步骤(32)中的32*160的图像输入步骤(16)中训练好的分类器,分类器输出40个时间步的37种字符类别的概率分布;
(42)每个时间步取最大概率的字符作为该时间步的输出字符,所有时间步的输出字符组成一个字符序列;
(43)删除字符序列中连续重复字符,然后删除所有“-”字符,得到字符识别结果。
6.根据权利要求5所述的基于卷积循环神经网络的集装箱箱号识别方法,其特征在于:在步骤5中,利用集装箱箱号规则对字符识别结果进行核对校验,输出最终的箱号检测结果包括如下步骤:
根据集装箱箱号规则对步骤(43)中的字符识别结果进行校验,满足集装箱箱号规则时输出最终的箱号识别结果,否则认为识别错误,输出识别错误信号;其中,
集装箱箱号规则为:a)集装箱箱号的前4位是大写英文字母,集装箱箱号的后7位是阿拉伯数字;b)集装箱箱号的第11位是校验字符,能够由前10位字符计算得出。
7.根据权利要求2所述的基于卷积循环神经网络的集装箱箱号识别方法,其特征在于:在步骤(11)中,装箱样本图像的样本训练集为S={(x1,z1),(x2,z2),...(xN,zN)};其中,
x1为第一个样本,x2为第二个样本,xN为第N个样本,z1为第一个样本的标注结果,z2为第二个样本的标注结果,zN为第N个样本的标注结果,N为样本总数。
8.根据权利要求2所述的基于卷积循环神经网络的集装箱箱号识别方法,其特征在于:在步骤(15)中,损失函数为:
Figure FDA0002415048110000031
其中,O为损失函数,x为样本,l为可能的字符,S为样本集,p(l|x)表示后验概率矩阵中x为字符l的后验概率。
9.根据权利要求3所述的基于卷积循环神经网络的集装箱箱号识别方法,其特征在于:在步骤(22)中,(X1,Y1)=(min(x1,x3),min(y1,y2))(X2,Y2)=(max(x2,x4),Y1)(X3,Y3)=(X1,max(y3,y4))(X4,Y4)=(X2,Y3);
在步骤(23)中,透视变换矩阵计算公式为:
Figure FDA0002415048110000032
其中,x为透视变换前图像某点的横坐标,y为透视变换前图像某点的纵坐标,X为透视变换后图像对应点的横坐标,Y为透视变换后图像对应点的纵坐标,a11、a12…a32均为透视变换矩阵系数。
10.根据权利要求4所述的基于卷积循环神经网络的集装箱箱号识别方法,其特征在于:在步骤(31)中,透视变换后的图像为:
Figure FDA0002415048110000041
其中,m为待检测集装箱图像,M为透视变换后的图像,
Figure FDA0002415048110000042
为透视变换矩阵。
CN202010188543.6A 2020-03-17 2020-03-17 一种基于卷积循环神经网络的集装箱箱号识别方法 Active CN111414844B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010188543.6A CN111414844B (zh) 2020-03-17 2020-03-17 一种基于卷积循环神经网络的集装箱箱号识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010188543.6A CN111414844B (zh) 2020-03-17 2020-03-17 一种基于卷积循环神经网络的集装箱箱号识别方法

Publications (2)

Publication Number Publication Date
CN111414844A true CN111414844A (zh) 2020-07-14
CN111414844B CN111414844B (zh) 2023-08-29

Family

ID=71493006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010188543.6A Active CN111414844B (zh) 2020-03-17 2020-03-17 一种基于卷积循环神经网络的集装箱箱号识别方法

Country Status (1)

Country Link
CN (1) CN111414844B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268871A (zh) * 2018-02-01 2018-07-10 武汉大学 一种基于卷积神经网络的端到端的车牌识别方法和系统
US20180260951A1 (en) * 2017-03-08 2018-09-13 Siemens Healthcare Gmbh Deep Image-to-Image Recurrent Network with Shape Basis for Automatic Vertebra Labeling in Large-Scale 3D CT Volumes
CN108596166A (zh) * 2018-04-13 2018-09-28 华南师范大学 一种基于卷积神经网络分类的集装箱箱号识别方法
CN109086652A (zh) * 2018-06-04 2018-12-25 平安科技(深圳)有限公司 手写字模型训练方法、汉字识别方法、装置、设备及介质
CN109190625A (zh) * 2018-07-06 2019-01-11 同济大学 一种大角度透视变形的集装箱箱号识别方法
CN109543184A (zh) * 2018-11-20 2019-03-29 中国石油大学(华东) 一种基于深度学习的集装箱文本识别方法
CN109685100A (zh) * 2018-11-12 2019-04-26 平安科技(深圳)有限公司 字符识别方法、服务器及计算机可读存储介质
CN110210433A (zh) * 2019-06-10 2019-09-06 南京大学 一种基于深度学习的集装箱箱号检测与识别方法
CN110276881A (zh) * 2019-05-10 2019-09-24 广东工业大学 一种基于卷积循环神经网络的纸币序列号识别方法
CN110276253A (zh) * 2019-05-15 2019-09-24 中国科学院信息工程研究所 一种基于深度学习的模糊文字检测识别方法
CN110321755A (zh) * 2018-03-28 2019-10-11 中移(苏州)软件技术有限公司 一种识别方法及装置
CN110378332A (zh) * 2019-06-14 2019-10-25 上海咪啰信息科技有限公司 一种集装箱码头箱号和车号识别方法及系统
CN110516677A (zh) * 2019-08-23 2019-11-29 上海云绅智能科技有限公司 一种神经网络识别模型、目标识别方法及系统
CN110659634A (zh) * 2019-08-23 2020-01-07 上海撬动网络科技有限公司 一种基于颜色定位和字符分割的集装箱箱号定位方法
CN110852324A (zh) * 2019-08-23 2020-02-28 上海撬动网络科技有限公司 一种基于深度神经网络集装箱箱号检测方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180260951A1 (en) * 2017-03-08 2018-09-13 Siemens Healthcare Gmbh Deep Image-to-Image Recurrent Network with Shape Basis for Automatic Vertebra Labeling in Large-Scale 3D CT Volumes
CN108268871A (zh) * 2018-02-01 2018-07-10 武汉大学 一种基于卷积神经网络的端到端的车牌识别方法和系统
CN110321755A (zh) * 2018-03-28 2019-10-11 中移(苏州)软件技术有限公司 一种识别方法及装置
CN108596166A (zh) * 2018-04-13 2018-09-28 华南师范大学 一种基于卷积神经网络分类的集装箱箱号识别方法
CN109086652A (zh) * 2018-06-04 2018-12-25 平安科技(深圳)有限公司 手写字模型训练方法、汉字识别方法、装置、设备及介质
CN109190625A (zh) * 2018-07-06 2019-01-11 同济大学 一种大角度透视变形的集装箱箱号识别方法
CN109685100A (zh) * 2018-11-12 2019-04-26 平安科技(深圳)有限公司 字符识别方法、服务器及计算机可读存储介质
CN109543184A (zh) * 2018-11-20 2019-03-29 中国石油大学(华东) 一种基于深度学习的集装箱文本识别方法
CN110276881A (zh) * 2019-05-10 2019-09-24 广东工业大学 一种基于卷积循环神经网络的纸币序列号识别方法
CN110276253A (zh) * 2019-05-15 2019-09-24 中国科学院信息工程研究所 一种基于深度学习的模糊文字检测识别方法
CN110210433A (zh) * 2019-06-10 2019-09-06 南京大学 一种基于深度学习的集装箱箱号检测与识别方法
CN110378332A (zh) * 2019-06-14 2019-10-25 上海咪啰信息科技有限公司 一种集装箱码头箱号和车号识别方法及系统
CN110516677A (zh) * 2019-08-23 2019-11-29 上海云绅智能科技有限公司 一种神经网络识别模型、目标识别方法及系统
CN110659634A (zh) * 2019-08-23 2020-01-07 上海撬动网络科技有限公司 一种基于颜色定位和字符分割的集装箱箱号定位方法
CN110852324A (zh) * 2019-08-23 2020-02-28 上海撬动网络科技有限公司 一种基于深度神经网络集装箱箱号检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘易: "基于神经网络的集装箱箱号识别系统", pages 9 - 47 *

Also Published As

Publication number Publication date
CN111414844B (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
CN111723860B (zh) 一种目标检测方法及装置
CN110427937B (zh) 一种基于深度学习的倾斜车牌矫正和不定长车牌识别方法
CN108229509B (zh) 用于识别物体类别的方法及装置、电子设备
WO2020221298A1 (zh) 文本检测模型训练方法、文本区域、内容确定方法和装置
CN109829437B (zh) 图像处理方法、文本识别方法、装置和电子系统
CN112232241B (zh) 一种行人重识别方法、装置、电子设备和可读存储介质
CN111401361B (zh) 一种端到端的轻量级深度车牌识别方法
CN114202672A (zh) 一种基于注意力机制的小目标检测方法
CN108921057B (zh) 基于卷积神经网络的对虾形态测量方法、介质、终端设备及装置
CN111598089B (zh) 一种基于深度学习的车牌矫正与识别方法
CN111259940A (zh) 一种基于空间注意力地图的目标检测方法
CN111914642B (zh) 一种行人重识别方法、装置、设备及介质
CN111046858B (zh) 一种基于图像的动物物种细分类方法、系统及介质
CN112001403B (zh) 一种图像轮廓检测方法及系统
CN110287873A (zh) 基于深度神经网络的非合作目标位姿测量方法、系统及终端设备
CN110245545A (zh) 一种文字识别方法及装置
CN112465801B (zh) 一种分尺度提取掩码特征的实例分割方法
CN114693661A (zh) 一种基于深度学习的快速分拣方法
CN113011253B (zh) 基于ResNeXt网络的人脸表情识别方法、装置、设备及存储介质
CN111539456B (zh) 一种目标识别方法及设备
CN110659637A (zh) 一种结合深度神经网络和sift特征的电能表示数与标签自动识别方法
CN113378812A (zh) 一种基于Mask R-CNN和CRNN的数字表盘识别方法
CN115082922A (zh) 基于深度学习的水表数字图片处理方法及系统
CN111339869A (zh) 一种人脸识别方法、装置、计算机可读存储介质及设备
CN112070181B (zh) 一种基于图像流的协同检测方法及装置、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant