CN110942073A - 一种集装箱拖车编号识别方法、装置和计算机设备 - Google Patents
一种集装箱拖车编号识别方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN110942073A CN110942073A CN201811113618.3A CN201811113618A CN110942073A CN 110942073 A CN110942073 A CN 110942073A CN 201811113618 A CN201811113618 A CN 201811113618A CN 110942073 A CN110942073 A CN 110942073A
- Authority
- CN
- China
- Prior art keywords
- trailer
- result
- image
- trailer number
- decoding result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Abstract
本申请提供一种集装箱拖车编号识别方法、装置和计算机设备。本申请提供的集装箱拖车编号识别方法,包括:从包含集装箱拖车的待识别图像中定位拖车编号所在的目标区域;对所述目标区域进行特征提取,得到特征图;将所述特征图输入到预先训练好的拖车编号识别模型中,以由所述拖车编号识别模型对所述特征图进行序列化,得到特征序列,并对所述特征序列进行编码处理,得到编码结果,以及对所述编码结果进行解码后输出解码结果;根据解码结果确定待识别图像中的拖车编号。本申请提供的集装箱拖车编号识别方法、装置和计算机设备,不需要对拖车编号所在的区域进行字符分割,即可基于整个拖车编号所在的区域识别出拖车编号,识别准确率较高。
Description
技术领域
本申请涉及智能交通领域,尤其涉及一种集装箱拖车编号识别方法、装置和计算机设备。
背景技术
在港口作业中,通常为每个集装箱拖车分配一个拖车编号,以通过该拖车编号标识各个集装箱拖车,进而实时记录各个集装箱拖车的状态,以对各个集装箱拖车进行有效的管理。近年来,为降低人工抄录错误,降低人工成本,常通过自动识别技术识别集装箱拖车的拖车编号,进而基于识别出的拖车编号记录该集装箱拖车的状态。
相关技术公开了一种集装箱拖车编号的识别方法,该方法包括:从待识别图像中定位拖车车头区域;对拖车车头区域进行字符分割;分别对分割得到的多个字符进行识别;组合多个识别结果,得到拖车编号。
当采用上述方法识别拖车编号时,需要对拖车车头区域进行字符分割,依赖性强,在光线差、污损、倾斜大等情况下存在字符分割不准确的问题,进而存在因字符分割不准确导致的识别准确率低的问题。
发明内容
有鉴于此,本申请提供一种集装箱拖车编号识别方法、装置和计算机设备,以准确的识别集装箱拖车的拖车编号。
本申请第一方面提供一种集装箱拖车编号识别方法,包括:
从包含集装箱拖车的待识别图像中定位拖车编号所在的目标区域;
对所述目标区域进行特征提取,得到特征图;
将所述特征图输入到预先训练好的拖车编号识别模型中,以由所述拖车编号识别模型对所述特征图进行序列化,得到特征序列,并对所述特征序列进行编码处理,得到编码结果,以及对所述编码结果进行解码后输出解码结果;
根据解码结果确定待识别图像中的拖车编号。
本申请第二方面提供一种集装箱拖车编号识别装置,所述装置包括检测模块、提取模块、识别模块和处理模块,其中,
所述检测模块,用于从包含集装箱拖车的待识别图像中定位拖车编号所在的目标区域;
所述提取模块,用于对所述目标区域进行特征提取,得到特征图;
所述识别模块,用于将所述特征图输入到预先训练好的拖车编号识别模型中,由所述拖车编号识别模型对所述特征图进行序列化,得到特征序列,并对所述特征序列进行编码处理,得到编码结果,以及对所述编码结果进行解码后输出解码结果;
所述处理模块,用于根据解码结果确定待识别图像中的拖车编号。
本申请第三方面提供一种计算可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本申请第一方面提供的任一项所述方法的步骤。
本申请第四方面提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请第一方面提供的任一项所述方法的步骤。
本申请提供的集装箱拖车编号识别方法、装置和计算机设备,通过从包含集装箱拖车的待识别图像中定位拖车编号所在的目标区域,并对所述目标区域进行特征提取,得到特征图,进而将所述特征图输入到预先训练好的拖车编号识别模型中,由所述拖车编号识别模型对所述特征图进行序列化,得到特征序列,并对所述特征序列进行编码处理,得到编码结果,以及对所述编码结果进行解码后输出解码结果,从而根据解码结果确定待识别图像中的拖车编号。这样,无需进行字符分割,即可基于整个拖车编号所在的区域识别出拖车编号,识别准确率较高。
附图说明
图1为本申请提供的集装箱拖车编号识别方法实施例一的流程图;
图2为本申请一示例性实施例示出的集装箱拖车的示意图;
图3为本申请一示例性实施例示出的对特征图进行序列化的实现原理图;
图4为本申请一示例性实施例示出的注意力模型的示意图;
图5为本申请一示例性示出的根据解码结果确定待识别图像中的拖车编号的流程图;
图6为本申请一示例性实施例示出的集装箱拖车编号识别方法的流程图;
图7为图6所示方法的实现原理图;
图8为本申请一示例性实施例示出的集装箱拖车编号识别装置所在计算机设备的硬件结构图;
图9为本申请提供的集装箱拖车编号识别装置实施例一的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本申请提供一种集装箱拖车编号识别方法、装置和计算机设备,以准确的识别集装箱拖车的拖车编号。
本申请提供的集装箱拖车编号识别方法和装置,可应用于计算机设备中,例如,可应用于摄像设备中,再例如,可应用于服务器中,本申请中,不对此作出限定。
下面给出几个具体的实施例,用以详细介绍本申请的技术方案,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图1为本申请提供的集装箱拖车编号识别方法实施例一的流程图。请参照图1,本实施例提供的方法,可以包括:
S101、从包含集装箱拖车的待识别图像中定位拖车编号所在的目标区域。
图2为本申请一示例性实施例示出的集装箱拖车的示意图。参照图2,拖车编号位于集装箱拖车的车头,其中,A图中,该集装箱拖车的拖车编号为0886;相应的,B图中,该集装箱拖车的拖车编号为0516。
具体的,可采用传统的方法或基于深度学习的方法从待识别图像中定位拖车编号所在的目标区域。本实施例中,不对此作出限定。例如,可采用神经网络从待识别图像中定位拖车编号所在的目标区域。
需要说明的是,通过神经网络从待识别图像中定位拖车编号所在的目标区域有两种具体的实现方法,这两种具体的实现方法分别为:
(1)候选框法
该方法的实现原理为:按照预设规则在待识别图像中划出多个候选框;对所有候选框进行特征提取;然后对提取到的特征进行分类(即对提取到的特征进行文本、非文本的二分类),根据分类结果,得到文本区域,即得到拖车编号所在的目标区域。
例如,在整个图像中以一种规律划出大量候选框,对所有候选框使用“卷积神经网络(CNN)”和/或“循环神经网络(RNN)”进行特征提取。然后对提取到的特征进行文本/非文本的分类(同时这些特征可以对候选框的位置和形状进行更精准的回归和矫正)。根据候选框的分类置信度进行处理,最终得到所有文本区域。
(2)图像分割法
该方法的实现原理为:对待识别图像进行特征提取,然后对提取到的特征进行像素级分割,最后对分割后的每个区域进行分类,得到文本区域,即得到拖车编号所在的目标区域。
例如,对整个图像使用“卷积神经网络(CNN)”和/或“循环神经网络(RNN)”进行特征提取。然后对提取到的特征进行像素级分割和分类(对每个像素点/小块进行分类),得到文本区域。
可选地,在本申请一可能的实现过程中,该步骤的具体实现过程可以包括:
将所述待识别图像输入到YOLO(You Only Look Once,简称YOLO)模型中,由所述YOLO模型对所述待识别图像进行卷积处理和池化处理后输出拖车编号所在的目标区域。
具体的,该YOLO模型由卷积层和池化层组成。此外,有关该YOLO模型的具体结构及利用其进行目标检测的具体实现原理可以参见相关技术中的描述。此处不再赘述。
S102、对上述目标区域进行特征提取,得到特征图。
具体的,可以采用传统的方法对目标区域进行特征提取。例如,采用尺度不变特征转换SIFI算法(Scale-invariant Feature Transform,简称SIFT)对目标区域进行特征提取。当然,也可利用神经网络对目标区域进行特征提取,例如,一实施例中,该步骤的具体实现过程,可以包括:
将上述目标区域输入到用于进行特征提取的神经网络,由该神经网络中的指定层对上述目标区域进行特征提取;所述指定层包括卷积层,或者是,所述指定层包括卷积层,以及池化层和全连接层中的至少一个;将所述指定层的输出结果确定为所述特征图。
具体的,该用于进行特征提取的神经网络可以包括卷积层,该卷积层用于对输入的目标区域进行滤波处理。进一步地,此时,该卷积层输出的滤波处理结果即为提取到特征图。此外,该用于进行特征提取的神经网络还可以包括池化层和/或全连接层。例如,一实施例中,该用于进行特征提取的神经网络包括卷积层、池化层和全连接层,其中,卷积层,用于对输入的目标区域进行滤波处理;池化层,用于对滤波处理结果进行压缩处理;全连接层,用于对压缩处理结果进行聚合处理。进一步地,此时,该全连接层输出的聚合处理结果即为提取到的特征图。
S103、将上述特征图输入到预先训练好的拖车编号识别模型中,由上述拖车编号识别模型对上述特征图进行序列化,得到特征序列,并对上述特征序列进行编码处理,得到编码结果,以及对上述编码结果进行解码后输出解码结果。
具体的,图3为本申请一示例性实施例示出的对特征图进行序列化的实现原理图。请参照图3,对特征图进行序列化的过程,可以包括:
(1)按照预设移动步长将预设滑窗在上述特征图上滑动,以分割出上述滑窗所在位置的局部特征图;
(2)将分割出的所有局部特征图确定为上述特征序列。
具体的,一实施例中,该拖车编号识别模型可以为注意力模型,该注意力模型包括卷积网络,步骤(1)可通过卷积网络实现。
此外,预设滑窗的尺寸大小适配于上述特征图。例如,当上述特征图的维度为A*B*C时(其中,A和B分别为特征图的宽和高,C为特征图包含的通道数)。此时,可将滑窗的尺寸大小设置为A×A。此外,预设移动步长是根据实际需要设定的,本实施例中,不对此作出限定。例如,一实施例中,预设移动步长为2。
进一步地,参照图3,具体实现时,可将预设滑窗置于特征图的一端,分割出该滑窗所在位置的局部特征图,进而基于预设移动步长移动该滑窗,并分割出移动后的滑窗所在位置的局部特征图。这样,一直重复这个过程,直到滑窗移动至特征图的另一端。最后,将分割出的所有局部特征图确定为特征序列。
结合上面的例子,当预设移动步长为Z时,此时,分割出的局部特征图的数量为a,其中,a=(B-A)/Z+1。
需要指出的是,利用预设滑窗和预设移动步长分割特征图时,若最终剩余部分无法被滑窗覆盖,此时,可对特征图进行填充。此外,由于上述特征图包括多个通道,因此,分割出的每个局部特征图也包括多个通道。
进一步地,图4为本申请一示例性实施例示出的注意力模型的示意图。请参照图4,该注意力模型还包括依序连接的输入层、隐层和输出层,其中,X(X1、X2、X3、X4……、Xm)表示输入到输入层的特征序列;αt,1、αt,2、αt,3、αt,3……αt,m表示t时刻特征序列中各特征的权重参数(每个特征的权重参数的维度与该特征的维度相同);Ct表示t时刻的编码结果;St-1、St表示各个时刻上下文相关的隐层状态(初始时刻,隐层状态为0);yt-1、yt表示各个时刻的解码结果。本例中,各个时刻的解码结果可以包括该时刻各个候选号码(候选号码为输出层(该输出层由分类器构成)中的预设类别,本例中,包括10类,0-9和一个结束符(例如,该结束符可以为+))的置信度,以及该时刻识别出的号码(识别出的号码为各个候选号码中置信度最大的候选号码)。
参照图4,下面详细介绍一下对特征序列进行编码处理,得到编码结果,以及对编码结果进行解码后输出解码结果的具体实现过程,该过程可以包括:
(1)输入层计算各个时刻所述特征序列中各特征的权值参数。
具体的,该步骤可通过输入层实现。此外,可按照第一公式计算各个时刻特征序列中各特征的权值参数,上述第一公式为:
其中,αt,i为t时刻特征序列中第i个特征的权重参数;
Xi为特征序列中的第i个特征;
st-1为t-1时刻的隐层状态;
W和U为注意力模型的模型参数。
(2)隐层依据各个时刻上述特征序列中各特征的权值参数和上述特征序列,计算各个时刻的编码结果。
具体的,该步骤可通过隐层实现。此外,该步骤的实现过程,可以包括:利用各个时刻特征序列中各特征的权值参数对特征序列进行加权求和处理,并将得到的加权和确定为该时刻的编码结果。
参见前面的介绍,该过程可用第二公式表示,该第二公式为:
其中,Ct为t时刻的编码结果。
(3)隐层依据上述特征序列和各个时刻的编码结果,计算各个时刻上下文相关的隐层状态。
具体的,该步骤通过隐层实现。此外,可按照第三公式计算各个时刻上下文相关的隐层状态,该第三公式为:
st=LSTM(st-1,ct,yt-1)
需要说明的是,t时刻的隐层状态与t-1时刻的隐层状态、t时刻的解码结果,以及t-1时刻该注意力模型输出的解码结果有关。
(4)输出层依据各个时刻上下文相关的隐层状态,得到各个时刻的解码结果。
具体的,该步骤通过输出层实现。此外,可通过第四公式计算各个时刻的解码结果,该第四公式为:
yt=softmax(st)
具体的,各个时刻的解码结果包括该时刻各个候选号码的置信度,以及该时刻识别出的号码。需要说明的是,该时刻识别出的号码为各个候选号码中置信度最大的候选号码。
本实施例提供的方法,利用注意力模型对拖车编号所在的目标区域进行识别,这样,不需要进行字符识别,即可基于该目标区域识别出拖车编号,准确率较高。
S104、根据上述解码结果确定待识别图像中的拖车编号。
具体的,一实施例中,可直接将解码结果中识别出的各个号码依序组合,并将组合结果确定为拖车编号。
本实施例提供的方法,通过从包含集装箱拖车的待识别图像中定位拖车编号所在的目标区域,并对所述目标区域进行特征提取,得到特征图,进而将所述特征图输入到预先训练好的拖车编号识别模型中,以由所述拖车编号识别模型对所述特征图进行序列化,得到特征序列,并对所述特征序列进行编码处理,得到编码结果,以及对所述编码结果进行解码后输出解码结果,从而根据解码结果确定待识别图像中的拖车编号。这样,无需进行字符分割,即可基于整个拖车编号所在的区域识别出拖车编号,识别准确率较高。
此外,本申请提供的方法,在不需要增加人工标注的情况下,可对旋转拖车编号进行识别,适用性较广。
需要说明的是,除了注意力模型之外,本申请的上述步骤103还可替换为以下步骤:
(1)使用卷积神经网络(CNN)对目标区域进行特征提取。
(2)使用循环神经网络(RNN)进行上下文相关的特征隐层建模。
(3)使用分类器和序列解码器(如卷积层或CTC),完成特征序列与字符串结果的转换,输出拖车编号识别结果。
图5为本申请一示例性示出的根据解码结果确定待识别图像中的拖车编号的流程图。请参照图5,本实施例提供的方法,在上述实施例的基础上,步骤S104,可以包括:
S501、判断上述解码结果是否满足指定校验规则。
具体的,根据拖车编号的特性可知,拖车编号为4位,且拖车编号中的第4位为校验码,其他三位的和值与10进行取模运算后得到的取模运算结果等于第四位的校验码。因此,该指定效验规则可以为:解码结果中识别出的各个号码中前三个号码的和值与10进行取模运算后得到的取模运算结果等于第四个号码。
具体的,该步骤的实现过程,可以包括:
(1)计算上述解码结果中识别出的各个号码中除校验码之外的其他号码的和值;
(2)将所述和值与10进行取模运算,得到取模运算结果;
(3)判断所述取模运算结果是否等于所述校验码;
(4)若是,确定所述解码结果满足指定的校验规则。
例如,一实施例中,待识别图像为图2中的A图,解码结果中识别出的各个号码为0786,此时,经判断,前三个号码的和值为15,15与10进行取模运算后,得到的取模运算结果为5,此时,确定取模运算结果不等于校验码(本例中,校验码为6),确定解码结果不满足指定的校验规则。再例如,另一实施例中,待识别图像为图2中的B图,解码结果为0516,此时,经判断,前三个号码的和值为6,6与10进行取模运算后,得到的取模运算结果为6,此时,确定取模运算结果等于校验码(本例中,校验码为6),确定解码结果满足指定的校验规则。
S502、若是,将上述解码结果中识别出的各个依序组合,并将组合结果确定为上述待识别图像中的拖车编号。
具体的,当确定解码结果满足校验规则时,说明解码结果准确,此时,直接将解码结果中识别出的各个号码依序组合后的组合结果确定为待识别图像中的拖车编号。参见前面的第二个例子,此时,就确定待识别图像中的拖车编号为0516。
S503、若否,修改上述解码结果中识别出的各个号码中置信度最低的号码,得到修改后的解码结果;其中,上述修改后的解码结果满足上述校验规则。
结合前面的第一个例子,例如,解码结果中,识别出的各个号码的置信度分别为:80%、70%、90%、80%,此时,就修改第二个号码,以使修改后的解码结果满足上述校验规则。本例中,就将第二个号码修改为8,以使修改后的编码结果满足上述校验规则。
S504、将上述修改后的解码结果中的各个号码依序组合后的组合结果确定为上述待识别图像中的拖车编号。
结合上面的介绍,在第一个例子中,经步骤S503后,修改后的解码结果为0886,本步骤中,就确定图A中的拖车编号为0886。
本实施提供的方法,通过判断解码结果是否满足指定校验规则,进而在解码结果满足指定校验规则时,将解码结果中识别出的各个号码依序组合后的组合结果确定为待识别图像中的拖车编号,而在解码结果不满足上述指定校验规则时,修改解码结果中识别出的各个号码中置信度最低的号码,得到修改后的解码结果,并将修改后的解码结果中的各个号码依序组合后的组合结果确定为待识别图像中的拖车编号。其中,修改后的解码结果满足所述校验规则。这样,可进一步提高识别出的拖车编号的准确性。
下面给出一个更具体的例子,用以详细介绍本申请提供的技术方案:
图6为本申请一示例性实施例示出的集装箱拖车编号识别方法的流程图;图7为图6所示方法的实现原理图。请同时参照图6和图7,本实施例提供的方法,可以包括:
S601、将待识别图像输入到YOLO模型,由上述YOLO模型对上述待识别图像进行卷积处理和池化处理后输出拖车编号所在的目标区域。
S602、将上述目标区域输入到用于进行特征提取的神经网络,由该神经网络对上述目标区域进行特征提取后输出特征图。
S602、将上述特征图输入到预先训练好的注意力模型中,由上述注意力模型对上述特征图进行序列化,得到特征序列,并对上述特征序列进行编码处理,得到编码结果,以及对上述编码结果进行解码后输出解码结果。
具体的,有关步骤S601至S603的具体实现过程和实现原理可以参见前面实施例中的描述,此处不再赘述。参照图7,本例中,输出的解码结果为0876。需要说明的是,解码结果包括各个时刻各个候选号码的置信度(图7中,未示出各个时刻各个候选号码的置信度),以及该时刻识别出的号码(各个候选号码中置信度最大的候选号码)。本例中,第一个时刻识别出的号码为0,……,第4个时刻识别出的号码为6。
S603、判断上述解码结果是否满足指定校验规则,若是,执行步骤S604,若否,执行步骤S605、
具体的,步骤S603至S606可以通过图7中的处理模块执行。结合上面的例子,本例中,经判断,确定解码结果不满足指定的校验规则。
S604、将上述解码结果中识别出的各个号码依序组合后的组合结果确定为上述待识别图像中的拖车编号。
S605、修改上述解码结果中识别出的各个号码中置信度最低的号码,得到修改后的解码结果;其中,上述修改后的解码结果满足上述校验规则。
此时,就将第3个号码修改为8,以使修改后的解码结果满足上述校验规则。
S606、将上述修改后的解码结果中的各个号码依序组合后的组合结果确定为上述待识别图像中的拖车编号。
结合上面的例子,本步骤中,就确定待识别图像中的拖车编号为0886。
本实施例提供的方法,可通过注意力模型直接对拖车编号所在的目标区域进行识别输出解码结果,进而对解码结果进行校验,得到待识别图像中的拖车编号。可准确的识别出待识别图像中的拖车编号。
与前述集装箱拖车编号识别方法的实施例相对应,本申请还提供了集装箱拖车编号识别装置的实施例。
本申请集装箱拖车编号识别装置的实施例可以应用在计算机设备上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在计算机设备的处理器将存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图8所示,为本申请一示例性实施例示出的集装箱拖车编号识别装置所在计算机设备的硬件结构图,除了图8所示的存储器810、处理器820和内存830之外,实施例中装置所在的计算机设备通常根据该集装箱拖车编号的实际功能,还可以包括其他硬件,对此不再赘述。
图9为本申请提供的集装箱拖车编号识别装置实施例一的结构示意图。请参照图9,本实施例提供的集装箱拖车编号识别装置,可以包括检测模块910、提取模块920、识别模块930和处理模块940,其中,
所述检测模块910,用于从包含集装箱拖车的待识别图像中定位拖车编号所在的目标区域;
所述提取模块920,用于对所述目标区域进行特征提取,得到特征图;
所述识别模块930,用于将所述特征图输入到预先训练好的拖车编号识别模型中,由所述拖车编号识别模型对所述特征图进行序列化,得到特征序列,并对所述特征序列进行编码处理,得到编码结果,以及对所述编码结果进行解码后输出解码结果;
所述处理模块940,用于根据解码结果确定待识别图像中的拖车编号。
本实施例的装置,可用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
进一步地,所述检测模块910,用于将所述待识别图像输入到YOLO模型中,由所述YOLO模型对所述待识别图像进行卷积处理和池化处理后输出拖车编号所在的目标区域。
进一步地,所述处理模块940,具体用于:
判断所述解码结果是否满足指定校验规则;
若是,将所述解码结果中识别出的各个号码依序组合后的组合结果确定为所述待识别图像中的拖车编号;
若否,修改所述解码结果中识别出的各个号码中置信度最低的号码,得到修改后的解码结果;其中,所述修改后的解码结果满足所述校验规则;
将所述修改后的解码结果中的各个号码依序组合后的组合结果确定为所述待识别图像中的拖车编号。
进一步地,所述处理模块940,具体用于:
计算所述解码结果中识别出的各个号码中除校验码之外的其他号码的和值;
将所述和值与10进行取模运算,得到取模运算结果;
判断所述取模运算结果是否等于所述校验码;
若是,确定所述解码结果满足指定的校验规则。
进一步地,所述拖车编号识别模型为注意力模型,所述注意力模型包括卷积网络,所述对所述特征图进行序列化,得到特征序列,包括:
所述卷积网络按照预设移动步长将预设滑窗在所述特征图上滑动,以分割出所述滑窗所在位置的局部特征图;
将分割出的所有局部特征图确定为所述特征序列。
进一步地,所述注意力模型还包括依次连接的输入层、隐层和输出层,所述对所述特征序列进行编码处理,得到编码结果,以及对所述编码结果进行解码输出解码结果,包括:
所述输入层计算各个时刻所述特征序列中各特征的权值参数;
所述隐层依据各个时刻所述特征序列中各特征的权值参数和所述特征序列,计算各个时刻的编码结果;
所述隐层依据所述特征序列和各个时刻的编码结果,计算各个时刻上下文相关的隐层状态;
所述输出层依据各个时刻上下文相关的隐层状态,得到各个时刻的解码结果。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本申请第一方面提供的任一项所述方法的步骤。
具体的,适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、媒介和存储器设备,例如包括半导体存储器设备(例如EPROM、EEPROM和闪存设备)、磁盘(例如内部硬盘或可移动盘)、磁光盘以及CD ROM和DVD-ROM盘。
请继续参照图8,本申请还提供一种计算机设备,包括存储器810、处理器820及存储在存储器810上并可在处理器820上运行的计算机程序,所述处理器820执行所述程序时实现本申请第一方面提供的任一项所述方法的步骤。
具体的,该计算机设备可以是摄像设备,或者是服务器等。本实施例中,不对计算机设备的具体形式进行限定。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (10)
1.一种集装箱拖车编号识别方法,其特征在于,所述方法包括:
从包含集装箱拖车的待识别图像中定位拖车编号所在的目标区域;
对所述目标区域进行特征提取,得到特征图;
将所述特征图输入到预先训练好的拖车编号识别模型中,由所述拖车编号识别模型对所述特征图进行序列化,得到特征序列,并对所述特征序列进行编码处理,得到编码结果,以及对所述编码结果进行解码后输出解码结果;
根据所述解码结果确定待识别图像中的拖车编号。
2.根据权利要求1所述的方法,其特征在于,所述从包含集装箱拖车的待识别图像中定位拖车编号所在的目标区域,包括:
将所述待识别图像输入到YOLO模型中,由所述YOLO模型对所述待识别图像进行卷积处理和池化处理后输出拖车编号所在的目标区域。
3.根据权利要求1所述的方法,其特征在于,所述拖车编号识别模型为注意力模型,所述注意力模型包括卷积网络,所述对所述特征图进行序列化,得到特征序列,包括:
所述卷积网络按照预设移动步长将预设滑窗在所述特征图上滑动,以分割出所述滑窗所在位置的局部特征图;
将分割出的所有局部特征图确定为所述特征序列。
4.根据权利要求1所述的方法,其特征在于,所述根据解码结果确定待识别图像中的拖车编号,包括:
判断所述解码结果是否满足指定校验规则;
若是,将所述解码结果中识别出的各个号码依序组合后的组合结果确定为所述待识别图像中的拖车编号;
若否,修改所述解码结果中识别出的各个号码中置信度最低的号码,得到修改后的解码结果;其中,所述修改后的解码结果满足所述校验规则;
将所述修改后的解码结果中的各个号码依序组合后的组合结果确定为所述待识别图像中的拖车编号。
5.根据权利要求4所述的方法,其特征在于,所述判断所述解码结果是否满足指定的校验规则,包括:
计算所述解码结果中识别出的各个号码中除校验码之外的其他号码的和值;
将所述和值与10进行取模运算,得到取模运算结果;
判断所述取模运算结果是否等于所述校验码;
若是,确定所述解码结果满足指定的校验规则。
6.根据权利要求3所述的方法,其特征在于,所述注意力模型还包括依次连接的输入层、隐层和输出层,所述对所述特征序列进行编码处理,得到编码结果,以及对所述编码结果进行解码后输出解码结果,包括:
所述输入层计算各个时刻所述特征序列中各特征的权值参数;
所述隐层依据各个时刻所述特征序列中各特征的权值参数和所述特征序列,计算各个时刻的编码结果;
所述隐层依据所述特征序列和各个时刻的编码结果,计算各个时刻上下文相关的隐层状态;
所述输出层依据各个时刻上下文相关的隐层状态,得到各个时刻的解码结果。
7.一种集装箱拖车编号识别装置,其特征在于,所述装置包括检测模块、提取模块、识别模块和处理模块,其中,
所述检测模块,用于从包含集装箱拖车的待识别图像中定位拖车编号所在的目标区域;
所述提取模块,用于对所述目标区域进行特征提取,得到特征图;
所述识别模块,用于将所述特征图输入到预先训练好的拖车编号识别模型中,由所述拖车编号识别模型对所述特征图进行序列化,得到特征序列,并对所述特征序列进行编码处理,得到编码结果,以及对所述编码结果进行解码后输出解码结果;
所述处理模块,用于根据解码结果确定待识别图像中的拖车编号。
8.根据权利要求7所述的装置,其特征在于,所述检测模块,用于将所述待识别图像输入到YOLO模型中,由所述YOLO模型对所述待识别图像进行卷积处理和池化处理后输出拖车编号所在的目标区域。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1-6任一项所述方法的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-6任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811113618.3A CN110942073A (zh) | 2018-09-25 | 2018-09-25 | 一种集装箱拖车编号识别方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811113618.3A CN110942073A (zh) | 2018-09-25 | 2018-09-25 | 一种集装箱拖车编号识别方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110942073A true CN110942073A (zh) | 2020-03-31 |
Family
ID=69905626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811113618.3A Pending CN110942073A (zh) | 2018-09-25 | 2018-09-25 | 一种集装箱拖车编号识别方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110942073A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111873035A (zh) * | 2020-06-11 | 2020-11-03 | 广州黑格智造信息科技有限公司 | 一种切割方法及切割系统 |
CN111898411A (zh) * | 2020-06-16 | 2020-11-06 | 华南理工大学 | 文本图像标注系统、方法、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107527059A (zh) * | 2017-08-07 | 2017-12-29 | 北京小米移动软件有限公司 | 文字识别方法、装置及终端 |
CN107679531A (zh) * | 2017-06-23 | 2018-02-09 | 平安科技(深圳)有限公司 | 基于深度学习的车牌识别方法、装置、设备及存储介质 |
CN107798327A (zh) * | 2017-10-31 | 2018-03-13 | 北京小米移动软件有限公司 | 字符识别方法及装置 |
CN108009543A (zh) * | 2017-11-29 | 2018-05-08 | 深圳市华尊科技股份有限公司 | 一种车牌识别方法及装置 |
-
2018
- 2018-09-25 CN CN201811113618.3A patent/CN110942073A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679531A (zh) * | 2017-06-23 | 2018-02-09 | 平安科技(深圳)有限公司 | 基于深度学习的车牌识别方法、装置、设备及存储介质 |
CN107527059A (zh) * | 2017-08-07 | 2017-12-29 | 北京小米移动软件有限公司 | 文字识别方法、装置及终端 |
CN107798327A (zh) * | 2017-10-31 | 2018-03-13 | 北京小米移动软件有限公司 | 字符识别方法及装置 |
CN108009543A (zh) * | 2017-11-29 | 2018-05-08 | 深圳市华尊科技股份有限公司 | 一种车牌识别方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111873035A (zh) * | 2020-06-11 | 2020-11-03 | 广州黑格智造信息科技有限公司 | 一种切割方法及切割系统 |
CN111898411A (zh) * | 2020-06-16 | 2020-11-06 | 华南理工大学 | 文本图像标注系统、方法、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109934293B (zh) | 图像识别方法、装置、介质及混淆感知卷积神经网络 | |
CN110874564B (zh) | 分类车线后补像素检测车线的方法及装置 | |
KR102328734B1 (ko) | 이미지를 분석하기 위해, 딥러닝 네트워크에 이용하기 위한 트레이닝 이미지에 대한 라벨링 신뢰도를 자동으로 평가하기 위한 방법 및 이를 이용한 신뢰도 평가 장치 | |
CN111639646A (zh) | 一种基于深度学习的试卷手写英文字符识别方法及系统 | |
CN111046859B (zh) | 字符识别方法及装置 | |
EP3686779A1 (en) | Method and device for attention-based lane detection without post-processing by using lane mask and testing method and testing device using the same | |
US10262214B1 (en) | Learning method, learning device for detecting lane by using CNN and testing method, testing device using the same | |
US20210081695A1 (en) | Image processing method, apparatus, electronic device and computer readable storage medium | |
CN105574550A (zh) | 一种车辆识别方法及装置 | |
CN110942057A (zh) | 一种集装箱箱号识别方法、装置和计算机设备 | |
CN110909618B (zh) | 一种宠物身份的识别方法及装置 | |
CN111797829A (zh) | 一种车牌检测方法、装置、电子设备和存储介质 | |
CN111353549B (zh) | 图像标签的核验方法及装置、电子设备、存储介质 | |
CN110956169A (zh) | 一种车牌识别方法、装置及电子设备 | |
EP3620958A1 (en) | Learning method, learning device for detecting lane through lane model and testing method, testing device using the same | |
CN106780727B (zh) | 一种车头检测模型重建方法及装置 | |
CN111488879A (zh) | 利用双嵌入构成的用于提高分割性能的方法及装置 | |
CN110956081A (zh) | 车辆与交通标线位置关系的识别方法、装置及存储介质 | |
CN111027555B (zh) | 一种车牌识别方法、装置及电子设备 | |
CN106203373B (zh) | 一种基于深度视觉词袋模型的人脸活体检测方法 | |
CN111027347A (zh) | 一种视频识别方法、装置和计算机设备 | |
CN114842343A (zh) | 一种基于ViT的航空图像识别方法 | |
CN116740758A (zh) | 一种防止误判的鸟类图像识别方法及系统 | |
CN110942073A (zh) | 一种集装箱拖车编号识别方法、装置和计算机设备 | |
CN111914845A (zh) | 一种车牌中字符分层方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |