CN114648765A

CN114648765A - 基于卷积神经网络的顶面箱号识别方法、系统、存储介质及计算机设备

Info

Publication number: CN114648765A
Application number: CN202210196268.1A
Authority: CN
Inventors: 甘海洋; 贾东风; 程力行
Original assignee: Qiku Software Shenzhen Co Ltd
Current assignee: Qiku Software Shenzhen Co Ltd
Priority date: 2022-03-01
Filing date: 2022-03-01
Publication date: 2022-06-21

Abstract

本发明提供了一种基于卷积神经网络的顶面箱号识别方法，通过获取集装箱目标区域的第一待测图像；检测到图像上的文本框时，对文本框进行字符识别，并将文本框的坐标信息和文本识别结果保存到预设字典中；轮巡查找所述预设字典中是否有包含指定字符的第一文本识别结果；若查找到第一文本识别结果，则提取第一文本识别结果对应的第一坐标信息；筛查所述预设字典中与第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息对应的第二文本识别结果按照横轴坐标左右排序进行字符拼接，以生成箱号结果。本发明还提供了一种基于终端标签划分终端管理的系统、存储介质及计算机设备。借此，本发明能够有效识别集装箱顶面的箱号信息。

Description

基于卷积神经网络的顶面箱号识别方法、系统、存储介质及计算机设备

技术领域

本发明涉及目标识别技术领域，尤其涉及一种基于卷积神经网络的顶面箱号识别方法、系统、存储介质及计算机设备。

背景技术

集装箱厂商由于生产节拍加快，需对出厂箱号和箱型进行识别记录存档。如图10所示，箱号包括：前顶部、后顶部、左侧、前、后共5个位置。

目前针对集装箱的顶部箱号提取是通过顶部安装一个摄像头采集。在集装箱前进过程中，顶部两侧的箱号将会以文本正立形式和以文本倒立形式依次出现。即顶部箱号既可能以正立形式出现，也可能以倒立形式出现，因此较难识别出顶部箱号。

综上可知，现有的方法在实际使用上，存在着较多的问题，所以有必要加以改进。

发明内容

针对上述的缺陷，本发明的目的在于提供一种基于卷积神经网络的顶面箱号识别方法，系统、存储介质及其计算机设备，能够有效识别集装箱顶面的箱号信息。

为了实现上述目的，本发明提供一种基于卷积神经网络的顶面箱号识别方法，包括步骤：

获取集装箱目标区域的第一待测图像；

检测到所述第一待测图像上的文本框时，对所述文本框进行字符识别，并将所述文本框的坐标信息和文本识别结果保存到预设字典中；

轮巡查找所述预设字典中是否有包含指定字符的第一文本识别结果；

若查找到所述第一文本识别结果，则提取所述第一文本识别结果对应的第一坐标信息；

筛查所述预设字典中与所述第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息对应的第二文本识别结果按照横轴坐标左右排序进行字符拼接，以生成箱号结果。

可选的，所述轮巡查找所述预设字典中是否有包含指定字符的第一文本识别结果的步骤之后，还包括：

若从所述预设字典中未查找到所述第一文本识别结果，则倒转所述第一待测图像，获得对应的第二待测图像；

对所述第二待测图像进行文本框检测与识别，并依据所述第二待测图像的检测与识别信息更新所述预设字典；

轮巡查找所述预设字典更新后是否有所述第一文本识别结果。

可选的，所述对所述第二待测图像进行文本框检测与识别，并依据所述第二待测图像的检测与识别信息更新所述预设字典的步骤具体包括：

清除所述预设字典中所述第一待测图像对应的第一文本框；

对所述第二待测图像进行文本框检测与识别，获得对应的检测与识别信息，并将所述检测与识别信息保存于所述预设字典中；其中，所述检测与识别信息包括对应所述第二待测图像的第二文本框的坐标信息和文本识别结果。

可选的，所述检测到所述第一待测图像上的文本框时，对所述文本框进行字符识别，并将所述文本框的坐标信息和文本识别结果保存到预设字典中的步骤具体包括：

将所述第一待测图像输入至DBNet文本检测模型以检测是否存在文本框，若存在所述文本框则输出对应的坐标信息；

将所述文本框的区域图像输入至CRNN字符识别模型，获得所述CRNN字符识别模型对应输出的文本识别结果；

将所述文本框的所述坐标信息和所述文本识别结果保存在预设的第一字典中。

可选的，所述筛查所述预设字典中与所述第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息对应的第二文本识别结果按照横轴排序进行字符拼接，以生成箱号结果的步骤具体包括：

轮巡查找所述第一字典中与所述第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息和对应的第二文本识别结果保存至预设的第二字典中；

将所述第二字典中的各个所述第二文本识别结果，按照所述第二坐标信息中的横轴坐标左右排序依次进行字符拼接，以生成箱号结果。

可选的，所述坐标信息包含有所述文本框的四个对角坐标；

设所述第一文本识别结果的左顶角坐标为(x_U，y_U)，所述第一文本识别结果对应的所述文本框的高度为h，则所述预设间距条件为：

|y-y_U|<2*h

其中，y为所述第二坐标信息中的左顶角的纵轴坐标。

可选的，所述检测到所述第一待测图像上的文本框时，对所述文本框进行字符识别，并将所述文本框的坐标信息和文本识别结果保存到预设字典中的步骤之前，还包括：

获取若干训练数据，并以所述训练数据中的单个字符或符号为单位进行四点框标注；

将标注后的所述训练数据输入DBNet文本检测的第一卷积神经网络，以训练生成所述DBNet文本检测模型；

裁剪出所述训练数据中标注的四点框区域图像，并将所述四点框区域图像输入CRNN字符识别的第二卷积神经网络，以训练生成所述CRNN字符识别模型。

还提供了一种基于卷积神经网络的顶面箱号识别系统，包括有：

获取单元，用于获取集装箱目标区域的第一待测图像；

检测与识别单元，用于检测到所述第一待测图像上的文本框时，对所述文本框进行字符识别，并将所述文本框的坐标信息和文本识别结果保存到预设字典中；

第一查找单元，用于轮巡查找所述预设字典中是否有包含指定字符的第一文本识别结果；

提取单元，用于若查找到所述第一文本识别结果，则提取所述第一文本识别结果对应的第一坐标信息；

箱号拼接单元，用于筛查所述预设字典中与所述第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息对应的第二文本识别结果按照横轴坐标左右排序进行字符拼接，以生成箱号结果。

另外，还提供了一种存储介质和计算机设备，所述存储介质用于存储一种用于执行上述基于卷积神经网络的顶面箱号识别方法的计算机程序。

所述计算机设备包括存储介质、处理器以及存储在所述存储介质上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述的基于卷积神经网络的顶面箱号识别方法。

本发明所述的基于卷积神经网络的顶面箱号识别方法及其系统，获取到集装箱目标区域的第一待测图像后，检测图像上的文本框并对其进行字符识别，再将检测与识别获得的坐标信息和文本识别结果保存到预设字典中，轮巡查找预设字典中是否包含有指定字符的第一文本识别结果；若查找到第一文本识别结果，则提取对应的第一坐标信息；筛查所述预设字典中与第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将第二坐标信息对应的第二文本识别结果按照横轴坐标左右排序进行字符拼接，最终生成箱号结果。据此，本发明能够通过算法逻辑代替人工进行实时判断预警，能够有效解决人工肉眼判断箱号错标、漏标预警效率低和预警成本高的问题。

附图说明

图1为本发明一实施例提供的所述基于卷积神经网络的顶面箱号识别方法的步骤流程图；

图2为本发明另一实施例提供的所述基于卷积神经网络的顶面箱号识别方法的步骤流程图；

图3为本发明一实施例提供的所述基于卷积神经网络的顶面箱号识别方法用于检测与识别文本框可选的步骤流程图；

图4为本发明一实施例提供的所述基于卷积神经网络的顶面箱号识别方法用于箱号拼接可选的步骤流程图；

图5为本发明一实施例提供的所述基于卷积神经网络的顶面箱号识别方法用于神经网络训练可选的步骤流程图；

图6为本发明一实施例提供的所述基于卷积神经网络的顶面箱号识别系统的结构示意框图；

图7为本发明另一实施例提供的所述基于卷积神经网络的顶面箱号识别系统的结构示意框图；

图8为本发明一实施例提供的所述基于卷积神经网络的顶面箱号识别系统的所述检测与识别单元可选的结构示意框图；

图9为本发明一实施例提供的所述基于卷积神经网络的顶面箱号识别系统的所述箱号拼接单元可选的结构示意框图；

图10为集装箱上的各个箱号分布的结构透视图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

需要说明的，本说明书中针对“一个实施例”、“实施例”、“示例实施例”等的引用，指的是描述的该实施例可包括特定的特征、结构或特性，但是不是每个实施例必须包含这些特定特征、结构或特性。此外，这样的表述并非指的是同一个实施例。进一步，在结合实施例描述特定的特征、结构或特性时，不管有没有明确的描述，已经表明将这样的特征、结构或特性结合到其它实施例中是在本领域技术人员的知识范围内的。

此外，在说明书及后续的权利要求当中使用了某些词汇来指称特定组件或部件，所属领域中具有通常知识者应可理解，制造商可以用不同的名词或术语来称呼同一个组件或部件。本说明书及后续的权利要求并不以名称的差异来作为区分组件或部件的方式，而是以组件或部件在功能上的差异来作为区分的准则。在通篇说明书及后续的权利要求书中所提及的“包括”和“包含”为一开放式的用语，故应解释成“包含但不限定于”。以外，“连接”一词在此系包含任何直接及间接的电性连接手段。间接的电性连接手段包括通过其它装置进行连接。

图1示出本发明一实施例提供的基于卷积神经网络的顶面箱号识别方法，包括步骤如下：

S101：获取集装箱目标区域的第一待测图像。所述集装箱目标区域为箱号印制的地方，本实施例的集装箱目标区域具体为集装箱的顶面区域，如图10中前顶箱号所在的区域。具体通过至少一摄像头捕获目标区域的待测图像。

S102：检测到第一待测图像上的文本框时，对所述文本框进行字符识别，并将所述文本框的坐标信息和文本识别结果保存到预设字典中。本实施例的待测图像具有与之相对应的预设字典，本实施例在该预设字典中将保存有至少一个文本框的坐标信息和文本识别结果；具体实施时，在预设字典中每一文本框对应的坐标信息和文本识别结果之间建立有与之对应的关联关系。所述文本识别既可以是一串字符串，还可以是单个单词。

S103：轮巡查找所述预设字典中是否有包含指定字符的第一文本识别结果。具体的，本实施例的所述指定字符为基于箱号编码规则确定的固定字符，例如字符“U”；现有的ISO6346(1995)标准的箱号及箱号检验规则中，每个集装箱的箱号为独一无二的，由11位编码组成，包括三个部分，其中：第一部分由4位英文字母组成，前三位代码为箱主代码，第四位代码说明类型，通常以字母“U”表示常规集装箱。此外，第二部分由6位阿拉伯数字组成，第三部分为校验码。所述指定字符所在区域即为箱号的其中一局部区域，因此，本实施例在查询到预设字典中具有指定字符“U”时，即可确定箱号的位置区域。

S104：若查找到所述第一文本识别结果，则提取第一文本识别结果对应的第一坐标信息。当在预设字典中查找到第一文本识别结果，即可确定该第一文本识别结果所在区域即为箱号的位置区域；具体的，本实施例的第一文本识别结果为箱号的第一部分内容(即4位英文字母)，因此提取出对应的第一坐标信息即为箱号第一部分内容对应的坐标信息。

S105：筛查所述预设字典中与第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息对应的第二文本识别结果按照横轴坐标左右排序进行字符拼接，以生成箱号结果。其中，纵轴相对间距是指二者在纵向上的高度差，所述预设间距条件用作参考与第一坐标信息的相对高度差在指定范围内，即第一坐标信息和第二坐标信息中的纵轴坐标差值处于一个预设范围内，即第二文本识别结果与第一文本识别结果处于同一水平区域范围内，故所述第二文本识别结果即为箱号中序列号信息，再将符合上述预设间距的至少一个第二文本识别结果按照横轴排序进行字符拼接，即按照左右顺序依次进行字符拼接，最终获得箱号结果。

图2示出本发明另一实施例所述的基于卷积神经网络的顶面箱号识别方法，其结合上述实施例的基础，所述步骤S103之后还包括：

S106：若从预设字典中未查找到所述第一文本识别结果，则倒转所述第一待测图像，获得对应的第二待测图像。若未能够从预设字典中查询到具有指定字符的第一文本识别结果，则此时存在两种情况，一是第一待测图像上没有箱号，二是此时箱号处于倒转状态；在这两种情况下均无法有效识别出箱号，因此本实施例将第一待测图像倒转成为第二待测图像，具体是将第一待测图像旋转180度后作为第二待测图像。

S107：对所述第二待测图像的文本框进行检测与识别，并依据第二待测图像的检测与识别信息更新所述预设字典。具体的，本实施例重新对第二待测图像进行文本框检测并识别，再将第二待测图像中的文本框对应的坐标信息及其文本识别结果更新到预设字典中。可选的，步骤S107具体包括：清除所述预设字典中第一待测图像对应的第一文本框；对第二待测图像进行文本框检测与识别，获得对应的检测与识别信息，并将所述检测与识别信息保存于预设字典中；其中，所述检测与识别信息包括对应所述第二待测图像的第二文本框的坐标信息和文本识别结果。即本实施例的预设字典中保存的第一待测图像的文本框数据被完全清除，随后重新对第二待测图像进行文本框检测与识别，以获得新的检测与识别数据，再将重新检测与识别获得的新数据保存到预设字典中。其中，本实施例的第一文本框和第二文本框分别为第一待测图像和第二待测图像对应的文本识别区域，具体为待测图像上的某一区域图像，并且预设字典中保存着第一文本框以及与之关联的文本框的坐标信息和文本识别结果，当第一文本框从预设字典中被清除时，与之关联的坐标信息和文本识别结果也将相应的被清除。

S108：轮巡查找所述预设字典更新后是否有所述第一文本识别结果。具体实施时，继续轮巡更新后的预设字典，以查找其中是否包含有第一文本识别结果，若包括有所述第一文本识别结果，如包括有字符“U”的文本识别结果，则进入后一流程；反之，若仍然从更新后的预设字典中未查找到所述第一文本识别结果，则确定待测图像上不包含有箱号信息，此时将终结流程。

参见图3，一可选的实施方式中，步骤S102具体包括：

S1021：将所述第一待测图像输入至DBNet(一种文本检测算法)文本检测模型以检测是否存在文本框，若存在所述文本框则输出对应的坐标信息。

S1022：将所述文本框的区域图像输入至CRNN(一种卷积循环神经网络结构，用于解决基于图像的序列识别问题，特别是场景文字识别问题)字符识别模型，获得所述CRNN字符识别模型对应输出的文本识别结果。所述文本框的区域图像即为该待测图像上该文本框裁剪出来的局部区域图像，本实施例在检测出待测图像上的文本框后，从待测图像上裁剪出区域图像并输入到CRNN字符识别模型中。

S1023：将所述文本框的所述坐标信息和文本识别结果保存在预设的第一字典中。所述第一字典中存储着第一待测图像上各个文本框的坐标信息和文本识别结果。本实施例采用双模态的文本检测与字符识别方法代替传统的人工识别方法，能够实现自动检测识别，降低了人工成本，同时避免人为误差。

可选的，当经步骤S103而未能从第一字典中查找到第一文本识别结果时，清除掉第一字典中的文本框信息(包括坐标信息和文本识别结果)；所述步骤S107具体包括：将第二待测图像输入至DBNet文本检测模型以检测是否存在对应的文本框，若存在所述文本框则输出对应的坐标信息；将所述文本框的区域图像输入至CRNN字符识别模型，获得所述CRNN字符识别模型对应输出的文本识别结果；再将第二待测图像上的文本框的所述坐标信息和文本识别结果保存在第一字典中。

参见图4，一可选的实施方式中，步骤S105具体包括：

S1051：轮巡查找所述第一字典中与第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息和对应的第二文本识别结果保存至预设的第二字典中。具体的，轮巡第一字典中除第一文本识别结果所在文本框以外的其他文本框，并确定其他文本框与第一坐标信息的横轴相对间距满足预设间距条件的第二坐标信息，再通过预设的第二字典保存与第二坐标信息所对应的第二文本识别结果。即第二字典中保存中符合该预设间距条件的文本框的字符串和/或单词。可选的，步骤S1051还包括：轮巡查找更新后的所述第一字典中与第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息和对应的第二文本识别结果保存至预设的第二字典中。

可选的，所述坐标信息包含有所述文本框的四个对角坐标；设所述第一文本识别结果的左顶角坐标为(x_U，y_U)，所述第一文本识别结果对应的文本框的高度为h，则所述预设间距条件为：

|y-y_U|<2*h

其中，y为所述第二坐标信息中的左顶角的纵轴坐标。本实施例的第一文本识别结果即为指定字符所在的字符串；第一文本识别结果的文本框高度具体根据对应的第一坐标信息进行计算，具体实施时，利用该文本框左顶点和左底点的纵坐标进行计算，如所述文本框为矩形框，该文本框的左顶点和左底点坐标之间的纵坐标间距即为该文本框的高度。

若第一字典中的文本框的左顶角坐标满足上述的预设间距条件，则可确定该文本框为箱号框；而2*h是对一些倾斜的箱号框进行范围内限定，当然，其他实施例中，可以设置其他判定范围。

S1052：将所述第二字典中的各个第二文本识别结果，按照第二坐标信息中的横轴坐标排序依次进行字符拼接，以生成箱号结果。本实施例将汇集保存到第二字典上的各个第二文本识别结果按照横轴坐标排序依次进行字符拼接，最终生成箱号中的箱体注册码或顺序码。可选的，步骤S1052还包括：将所述箱号结果保存至预设的第三字典中；通过第三字典来存放箱号信息(包括箱号的各个部分的信息，如第一部分的四位英文字、第二部分的6位阿拉伯数字以及第三部分的校验码)。

参见图5，一可选的实施方式中，步骤S102之前，还包括：

S111：获取若干训练数据，并以所述训练数据中的单个字符或符号为单位进行四点框标注。

S112：将标注后的训练数据输入DBNet文本检测的第一卷积神经网络，以训练生成所述DBNet文本检测模型。

S113：裁剪出所述训练数据中标注的四点框区域图像，并将所述四点框区域图像输入CRNN字符识别的第二卷积神经网络，以训练生成CRNN字符识别模型。可选的，步骤S113还包括：在所述四点框区域图像输入第二卷积神经网络之前，对所述四点框区域图像进行数据增强处理。

具体实施时，搜集大量贴有箱号的集装箱数据，并对集装箱中的字符以单词为单位或者集装箱箱号之间的空格作为开始或者结束来进行四点框标注；其中，四点框标注是以左上、右上、右下和左下的四个点作为定点标注；本实施例采用四点框标注相较于现有技术中采用矩形标注的方式来对公开模型DBNet网络训练是为了针对相机采集到的倾斜字体标注最小框，能够充分学习字符特征，减小背景干扰，提高检测准确率；此外，采用单词为最小单元标注来代替字符标注，可提高标注效率。

在数据优化方面，针对可能识别字符不足的情况，本实施例运用数据增强的方式，以集装箱为背景，制作数据为2:1的方式补充CRNN识别网络数据样本，提高识别精度。

可选的，步骤S105之后，还包括：若所述箱号结果的字符数为11位数，则对箱号结果进行校验码检验。若识别箱号结果中的字符数达到11位数，则其中末尾的字符为校验码；该校验码是校验箱主代号和顺序号记录是否准确的依据，由前4位字母和6位数字经过校验规则运算得出。具体实施时，提取出第11位的校验码并进行箱号校验。集装箱的校验码由箱号前4位字母和6位数字经过校验规则运算得到，用于识别在校验时是否发生错误。即第11位数字根据校验规则箱号的每个字母和数字都有一个运算的对应值。

图6示出本发明一实施例提供的基于卷积神经网络的顶面箱号识别系统100，其包括有获取单元10、检测与识别单元20、第一查找单元30、提取单元40以及箱号拼接单元50，其中：

获取单元10用于获取集装箱目标区域的第一待测图像；检测与识别单元20用于检测到第一待测图像上的文本框时，对所述文本框进行字符识别，并将所述文本框的坐标信息和文本识别结果保存到预设字典中；第一查找单元30用于轮巡查找所述预设字典中是否有包含指定字符的第一文本识别结果；提取单元40用于若查找到所述第一文本识别结果，则提取所述第一文本识别结果对应的第一坐标信息；箱号拼接单元50用于筛查所述预设字典中与第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息对应的第二文本识别结果按照横轴坐标左右排序进行字符拼接，以生成箱号结果。

图7示出本发明另一实施例提供的基于卷积神经网络的顶面箱号识别系统200，其在上述实施例的基础上，还包括有图像变换单元60、字典更新单元70以及第二查找单元80，其中：

图像变换单元60用于若从所述预设字典中未查找到第一文本识别结果，则倒转所述第一待测图像，获得对应的第二待测图像；字典更新单元70用于对第二待测图像的文本框检测与识别，并依据所述第二待测图像的检测与识别信息更新预设字典；第二查找单元80用于轮巡查找所述预设字典更新后是否有第一文本识别结果。

可选的，字典更新单元70具体包括清除子单元和更新子单元，其中：

清除子单元用于清除所述预设字典中所述第一待测图像对应的第一文本框；更新子单元用于对所述第二待测图像进行文本框检测与识别，获得对应的检测与识别信息，并将所述检测与识别信息保存于预设字典中；其中，所述检测与识别信息包括对应所述第二待测图像的第二文本框的坐标信息和文本识别结果。

参见图8，一可选的实施方式中，检测与识别单元20具体包括检测子单元21、识别子单元22以及保存子单元23，其中：

检测子单元21用于将所述第一待测图像输入至DBNet文本检测模型以检测是否存在文本框，若存在所述文本框则输出对应的坐标信息；识别子单元22用于将所述文本框的区域图像输入至CRNN字符识别模型，获得所述CRNN字符识别模型对应输出的文本识别结果；保存子单元23用于将所述文本框的所述坐标信息和所述文本识别结果保存在预设的第一字典中。

参见图9，一可选的实施方式中，箱号拼接单元50具体包括有判断与保存子单元51和拼接子单元52，其中：

判断与保存子单元51用于轮巡查找所述第一字典中与第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息和对应的第二文本识别结果保存至预设的第二字典中；拼接子单元52用于将所述第二字典中的各个第二文本识别结果，按照所述第二坐标信息中的横轴坐标排序依次进行字符拼接，以生成箱号结果。

可选的，所述坐标信息包含有所述文本框的四个对角坐标；

|y-y_U|<2*h

其中，y为所述第二坐标信息中的左顶角的纵轴坐标。

一实施例中，还包括有训练数据获取单元、第一训练单元以及第二训练单元，其中：

训练数据获取单元用于获取若干训练数据，并以训练数据中的单个字符或符号为单位进行四点框标注；第一训练单元用于将标注后的训练数据输入DBNet文本检测的第一卷积神经网络，以训练生成DBNet文本检测模型；第二训练单元用于裁剪出所述训练数据中标注的四点框区域图像，并将所述四点框区域图像输入CRNN字符识别的第二卷积神经网络，以训练生成CRNN字符识别模型。

可选的，所述第二训练单元还用于在所述四点框区域图像输入所述第二卷积神经网络之前，对所述四点框区域图像进行数据增强处理。

一实施例中，还包括有校验单元，其用于若所述箱号结果的字符数为11位数，则对所述箱号结果进行校验码检验。

本发明还提供一种存储介质，用于存储如图1～图5所述基于卷积神经网络的顶面箱号识别方法的计算机程序。例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令，可能被存储在固定的或可移动的存储介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输和/或被存储在根据程序指令运行的计算机设备的存储介质中。在此，根据本申请的一个实施例包括如图6或图7所示基于卷积神经网络的顶面箱号识别系统的计算机设备，所述计算机设备优选包括用于存储计算机程序的存储介质和用于执行计算机程序的处理器，其中，当该计算机程序被该处理器执行时，触发该计算机设备执行基于前述多个实施例中的方法和/或技术方案。

需要注意的是，本申请可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中，本申请的软件程序可以通过处理器执行以实现上文步骤或功能。同样地，本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本申请的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

根据本发明的方法可以作为计算机实现方法在计算机上实现、或者在专用硬件中实现、或以两者的组合的方式实现。用于根据本发明的方法的可执行代码或其部分可以存储在计算机程序产品上。计算机程序产品的示例包括存储器设备、光学存储设备、集成电路、服务器、在线软件等。优选地，计算机程序产品包括存储在计算机可读介质上以便当所述程序产品在计算机上执行时执行根据本发明的方法的非临时程序代码部件。

在优选实施例中，计算机程序包括适合于当计算机程序在计算机上运行时执行根据本发明的方法的所有步骤的计算机程序代码部件。优选地，在计算机可读介质上体现计算机程序。

综上所述，本发明所述的基于卷积神经网络的顶面箱号识别方法及其系统，获取到集装箱目标区域的第一待测图像后，检测图像上的文本框并对其进行字符识别，再将检测与识别获得的坐标信息和文本识别结果保存到预设字典中，轮巡查找预设字典中是否包含有指定字符的第一文本识别结果；若查找到第一文本识别结果，则提取对应的第一坐标信息；筛查所述预设字典中与第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将第二坐标信息对应的第二文本识别结果按照横轴坐标左右排序进行字符拼接，最终生成箱号结果。据此，本发明能够通过算法逻辑代替人工进行实时判断预警，能够有效解决人工肉眼判断箱号错标、漏标预警效率低和预警成本高的问题。

当然，本发明还可有其它多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

本发明还提供了A1、一种基于卷积神经网络的顶面箱号识别方法，包括步骤：

获取集装箱目标区域的第一待测图像；

A2、根据A1所述的基于卷积神经网络的顶面箱号识别方法，所述轮巡查找所述预设字典中是否有包含指定字符的第一文本识别结果的步骤之后，还包括：

A3、根据A1所述的基于卷积神经网络的顶面箱号识别方法，所述对所述第二待测图像进行文本框检测与识别，并依据所述第二待测图像的检测与识别信息更新所述预设字典的步骤具体包括：

清除所述预设字典中所述第一待测图像对应的第一文本框；

A4、根据A1所述的基于卷积神经网络的顶面箱号识别方法，所述检测到所述第一待测图像上的文本框时，对所述文本框进行字符识别，并将所述文本框的坐标信息和文本识别结果保存到预设字典中的步骤具体包括：

A5、根据A4所述的基于卷积神经网络的顶面箱号识别方法，所述筛查所述预设字典中与所述第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息对应的第二文本识别结果按照横轴排序进行字符拼接，以生成箱号结果的步骤具体包括：

A6、根据A5所述的基于卷积神经网络的顶面箱号识别方法，所述坐标信息包含有所述文本框的四个对角坐标；

|y-y_U|<2*h

其中，y为所述第二坐标信息中的左顶角的纵轴坐标。

A7、根据A4所述的基于卷积神经网络的顶面箱号识别方法，所述检测到所述第一待测图像上的文本框时，对所述文本框进行字符识别，并将所述文本框的坐标信息和文本识别结果保存到预设字典中的步骤之前，还包括：

A8、根据A1所述的基于卷积神经网络的顶面箱号识别方法，所述裁剪出所述训练数据中标注的四点框区域图像，并将所述四点框区域图像输入CRNN字符识别的第二卷积神经网络，以训练生成所述CRNN字符识别模型的步骤还包括：

在所述四点框区域图像输入所述第二卷积神经网络之前，对所述四点框区域图像进行数据增强处理。

A9、根据A1所述的基于卷积神经网络的顶面箱号识别方法，所述筛查所述预设字典中与所述第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息对应的第二文本识别结果按照横轴排序进行字符拼接，以生成箱号结果的步骤之后，还包括：

若所述箱号结果的字符数为11位数，则对所述箱号结果进行校验码检验。

还提供了B10、一种基于卷积神经网络的顶面箱号识别系统，包括：

获取单元，用于获取集装箱目标区域的第一待测图像；

B11、根据B10所述的基于卷积神经网络的顶面箱号识别系统，还包括有：

图像变换单元，用于若从所述预设字典中未查找到所述第一文本识别结果，则倒转所述第一待测图像，获得对应的第二待测图像；

字典更新单元，用于对所述第二待测图像进行文本框检测与识别，并依据所述第二待测图像的检测与识别信息更新所述预设字典；

第二查找单元，用于轮巡查找所述预设字典更新后是否有所述第一文本识别结果。

B12、根据B11所述的基于卷积神经网络的顶面箱号识别系统，所述字典更新单元具体包括：

清除子单元，用于清除所述预设字典中所述第一待测图像对应的第一文本框；

更新子单元，用于对所述第二待测图像进行文本框检测与识别，获得对应的检测与识别信息，并将所述检测与识别信息保存于所述预设字典中；其中，所述检测与识别信息包括对应所述第二待测图像的第二文本框的坐标信息和文本识别结果。

B13、根据B10所述的基于卷积神经网络的顶面箱号识别系统，所述检测与识别单元具体包括：

检测子单元，用于将所述第一待测图像输入至DBNet文本检测模型以检测是否存在文本框，若存在所述文本框则输出对应的坐标信息；

识别子单元，用于将所述文本框的区域图像输入至CRNN字符识别模型，获得所述CRNN字符识别模型对应输出的文本识别结果；

保存子单元，用于将所述文本框的所述坐标信息和所述文本识别结果保存在预设的第一字典中。

B14、根据B13所述的基于卷积神经网络的顶面箱号识别系统，所述箱号拼接单元具体包括：

判断与保存子单元，用于轮巡查找所述第一字典中与所述第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息和对应的第二文本识别结果保存至预设的第二字典中；

拼接子单元，用于将所述第二字典中的各个所述第二文本识别结果，按照所述第二坐标信息中的横轴坐标左右排序依次进行字符拼接，以生成箱号结果。

B15、根据B14所述的基于卷积神经网络的顶面箱号识别系统，所述坐标信息包含有所述文本框的四个对角坐标；

|y-y_U|<2*h

其中，y为所述第二坐标信息中的左顶角的纵轴坐标。

B16、根据B13所述的基于卷积神经网络的顶面箱号识别系统，还包括：

训练数据获取单元，用于获取若干训练数据，并以所述训练数据中的单个字符或符号为单位进行四点框标注；

第一训练单元，用于将标注后的所述训练数据输入DBNet文本检测的第一卷积神经网络，以训练生成所述DBNet文本检测模型；

第二训练单元，用于裁剪出所述训练数据中标注的四点框区域图像，并将所述四点框区域图像输入CRNN字符识别的第二卷积神经网络，以训练生成所述CRNN字符识别模型。

B17、根据B10所述的基于卷积神经网络的顶面箱号识别系统，所述第二训练单元还用于：

B18、根据B10所述的基于卷积神经网络的顶面箱号识别系统，还包括：

校验单元，用于若所述箱号结果的字符数为11位数，则对所述箱号结果进行校验码检验。

还提供了C19、一种存储介质，用于存储一种用于执行A1～A9中任意一种所述基于卷积神经网络的顶面箱号识别方法的计算机程序。

还提供了D20、一种计算机设备，包括存储介质、处理器以及存储在所述存储介质上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现A1～A9任一项所述基于卷积神经网络的顶面箱号识别方法。

Claims

1.一种基于卷积神经网络的顶面箱号识别方法，其特征在于，包括步骤：

获取集装箱目标区域的第一待测图像；

2.根据权利要求1所述的基于卷积神经网络的顶面箱号识别方法，其特征在于，所述轮巡查找所述预设字典中是否有包含指定字符的第一文本识别结果的步骤之后，还包括：

3.根据权利要求1所述的基于卷积神经网络的顶面箱号识别方法，其特征在于，所述对所述第二待测图像进行文本框检测与识别，并依据所述第二待测图像的检测与识别信息更新所述预设字典的步骤具体包括：

清除所述预设字典中所述第一待测图像对应的第一文本框；

4.根据权利要求1所述的基于卷积神经网络的顶面箱号识别方法，其特征在于，所述检测到所述第一待测图像上的文本框时，对所述文本框进行字符识别，并将所述文本框的坐标信息和文本识别结果保存到预设字典中的步骤具体包括：

5.根据权利要求4所述的基于卷积神经网络的顶面箱号识别方法，其特征在于，所述筛查所述预设字典中与所述第一坐标信息的纵轴相对间距满足预设间距条件的第二坐标信息，并将所述第二坐标信息对应的第二文本识别结果按照横轴排序进行字符拼接，以生成箱号结果的步骤具体包括：

6.根据权利要求5所述的基于卷积神经网络的顶面箱号识别方法，其特征在于，所述坐标信息包含有所述文本框的四个对角坐标；

|y-y_U|<2*h

其中，y为所述第二坐标信息中的左顶角的纵轴坐标。

7.根据权利要求4所述的基于卷积神经网络的顶面箱号识别方法，其特征在于，所述检测到所述第一待测图像上的文本框时，对所述文本框进行字符识别，并将所述文本框的坐标信息和文本识别结果保存到预设字典中的步骤之前，还包括：

8.一种基于卷积神经网络的顶面箱号识别系统，其特征在于，包括：

获取单元，用于获取集装箱目标区域的第一待测图像；

9.一种存储介质，其特征在于，用于存储一种用于执行权利要求1～7中任意一种所述基于卷积神经网络的顶面箱号识别方法的计算机程序。

10.一种计算机设备，包括存储介质、处理器以及存储在所述存储介质上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1～7任一项所述基于卷积神经网络的顶面箱号识别方法。