CN112149668A - 带有边痕的喷码识别方法及系统 - Google Patents

带有边痕的喷码识别方法及系统 Download PDF

Info

Publication number
CN112149668A
CN112149668A CN202011006929.7A CN202011006929A CN112149668A CN 112149668 A CN112149668 A CN 112149668A CN 202011006929 A CN202011006929 A CN 202011006929A CN 112149668 A CN112149668 A CN 112149668A
Authority
CN
China
Prior art keywords
code
code spraying
character
spraying
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011006929.7A
Other languages
English (en)
Inventor
么新新
刘伟华
张学龙
谭培波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhitong Yunlian Technology Co Ltd
Original Assignee
Beijing Zhitong Yunlian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhitong Yunlian Technology Co Ltd filed Critical Beijing Zhitong Yunlian Technology Co Ltd
Priority to CN202011006929.7A priority Critical patent/CN112149668A/zh
Publication of CN112149668A publication Critical patent/CN112149668A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1439Methods for optical code recognition including a method step for retrieval of the optical code
    • G06K7/1443Methods for optical code recognition including a method step for retrieval of the optical code locating of the code in an image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Toxicology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种带有边痕的喷码识别方法及系统,所述方法包括:采集包装上的带有边痕的喷码图像;对喷码图像中的喷码区域进行定位,获取喷码区域的位置信息,并根据喷码区域的位置信息,将喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;将喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中进行识别,获得与喷码区域图像对应的喷码字符串。本发明能够有效消除影响喷码识别结果的因素,提高喷码识别结果的准确率。

Description

带有边痕的喷码识别方法及系统
技术领域
本发明涉及计算机技术领域,尤其是涉及一种带有边痕的喷码识别方法及系统。
背景技术
在现有技术中,赋码监管是工厂生产中商品管理的一个重要环节,喷码字符作为常用的商品监管码,其检测、识别有着举足轻重的地位。若采用人工进行喷码识别,生产线生产速度远大于人眼可接收的视觉变换速度,例如,蒙牛工厂中生产奶包的速度每秒可达10-20包,人眼无法做到快速识别进行有效剔除不合规商品,随着机器学习以及计算机硬件的高速发展,可使用计算机视觉的方法解决这一难题。在现有技术中,喷码识别的采用以下流程进行:步骤1,基于深度学习或传统图像处理的喷码定位;步骤2,对喷码定位进行优化;步骤3,进行喷码的OCR识别。
不同商品的包装以及喷码位置是不同的,因此喷码识别的方法存在差异。针对包装上有边痕且影响到喷码识别的情况,一般采用的方法是先做边痕的消除,然后再进行喷码识别。然而,这种方法存在的以下问题:
问题1,喷码机进行赋码时,因包装边痕处平面不平滑,若有多余墨汁溅入边痕中,会产生冗余的笔画,当其和边痕附近的字符关联在一起时,很容易导致边痕无法有效消除,进而引起识别出错。
问题2,喷码机进行赋码时,若有字符恰好位于边痕处,进行边痕消除很容易导致正常字符残缺化,也会导致识别出错。
因此,目前亟须解决上述技术问题的技术方案。
发明内容
本发明的目的在于提供一种带有边痕的喷码识别方法及系统,旨在解决现有技术中的上述问题。
本发明提供一带有边痕的喷码识别方法,包括:
采集包装上的带有边痕的喷码图像;
对喷码图像中的喷码区域进行定位,获取喷码区域的位置信息,并根据喷码区域的位置信息,将喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
将喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中进行识别,获得与喷码区域图像对应的喷码字符串。
本发明提供一种带有边痕的喷码识别系统,包括:
采集模块,用于采集包装上的带有边痕的喷码图像;
处理模块,用于对喷码图像中的喷码区域进行定位,获取喷码区域的位置信息,并根据喷码区域的位置信息,将喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
识别模块,用于将喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中进行识别,获得与喷码区域图像对应的喷码字符串。
本发明实施例还提供一种带有边痕的喷码识别装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述带有边痕的喷码识别方法的步骤。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现上述带有边痕的喷码识别方法的步骤。
采用本发明实施例,通过将喷码区域的上下边界进行扩展,强化了边痕与喷码字符的差异,解决了现有技术中先做边痕消除而后进行喷码识别带来的多余笔画或字符残缺引起的识别不准的问题,能够有效消除影响喷码识别结果的因素,提高喷码识别结果的准确率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的带有边痕的喷码识别方法的流程图;
图2是本发明实施例的包装上的带有边痕的喷码的示意图;
图3是本发明实施例的带有边痕的喷码识别方法的系统架构示意图;
图4a是本发明实施例的采集的原始喷码图像的示意图;
图4b是本发明实施例的表倾斜校正及喷码初始位置的示意图;
图4c是本发明实施例的将喷码区域扩展后的喷码图像区域的示意图;
图5是本发明实施例的单字符图片集的生成的示意图;
图6是本发明实施例的喷码字符切割的示意图;
图7是本发明实施例的单字符图片的示意图;
图8是本发明实施例的带有边痕的喷码识别系统的示意图;
图9是本发明实施例的带有边痕的喷码识别装置的示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“坚直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。此外,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
方法实施例
根据本发明实施例,提供了一种带有边痕的喷码识别方法,在执行本发明实施例之前,首先需要预先对基于序列识别的神经网络模型进行训练,具体包括如下处理:
步骤1,获取预先保存的字符类型(例如,1,3,a,b等均为一种字符类型)、喷码规则、以及根据字符类型生成的单字符图像集;具体地,字符种类指喷码字符串中可能出现的字符类型,例如,1,2,a,b等;喷码字符规则指喷码中单个字符组合成字符串的规则,因同个包装的商品上的喷码中字符的组合是由一定的含义和规则,例如,一般为产地代号+生产年月日+产线代号+生产时分;单字符图像集指每种类型的字符的图像集,用于生成序列识别神经网络模型训练时所需的训练语料。在步骤1中,根据字符类型生成单字符图像集具体包括如下处理:
步骤11,采集一定数量的包装上的喷码图像,其中,喷码图像中包括带有边痕的喷码图像;
步骤12,对喷码图像中的喷码区域进行定位,获取喷码区域的位置信息,并根据喷码区域的位置信息,将喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
步骤13,将喷码区域图像以字符为基准进行切割,得到单字符图像,并根据字符类型,将单字符图像进行分组,生成不同字符类型的单字符图像集。
其中,在步骤13中,将喷码区域图像以字符为基准进行切割具体包括如下处理:
步骤131,根据喷码规则计算喷码区域图像所包含的字符个数n,将喷码区域图像的水平方向分成n份,得到n-1个初始字符分界线;需要说明的是,x轴方向的切割为水平方向的切割,y轴方向的切割为垂直方向的切割。
步骤132,根据用户操作将初始字符分界线移动至相邻的两个字符的中间区域,获得n-1条最终字符分界线;
步骤133,根据最终字符分界线对喷码区域图像进行水平方向的切割,获取n个字符图像;
步骤134,根据用户的输入获取n个字符图像所对应的n个字符,并将字符与字符图像进行关联。
步骤2,根据喷码规则生成训练喷码字符串,依次从训练喷码字符串的每个字符所对应的单字符图像集中抽取该字符对应的图像,对每个字符所对应的图像进行拼接,得到训练喷码字符串对应的训练喷码图像,其中,训练喷码图像中包括带有边痕的喷码图像;
步骤3,将训练喷码字符串和训练喷码图像输入基于序列识别的神经网络模型,对基于序列识别的神经网络模型进行训练,最终得到训练好的基于序列识别的神经网络模型。
图1是本发明实施例的带有边痕的喷码识别方法的流程图,得到了训练好的基于序列识别的神经网络模型后,如图1所示,根据本发明实施例的带有边痕的喷码识别方法具体包括:
步骤101,采集包装上的带有边痕的喷码图像;
步骤102,对喷码图像中的喷码区域进行定位,获取喷码区域的位置信息,并根据喷码区域的位置信息,将喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
步骤103,将喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中进行识别,获得与喷码区域图像对应的喷码字符串。
步骤102和神经网络模型训练时的步骤12具体包括如下处理:
对喷码图像中的喷码区域进行定位,并根据喷码区域的倾斜角度对喷码区域进行倾斜校正,获取校正后的喷码区域的位置坐标;
根据喷码区域的位置信息,计算喷码的整体宽度,并从预先保存的喷码规则中获取喷码字符的个数,根据喷码的整体宽度和喷码字符的个数计算喷码的单字符宽度;
根据单字符宽度确定延申长度,根据延申长度将喷码区域的上下边界分别向外延申,并对上下边界的两个延申区域进行横线消除处理,最终获得延申后的边痕和喷码具有明显差异的喷码区域图像。
以下结合附图,对本发明实施例的上述技术方案进行详细说明。
对于商品包装上带有边痕的喷码识别,如图2所示,由于边痕和喷码字符存在灰度值、高度的明显差异性,可以利用深度学习模型在训练过程中自动学习样本数据的内存规律,自动习得喷码字符和边痕的差异性,基于此,发明实施例的技术方案提出了一种基于序列识别的神经网络模型对带有边痕的喷码进行识别。在本发明实施例中,为了强化边痕与喷码字符的差异,在神经网络模型识别前将喷码区域的上下边界进行扩展,并在神经网络模型训练阶段生成大量带有边痕的训练语料。
如图3所示,本发明实施例的一个实例中,带有边痕的喷码识别方法的系统结构可以从上往下分为3层:识别层、模型层、数据层。其中,识别层负责具体的应用部分,具体操作是进行喷码定位后,进行喷码上下边界的扩展,而后利用深度学习进行识别。模型层用于训练和提供基于序列识别的神经网络模型,数据层提供模型层训练神经网络模型时所需要的数据。
下面首先对识别层的喷码识别处理进行详细说明。
步骤1-1,获取喷码图像:
因商品的喷码区域多为黑色,在实际应用中,可采用黑白工业相机架设到生产线上进行喷码图像的采集。
步骤1-2,进行喷码区域的定位:
在实际应用中,可以采用基于文本检测深度学习模型或传统的图像处理方法进行喷码区域的定位。如图4a所示,由于生产线上商品本身摆放不固定,会导致在生产线上拍摄到的喷码区域是倾斜的。因此需要根据喷码区域的倾斜角度,对步骤1-1采集的喷码图像进行倾斜校正,如图4b所示,最终获取校正后的喷码图像以及喷码的位置坐标。
步骤1-3,进行喷码区域的扩展;
如图2所示,边痕和喷码的高度有明显差异,为了使差异更加明显,本发明实施例将喷码区域上下边界进行扩展,具体操作为:首先,进行单字符宽度的预估:因每一条生产线的喷码规则是固定的,字符种类及字符个数也是固定的,因此,需要根据步骤1-2获取的喷码区域来计算喷码宽度,再将喷码宽度/字符个数计算得到预估的单字符宽度。然后,将喷码区域上下边界进行扩展,将步骤1-2输出的倾斜校正后的喷码图像中喷码区域的上下边界分别向外延申至少一个字符的预估宽度,且对两个延申的区域分别进行水平方向的腐蚀膨胀从而消除横线。如图4c所示,最终输出上下边界扩展后的喷码区域图像。
步骤1-4,进行喷码识别,即采用基于序列识别的神经网络模型进行喷码字符串的识别。
将步骤1-3输出的喷码区域图像输入到神经网络模型,得到喷码字符串。其中,神经网络模型采用的是用于序列识别的结构,相比于单字符识别,序列识别是指将图像识别成字符串,常见的用于序列识别的神经网络模型如CNN+RNN/LSTM/GRU+CTC。
下面对于数字层进行详细说明:
在数据层中,包含字符种类、喷码字符规则和单字符图像集,字符种类指喷码字符串中可能出现的字符类型,例如,1,2,a,b等;喷码字符规则指喷码中单个字符组合成字符串的规则,因同个包装的商品上的喷码中字符的组合是由一定的含义和规则,例如,一般为产地代号+生产年月日+产线代号+生产时分;单字符图像集指每种类型的字符的图像集,用于生成序列识别神经网络模型训练时所需的训练语料。
其中,单字符图像集的生成的具体步骤如图5所示,具体包括:
步骤2-1,进行喷码图像的采集;
由于商品包装边痕的位置是固定的,为了使得每种类型字符的图像集均有包含边痕的喷码图像,需经过一定时间的采集及积累;如针对某个类型的奶包,边痕影响的字符一般是日期中具体的某天,一般需要进行连续10天的喷码图像收集。
步骤2-2,进行喷码区域图像集的获取;
针对步骤2-1采集的喷码图像集的每张喷码图像,进行喷码区域的处理,进而获取大量的喷码区域图像,形成喷码区域图像集,其中喷码区域的处理操作具体包括:
步骤2-2-1,进行喷码区域的定位:
基于文本检测深度学习模型或传统的图像处理方法进行喷码区域的定位。由于生产线上商品本身摆放时可能是倾斜,因此根据喷码区域的倾斜角度,对喷码图像进行倾斜校正,最终获取校正后的喷码图像以及喷码的位置坐标。
步骤2-2-2,进行喷码区域的扩展:
首先进行单字符宽度的预估,根据喷码字符规则得到喷码所包含的字符个数,根据步骤2-2-1获取的喷码区域计算喷码宽度,计算喷码宽度/字符个数得到单字符的预估宽度。然后将喷码区域上下边界进行扩展,将步骤2-2-1输出的倾斜校正后的喷码图像中喷码区域的上下边界分别延申至少一个字符的预估宽度,且对两个延申的区域分别进行水平方向的腐蚀膨胀从而消除横线,最终输出上下边界扩展后的喷码区域图像。
步骤2-3,进行字符的切割;
将步骤2-2输出喷码区域图像集中每张喷码区域图像以字符为基准进行切割;得到单字符图像,将同种类型的字符图像放在一起即可获取单字符图像集。如图6所示,其中针对每张喷码区域图像具体的切割操作具体包括:
根据喷码字符规则得到喷码所包含的字符个数n,将喷码区域图像水平方向分成n份,得到n-1个初始字符分界线,针对初始分界线人为校对将其移动至相邻的两个字符中间区域,获得真实的n-1条字符分界线,用其对喷码区域图像进行水平方向的切割即可获得n个单字符图像;人为输入喷码的n个字符,进而可将字符与单字符图像进行关联,如图7所示,其中每张单字符图像的命名方式为“字符类型-唯一标识”。
下面,对模型层的神经网络模型的训练过程进行详细说明。
基于序列识别的神经网络模型的训练过程具体步骤如下:
步骤3-1,训练语料的生成,即大量喷码字符串及其对应的图像的获取,其中,有些喷码图像中带有边痕;
基于喷码规则生成大量符合条件的字符串;针对每一个字符串,依次从每个字符的单字符图像集中随机抽取一张,然后进行拼接得到该字符串对应的喷码图像,进而获得大量的符合喷码规则的字符串及其对应的喷码图像,其中包括带有边痕的喷码图像。
步骤3-2,用于序列识别的神经网络模型训练:
将步骤3-1输出的喷码字符串及其对应的图像输入到基于序列识别的神经网络模型进行训练,得到可用于字符串识别的模型。
综上所述,借助于本发明实施例的技术方案,在模型识别前将喷码区域的上下边界进行扩展,强化了边痕与喷码字符的差异,在模型训练阶段生成大量带有边痕的训练语料。同时可以解决先做边痕消除而后进行喷码识别带来的多余笔画或字符残缺引起的识别不准的问题。
系统实施例
根据本发明实施例,提供了一种带有边痕的喷码识别系统,图8是本发明实施例的带有边痕的喷码识别系统的示意图,如图8所示,根据本发明实施例的带有边痕的喷码识别系统具体包括:
采集模块80,用于采集包装上的带有边痕的喷码图像;
处理模块82,用于对喷码图像中的喷码区域进行定位,获取喷码区域的位置信息,并根据喷码区域的位置信息,将喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
识别模块84,用于将喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中进行识别,获得与喷码区域图像对应的喷码字符串。
在本发明实施例中,识别模块84进一步包括:
训练子模块,用于对基于序列识别的神经网络模型进行训练,训练子模块具体用于:
获取预先保存的字符类型、喷码规则、以及根据字符类型生成的单字符图像集;
根据喷码规则生成训练喷码字符串,依次从训练喷码字符串的每个字符所对应的单字符图像集中抽取该字符对应的图像,对每个字符所对应的图像进行拼接,得到训练喷码字符串对应的训练喷码图像,其中,训练喷码图像中包括带有边痕的喷码图像;
将训练喷码字符串和训练喷码图像输入基于序列识别的神经网络模型,对基于序列识别的神经网络模型进行训练,最终得到训练好的基于序列识别的神经网络模型。
其中,上述训练子模块具体用于:
采集一定数量的包装上的喷码图像,其中,喷码图像中包括带有边痕的喷码图像;
对喷码图像中的喷码区域进行定位,获取喷码区域的位置信息,并根据喷码区域的位置信息,将喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
将喷码区域图像以字符为基准进行切割,得到单字符图像,并根据字符类型,将单字符图像进行分组,生成不同字符类型的单字符图像集。
上述训练子模块具体用于:
根据喷码规则计算喷码区域图像所包含的字符个数n,将喷码区域图像的水平方向分成n份,得到n-1个初始字符分界线;
根据用户操作将初始字符分界线移动至相邻的两个字符的中间区域,获得n-1条最终字符分界线;
根据最终字符分界线对喷码区域图像进行水平方向的切割,获取n个字符图像;
根据用户的输入获取n个字符图像所对应的n个字符,并将字符与字符图像进行关联。
上述处理模块82和训练子模块具体用于:
对喷码图像中的喷码区域进行定位,并根据喷码区域的倾斜角度对喷码区域进行倾斜校正,获取校正后的喷码区域的位置坐标;
根据喷码区域的位置信息,计算喷码的整体宽度,并从预先保存的喷码规则中获取喷码字符的个数,根据喷码的整体宽度和喷码字符的个数计算喷码的单字符宽度;
根据单字符宽度确定延申长度,根据延申长度将喷码区域的上下边界分别向外延申,并对上下边界的两个延申区域进行横线消除处理,最终获得延申后的边痕和喷码具有明显差异的喷码区域图像。
本发明实施例是与上述方法实施例对应的系统实施例,各个模块的具体操作可以参照方法实施例的描述进行理解,在此不再赘述。
装置实施例一
本发明实施例提供一种带有边痕的喷码识别装置,如图9所示,包括:存储器90、处理器92及存储在所述存储器90上并可在所述处理器92上运行的计算机程序,所述计算机程序被所述处理器92执行时实现如下方法步骤:
首先需要预先对基于序列识别的神经网络模型进行训练,具体包括如下处理:
步骤1,获取预先保存的字符类型(例如,1,3,a,b等均为一种字符类型)、喷码规则、以及根据字符类型生成的单字符图像集;具体地,字符种类指喷码字符串中可能出现的字符类型,例如,1,2,a,b等;喷码字符规则指喷码中单个字符组合成字符串的规则,因同个包装的商品上的喷码中字符的组合是由一定的含义和规则,例如,一般为产地代号+生产年月日+产线代号+生产时分;单字符图像集指每种类型的字符的图像集,用于生成序列识别神经网络模型训练所需的训练语料。
在步骤1中,根据字符类型生成单字符图像集具体包括如下处理:
步骤11,采集一定数量的包装上的喷码图像,其中,喷码图像中包括带有边痕的喷码图像;
步骤12,对喷码图像中的喷码区域进行定位,获取喷码区域的位置信息,并根据喷码区域的位置信息,将喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
步骤13,将喷码区域图像以字符为基准进行切割,得到单字符图像,并根据字符类型,将单字符图像进行分组,生成不同字符类型的单字符图像集。
其中,在步骤13中,将喷码区域图像以字符为基准进行切割具体包括如下处理:
步骤131,根据喷码规则计算喷码区域图像所包含的字符个数n,将喷码区域图像的水平方向分成n份,得到n-1个初始字符分界线;
步骤132,根据用户操作将初始字符分界线移动至相邻的两个字符的中间区域,获得n-1条最终字符分界线;
步骤133,根据最终字符分界线对喷码区域图像进行水平方向的切割,获取n个字符图像;
步骤134,根据用户的输入获取n个字符图像所对应的n个字符,并将字符与字符图像进行关联。
步骤2,根据喷码规则生成训练喷码字符串,依次从训练喷码字符串的每个字符所对应的单字符图像集中抽取该字符对应的图像,对每个字符所对应的图像进行拼接,得到训练喷码字符串对应的训练喷码图像,其中,训练喷码图像中包括带有边痕的喷码图像;
步骤3,将训练喷码字符串和训练喷码图像输入基于序列识别的神经网络模型,对基于序列识别的神经网络模型进行训练,最终得到训练好的基于序列识别的神经网络模型。
根据本发明实施例的带有边痕的喷码识别方法具体包括:
步骤101,采集包装上的带有边痕的喷码图像;
步骤102,对喷码图像中的喷码区域进行定位,获取喷码区域的位置信息,并根据喷码区域的位置信息,将喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
步骤103,将喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中进行识别,获得与喷码区域图像对应的喷码字符串。
步骤102和神经网络模型训练时的步骤12具体包括如下处理:
对喷码图像中的喷码区域进行定位,并根据喷码区域的倾斜角度对喷码区域进行倾斜校正,获取校正后的喷码区域的位置坐标;
根据喷码区域的位置信息,计算喷码的整体宽度,并从预先保存的喷码规则中获取喷码字符的个数,根据喷码的整体宽度和喷码字符的个数计算喷码的单字符宽度;
根据单字符宽度确定延申长度,根据延申长度将喷码区域的上下边界分别向外延申,并对上下边界的两个延申区域进行横线消除处理,最终获得延申后的边痕和喷码具有明显差异的喷码区域图像。
装置实施例二
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传输的实现程序,所述程序被处理器92执行时实现如下方法步骤:
首先需要预先对基于序列识别的神经网络模型进行训练,具体包括如下处理:
步骤1,获取预先保存的字符类型(例如,1,3,a,b等均为一种字符类型)、喷码规则、以及根据字符类型生成的单字符图像集;具体地,字符种类指喷码字符串中可能出现的字符类型,例如,1,2,a,b等;喷码字符规则指喷码中单个字符组合成字符串的规则,因同个包装的商品上的喷码中字符的组合是由一定的含义和规则,例如,一般为产地代号+生产年月日+产线代号+生产时分;单字符图像集指每种类型的字符的图像集,用于生成序列识别神经网络模型所需的训练语料。
在步骤1中,根据字符类型生成单字符图像集具体包括如下处理:
步骤11,采集一定数量的包装上的喷码图像,其中,喷码图像中包括带有边痕的喷码图像;
步骤12,对喷码图像中的喷码区域进行定位,获取喷码区域的位置信息,并根据喷码区域的位置信息,将喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
步骤13,将喷码区域图像以字符为基准进行切割,得到单字符图像,并根据字符类型,将单字符图像进行分组,生成不同字符类型的单字符图像集。
其中,在步骤13中,将喷码区域图像以字符为基准进行切割具体包括如下处理:
步骤131,根据喷码规则计算喷码区域图像所包含的字符个数n,将喷码区域图像的水平方向分成n份,得到n-1个初始字符分界线;
步骤132,根据用户操作将初始字符分界线移动至相邻的两个字符的中间区域,获得n-1条最终字符分界线;
步骤133,根据最终字符分界线对喷码区域图像进行水平方向的切割,获取n个字符图像;
步骤134,根据用户的输入获取n个字符图像所对应的n个字符,并将字符与字符图像进行关联。
步骤2,根据喷码规则生成训练喷码字符串,依次从训练喷码字符串的每个字符所对应的单字符图像集中抽取该字符对应的图像,对每个字符所对应的图像进行拼接,得到训练喷码字符串对应的训练喷码图像,其中,训练喷码图像中包括带有边痕的喷码图像;
步骤3,将训练喷码字符串和训练喷码图像输入基于序列识别的神经网络模型,对基于序列识别的神经网络模型进行训练,最终得到训练好的基于序列识别的神经网络模型。
根据本发明实施例的带有边痕的喷码识别方法具体包括:
步骤101,采集包装上的带有边痕的喷码图像;
步骤102,对喷码图像中的喷码区域进行定位,获取喷码区域的位置信息,并根据喷码区域的位置信息,将喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
步骤103,将喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中进行识别,获得与喷码区域图像对应的喷码字符串。
步骤102和神经网络模型训练时的步骤12具体包括如下处理:
对喷码图像中的喷码区域进行定位,并根据喷码区域的倾斜角度对喷码区域进行倾斜校正,获取校正后的喷码区域的位置坐标;
根据喷码区域的位置信息,计算喷码的整体宽度,并从预先保存的喷码规则中获取喷码字符的个数,根据喷码的整体宽度和喷码字符的个数计算喷码的单字符宽度;
根据单字符宽度确定延申长度,根据延申长度将喷码区域的上下边界分别向外延申,并对上下边界的两个延申区域进行横线消除处理,最终获得延申后的边痕和喷码具有明显差异的喷码区域图像。
本实施例所述计算机可读存储介质包括但不限于为:ROM、RAM、磁盘或光盘等。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (12)

1.一种带有边痕的喷码识别方法,其特征在于,包括:
采集包装上的带有边痕的喷码图像;
对所述喷码图像中的喷码区域进行定位,获取所述喷码区域的位置信息,并根据所述喷码区域的位置信息,将所述喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
将所述喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中进行识别,获得与所述喷码区域图像对应的喷码字符串。
2.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:
对所述基于序列识别的神经网络模型进行训练,具体包括:
获取预先保存的字符类型、喷码规则、以及根据所述字符类型生成的单字符图像集;
根据所述喷码规则生成训练喷码字符串,依次从所述训练喷码字符串的每个字符所对应的单字符图像集中抽取该字符对应的图像,对每个字符所对应的图像进行拼接,得到所述训练喷码字符串对应的训练喷码图像,其中,所述训练喷码图像中包括带有边痕的喷码图像;
将所述训练喷码字符串和所述训练喷码图像输入所述基于序列识别的神经网络模型,对所述基于序列识别的神经网络模型进行训练,最终得到训练好的基于序列识别的神经网络模型。
3.根据权利要求2所述的方法,其特征在于,根据所述字符类型生成单字符图像集具体包括:
采集一定数量的包装上的喷码图像,其中,所述喷码图像中包括带有边痕的喷码图像;
对所述喷码图像中的喷码区域进行定位,获取所述喷码区域的位置信息,并根据所述喷码区域的位置信息,将所述喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
将所述喷码区域图像以字符为基准进行切割,得到单字符图像,并根据所述字符类型,将所述单字符图像进行分组,生成不同字符类型的单字符图像集。
4.根据权利要求3所述的方法,其特征在于,将所述喷码区域图像以字符为基准进行切割具体包括:
根据所述喷码规则计算所述喷码区域图像所包含的字符个数n,将所述喷码区域图像的水平方向分成n份,得到n-1个初始字符分界线;
根据用户操作将初始字符分界线移动至相邻的两个字符的中间区域,获得n-1条最终字符分界线;
根据所述最终字符分界线对所述喷码区域图像进行水平方向的切割,获取n个字符图像;
根据用户的输入获取所述n个字符图像所对应的n个字符,并将字符与字符图像进行关联。
5.根据权利要求1或3所述的方法,其特征在于,对所述喷码图像中的喷码区域进行定位,获取所述喷码区域的位置信息,并根据所述喷码区域的位置信息,将所述喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像具体包括:
对所述喷码图像中的喷码区域进行定位,并根据所述喷码区域的倾斜角度对所述喷码区域进行倾斜校正,获取校正后的所述喷码区域的位置坐标;
根据所述喷码区域的位置信息,计算喷码的整体宽度,并从预先保存的喷码规则中获取喷码字符的个数,根据所述喷码的整体宽度和所述喷码字符的个数计算喷码的单字符宽度;
根据所述单字符宽度确定延申长度,根据所述延申长度将所述喷码区域的上下边界分别向外延申,并对上下边界的两个延申区域进行横线消除处理,最终获得延申后的边痕和喷码具有明显差异的喷码区域图像。
6.一种带有边痕的喷码识别系统,其特征在于,包括:
采集模块,用于采集包装上的带有边痕的喷码图像;
处理模块,用于对所述喷码图像中的喷码区域进行定位,获取所述喷码区域的位置信息,并根据所述喷码区域的位置信息,将所述喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
识别模块,用于将所述喷码区域图像输入到预先训练好的基于序列识别的神经网络模型中进行识别,获得与所述喷码区域图像对应的喷码字符串。
7.根据权利要求6所述的系统,其特征在于,所述识别模块进一步包括:
训练子模块,用于对所述基于序列识别的神经网络模型进行训练,所述训练子模块具体用于:
获取预先保存的字符类型、喷码规则、以及根据所述字符类型生成的单字符图像集;
根据所述喷码规则生成训练喷码字符串,依次从所述训练喷码字符串的每个字符所对应的单字符图像集中抽取该字符对应的图像,对每个字符所对应的图像进行拼接,得到所述训练喷码字符串对应的训练喷码图像,其中,所述训练喷码图像中包括带有边痕的喷码图像;
将所述训练喷码字符串和所述训练喷码图像输入所述基于序列识别的神经网络模型,对所述基于序列识别的神经网络模型进行训练,最终得到训练好的基于序列识别的神经网络模型。
8.根据权利要求7所述的系统,其特征在于,所述训练子模块具体用于:
采集一定数量的包装上的喷码图像,其中,所述喷码图像中包括带有边痕的喷码图像;
对所述喷码图像中的喷码区域进行定位,获取所述喷码区域的位置信息,并根据所述喷码区域的位置信息,将所述喷码区域的上下边界进行扩展,获得边痕和喷码具有明显差异的喷码区域图像;
将所述喷码区域图像以字符为基准进行切割,得到单字符图像,并根据所述字符类型,将所述单字符图像进行分组,生成不同字符类型的单字符图像集。
9.根据权利要求8所述的系统,其特征在于,所述训练子模块具体用于:
根据所述喷码规则计算所述喷码区域图像所包含的字符个数n,将所述喷码区域图像的水平方向分成n份,得到n-1个初始字符分界线;
根据用户操作将初始字符分界线移动至相邻的两个字符的中间区域,获得n-1条最终字符分界线;
根据所述最终字符分界线对所述喷码区域图像进行水平方向的切割,获取n个字符图像;
根据用户的输入获取所述n个字符图像所对应的n个字符,并将字符与字符图像进行关联。
10.根据权利要求6或8所述的方法,其特征在于,所述处理模块和所述训练子模块具体用于:
对所述喷码图像中的喷码区域进行定位,并根据所述喷码区域的倾斜角度对所述喷码区域进行倾斜校正,获取校正后的所述喷码区域的位置坐标;
根据所述喷码区域的位置信息,计算喷码的整体宽度,并从预先保存的喷码规则中获取喷码字符的个数,根据所述喷码的整体宽度和所述喷码字符的个数计算喷码的单字符宽度;
根据所述单字符宽度确定延申长度,根据所述延申长度将所述喷码区域的上下边界分别向外延申,并对上下边界的两个延申区域进行横线消除处理,最终获得延申后的边痕和喷码具有明显差异的喷码区域图像。
11.一种带有边痕的喷码识别装置,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的带有边痕的喷码识别方法的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如权利要求1至5中任一项所述的带有边痕的喷码识别方法的步骤。
CN202011006929.7A 2020-09-23 2020-09-23 带有边痕的喷码识别方法及系统 Pending CN112149668A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011006929.7A CN112149668A (zh) 2020-09-23 2020-09-23 带有边痕的喷码识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011006929.7A CN112149668A (zh) 2020-09-23 2020-09-23 带有边痕的喷码识别方法及系统

Publications (1)

Publication Number Publication Date
CN112149668A true CN112149668A (zh) 2020-12-29

Family

ID=73897822

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011006929.7A Pending CN112149668A (zh) 2020-09-23 2020-09-23 带有边痕的喷码识别方法及系统

Country Status (1)

Country Link
CN (1) CN112149668A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596166A (zh) * 2018-04-13 2018-09-28 华南师范大学 一种基于卷积神经网络分类的集装箱箱号识别方法
CN108932533A (zh) * 2018-07-12 2018-12-04 北京木瓜移动科技股份有限公司 识别模型构建方法及装置、字符识别方法及装置
CN109165538A (zh) * 2018-07-18 2019-01-08 北京飞搜科技有限公司 基于深度神经网络的条形码检测方法及装置
CN109724990A (zh) * 2019-01-08 2019-05-07 上海大学 一种包装盒标签中喷码区域的快速定位与检测方法
CN109871938A (zh) * 2019-01-21 2019-06-11 重庆大学 一种基于卷积神经网络的零部件喷码检测方法
CN111274961A (zh) * 2020-01-20 2020-06-12 华南理工大学 一种柔性ic基板字符识别和信息解析方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596166A (zh) * 2018-04-13 2018-09-28 华南师范大学 一种基于卷积神经网络分类的集装箱箱号识别方法
CN108932533A (zh) * 2018-07-12 2018-12-04 北京木瓜移动科技股份有限公司 识别模型构建方法及装置、字符识别方法及装置
CN109165538A (zh) * 2018-07-18 2019-01-08 北京飞搜科技有限公司 基于深度神经网络的条形码检测方法及装置
CN109724990A (zh) * 2019-01-08 2019-05-07 上海大学 一种包装盒标签中喷码区域的快速定位与检测方法
CN109871938A (zh) * 2019-01-21 2019-06-11 重庆大学 一种基于卷积神经网络的零部件喷码检测方法
CN111274961A (zh) * 2020-01-20 2020-06-12 华南理工大学 一种柔性ic基板字符识别和信息解析方法

Similar Documents

Publication Publication Date Title
CN110930297B (zh) 人脸图像的风格迁移方法、装置、电子设备及存储介质
CN109711268B (zh) 一种人脸图像筛选方法及设备
WO2018086233A1 (zh) 一种字符分割方法和装置、及元件检测方法和装置
CN112085024A (zh) 一种罐表面字符识别方法
CN110490190B (zh) 一种结构化图像文字识别方法及系统
CN107862234A (zh) 一种彩色条形码的识别方法、电子设备及存储介质
CN108596137A (zh) 一种基于图像识别算法的商品扫描录入方法
CN111461133B (zh) 快递面单品名识别方法、装置、设备及存储介质
CN111310746A (zh) 文本行检测方法、模型训练方法、装置、服务器及介质
CN109741273A (zh) 一种手机拍照低质图像的自动处理与评分方法
CN113012783A (zh) 药品复核方法、装置、计算机设备及存储介质
CN110414517B (zh) 一种用于配合拍照场景的快速高精度身份证文本识别算法
CN107066939A (zh) 一种网上阅卷系统的试卷切割处理方法
CN112149668A (zh) 带有边痕的喷码识别方法及系统
CN111274863B (zh) 一种基于文本山峰概率密度的文本预测方法
CN115249362B (zh) 基于像素在稳定方向上连通性的ocr表格识别方法及系统
CN109886780B (zh) 基于眼球跟踪的商品目标检测方法及装置
CN111079742A (zh) 一种扫描试卷中作文区域图像文本块精准定位方法
CN112329774B (zh) 基于图像的商品尺码表自动生成方法
CN114241486A (zh) 一种提高识别试卷学生信息准确率的方法
CN112288372B (zh) 一种可同时识别一维条码和三段码字符的快递单识别方法
CN107045635A (zh) 一种网上阅卷系统的试卷图像分页分题处理方法
CN107688812A (zh) 一种基于机器视觉的食品生产日期喷墨字体修复方法
CN107067009A (zh) 一种实时杆号识别方法
CN108734167B (zh) 一种被污染的胶片文字识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination