CN115880362A - 码区定位方法、装置、计算机设备及计算机可读存储介质 - Google Patents

码区定位方法、装置、计算机设备及计算机可读存储介质 Download PDF

Info

Publication number
CN115880362A
CN115880362A CN202211654040.9A CN202211654040A CN115880362A CN 115880362 A CN115880362 A CN 115880362A CN 202211654040 A CN202211654040 A CN 202211654040A CN 115880362 A CN115880362 A CN 115880362A
Authority
CN
China
Prior art keywords
code
image
gradient
identified
image block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211654040.9A
Other languages
English (en)
Other versions
CN115880362B (zh
Inventor
陈思远
吕江波
刘枢
沈小勇
叶小奇
莫宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Smartmore Technology Co Ltd
Original Assignee
Shenzhen Smartmore Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Smartmore Technology Co Ltd filed Critical Shenzhen Smartmore Technology Co Ltd
Priority to CN202211654040.9A priority Critical patent/CN115880362B/zh
Publication of CN115880362A publication Critical patent/CN115880362A/zh
Application granted granted Critical
Publication of CN115880362B publication Critical patent/CN115880362B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本申请涉及一种码区定位方法、装置、计算机设备及计算机可读存储介质。方法包括:获得待识别码图切分得到的各个图像块的梯度信息和梯度方向信息;根据各个图像块的梯度信息和梯度方向信息,确定各个图像块对应的方差特征;根据各个图像块对应的方差特征,对各个图像块进行分类处理,得到对应的类别为码区的一个或多个目标图像块;对一个或多个目标图像块进行聚类处理,得到待识别码图中的码区位置。采用本方法,能够提高图像中码区的定位准确率。

Description

码区定位方法、装置、计算机设备及计算机可读存储介质
技术领域
本申请涉及码区定位技术领域,特别是涉及一种码区定位方法、装置、计算机设备及计算机可读存储介质。
背景技术
DMP(Direct Part Mark)是一种特殊的标识制作技术,能够直接在零部件表面上做标识,而不需要纸张、标签一类的标识载体。例如,通过喷墨生成的表面印刷DPM码,通过激光、刻蚀或点刻方式生成的侵入式DPM码(dot-peen)。由于零部件的材质品类繁多,使得零部件上呈现的DPM码经常质量不一。
传统技术中,常通过图像二值化方法提取出扫描的图像中的码区。但是,图像二值化方法容易被图像中的点状噪声干扰,使得这种方法对扫描得到的图像质量要求较高,而实际场景中二维码、条码或DPM码会随着使用次数的增加使码区磨损,导致该方法对实际场景中扫描得到的图像中的码区定位准确率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种码区定位方法、装置、计算机设备、计算机可读存储介质及计算机程序产品,能够实现提高图像中的码区定位的准确率。
第一方面,本申请提供了一种码区定位方法,包括:
获得待识别码图切分得到的各个图像块的梯度信息和梯度方向信息;
根据各个图像块的梯度信息和梯度方向信息,确定各个图像块对应的方差特征;
根据各个图像块对应的方差特征,对各个图像块进行分类处理,得到对应的类别为码区的一个或多个目标图像块;
对一个或多个目标图像块进行聚类处理,得到待识别码图中的码区位置。
第二方面,本申请还提供了一种码区定位装置,包括:
获得模块,用于获得待识别码图切分得到的各个图像块的梯度信息和梯度方向信息;
确定模块,用于根据各个图像块的梯度信息和梯度方向信息,确定各个图像块对应的方差特征;
分类模块,用于根据各个图像块对应的方差特征,对各个图像块进行分类处理,得到对应的类别为码区的一个或多个目标图像块;
聚类模块,用于对一个或多个目标图像块进行聚类处理,得到待识别码图中的码区位置。
第三方面,本申请还提供了一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,该处理器执行计算机程序时实现上述的码区定位方法中的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的码区定位方法中的步骤。
第五方面,本申请还提供了一种计算机程序产品,计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述的码区定位方法中的步骤。
上述码区定位方法、装置、计算机设备及计算机可读存储介质,根据待识别码图切分得到的各个图像块的梯度信息和梯度方向信息,确定各个图像块对应的方差特征;进而根据各个图像块对应的方差特征,对各个图像块进行分类处理,得到对应的类别为码区的一个或多个目标图像块,避免了光照对图像块的影响,提高了待识别码图中码区定位的准确率,并通过对类别为码区的一个或多个目标图像块进一步聚类得出码区位置,而非从整个待识别码图中聚类得出,不仅能够提高数据处理效率,还能进一步提高待识别码图中的码区位置的定位准确率。
附图说明
图1为本申请实施例提供的第一种码区定位方法的流程示意图;
图2为本申请实施例提供的一种对待识别码图进行网格切分的示意图;
图3为本申请实施例提供的一种对待识别码图进行粗定位处理和图片剪裁处理步骤的流程示意图;
图4为本申请实施例提供的第二种码区定位方法的流程示意图;
图5为本申请实施例提供的第三种码区定位方法的流程示意图;
图6为本申请实施例提供的一种码区定位装置的结构框图;
图7为本申请实施例提供的一种计算机设备的内部结构图;
图8为本申请实施例提供的一种计算机可读存储介质的内部结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一些实施例中,如图1所示,提供了一种码区定位方法,本实施例以该方法应用于计算机设备进行举例说明,在实际应用中,该计算机设备可以是终端。可以理解的是,该方法也可以应用于服务器,还可以应用于包括计算机设备和服务器的系统,并通过计算机设备和服务器的交互实现。例如,待识别码图可以是预先存储在计算机设备中的,也可以是计算机设备扫描得到的,还可以是计算机设备发送到服务器中的。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。本实施例中,该方法包括以下步骤:
步骤S101,获得待识别码图切分得到的各个图像块的梯度信息和梯度方向信息。
其中,待识别码图是指需要定位出码区位置的图像。图像块是指从待识别码图中切分出的部分图像。梯度信息是指描述待识别码图中的像素在其邻域内的变化的数据;例如,梯度信息可以是梯度图。梯度方向信息是指描述待识别码图的梯度在标量场上的增长方向的数据;例如,梯度方向信息可以是梯度方向图。
具体地,计算机设备扫描物品上的码图,得到待识别码图;进而计算机设备利用梯度算子计算待识别码图中各个像素的初始梯度信息和初始梯度方向信息。此外,计算机设备还可以对待识别码图进行重叠切分,得到多个图像块,进而根据待识别码图中各个像素的初始梯度信息和初始梯度方向信息,分别确定各个图像块的梯度信息和梯度方向信息。
步骤S102,根据各个图像块的梯度信息和梯度方向信息,确定各个图像块对应的方差特征。
其中,方差特征是指图像块的方向梯度上的方差信息。需要说明的是,由于码区内像素点的明暗变化较多,使得图像中码区与背景的方差特征的差异较为鲜明,因而可以将方差特征作为区分图像中的码区与背景的一项因素。码区是指待识别码图中展示有编码数据的区域。背景是指与码区无关的环境图像,例如,背景可以是计算机设备扫描码区时一并扫描得到的环境背景。
步骤S103,根据各个图像块对应的方差特征,对各个图像块进行分类处理,得到对应的类别为码区的一个或多个目标图像块。
其中,目标图像块是指用于进行码区位置的定位处理的图像块。
具体地,计算机设备通过各个图像块的梯度信息和梯度方向信息,分别计算得到各个图像块的方差特征;进而计算机设备根据各个图像块的方差特征,将图像块分为“码区”和“背景”两类,将类别被标记为码区的一个或多个图像块作为目标图像块。
步骤S104,对一个或多个目标图像块进行聚类处理,得到待识别码图中的码区位置。
其中,码区位置是指描述待识别码图中码区的位置信息。
具体地,在对应的类别为码区的一个或多个目标图像块中,与码区相关的像素占多数,因而计算机设备可以对一个或多个目标图像块中的像素进行聚类处理,聚类处理后得到至少两个像素簇群,根据各个像素簇群的数量,从至少两个像素簇群中确定出待识别码图中的码区位置。
上述码区定位方法中,根据待识别码图切分得到的各个图像块的梯度信息和梯度方向信息,确定各个图像块对应的方差特征;进而根据各个图像块对应的方差特征,对各个图像块进行分类处理,得到对应的类别为码区的一个或多个目标图像块,避免了光照对图像块的影响,提高了待识别码图中码区的定位准确率,并通过对类别为码区的一个或多个目标图像块进一步聚类得出码区位置,而非从整个待识别码图中聚类得出,不仅提高了数据处理效率,还进一步提高了待识别码图中的码区位置的定位准确率。
在一些实施例中,上述步骤S101,获得待识别码图切分得到的各个图像块的梯度信息和梯度方向信息,具体包括如下内容:
对获取的待识别码图进行切分处理,得到待识别码图对应的多个图像块;其中,多个图像块中满足预设条件的两个图像块之间存在重叠部分;
根据待识别码图的初始梯度信息和初始梯度方向信息,分别确定各个图像块的梯度信息和梯度方向信息;其中,初始梯度信息和初始梯度方向信息是对待识别码图的横向梯度幅值和纵向梯度幅值分别处理得到的。
其中,横向梯度幅值是指待识别码图中的像素在x轴方向上的梯度幅值。纵向梯度幅值是指待识别码图中的像素在y轴方向上的梯度幅值。预设条件可以是在待识别码图上处于横向相邻或纵向相邻。
具体地,在获取到待识别码图的初始梯度方向信息和初始梯度方向信息之后,计算机设备首先获取网格切分的预设滑动窗口尺寸和预设步长,然后按照预设滑动窗口尺寸和预设步长,对待识别码图进行网格切分,即对待识别码图的初始梯度信息和初始梯度方向信息也同样进行网格切分,得到待识别码图对应的多个图像块,以及各个图像块的梯度信息和梯度方向信息。其中,预设步长可以设置为预设滑动窗口尺寸的一半,使得在待识别码图上处于横向相邻或纵向相邻的图像块两两之间存在重叠部分。
在实际应用中,图2为对待识别码图进行网格切分的示意图,计算机设备计算得到待识别码图的梯度图和梯度方向图之后,计算机设备可以采用尺寸为32*32的滑动窗口,按照步长为16对梯度图和梯度方向图进行切分,如图2所示,由于步长为滑动窗口的一半,所以相邻滑动窗口之间存在重叠。
本实施例中,通过对获取的待识别码图进行切分处理,得到相邻之间存在重叠部分的多个图像块;进而根据待识别码图的初始梯度信息和初始梯度方向信息,分别确定各个图像块的梯度信息和梯度方向信息,通过重叠的滑动窗口进行切分能够减少边缘码区被漏掉,从而提高了图像中边缘码区的定位效果。
在一些实施例中,在根据待识别码图的初始梯度信息和初始梯度方向信息,分别确定各个图像块的梯度信息和梯度方向信息之前,该方法还包括:
通过梯度算子,分别对待识别码图的横向和纵向进行梯度处理,得到待识别码图的横向梯度幅值和纵向梯度幅值;
对横向梯度幅值和纵向梯度幅值进行平方根处理,得到初始梯度信息;
对横向梯度幅值和纵向梯度幅值进行反正切处理,得到初始梯度方向信息。
其中,梯度算子是指用于求取待识别码图的梯度相关数据的算子。例如,梯度算子可以但不限于是Sobel算子、Robot算子和Prewitt算子。
具体地,计算机设备通过梯度算子,对待识别码图的横向进行梯度处理,得到待识别码图的横向梯度幅值;并对待识别码图的纵向进行梯度处理,得到待识别码图的纵向梯度幅值;进而计算机设备通过对横向梯度幅值和纵向梯度幅值进行平方根处理,得到初始梯度信息。初始梯度信息grad可以通过如下公式计算得到:
Figure 33126DEST_PATH_IMAGE002
其中,G x 表示横向梯度幅值;G y 表示纵向梯度幅值。
计算机设备通过对横向梯度幅值和纵向梯度幅值进行反正切处理,得到初始梯度方向信息。初始梯度方向信息可以通过如下公式计算得到:
Figure 257171DEST_PATH_IMAGE004
在本实施例中,通过梯度算子,对待识别码图的横向和纵向分别进行梯度处理,得到待识别码图的横向梯度幅值和纵向梯度幅值;对横向梯度幅值和纵向梯度幅值进行平方根处理,得到初始梯度信息;对横向梯度幅值和纵向梯度幅值进行反正切处理,得到初始梯度方向信息,实现了待识别码图的初始梯度信息和初始梯度方向信息的合理获取,进而以初始梯度信息和初始梯度方向信息为依据执行后续的码区定位步骤,能够避免场景中的光照因素对码区定位的影响。
在一些实施例中,上述步骤S102,根据各个图像块的梯度信息和梯度方向信息,确定各个图像块对应的方差特征,具体包括如下内容:
根据各个图像块的梯度信息和梯度方向信息,对各个图像块中的像素的梯度信息进行梯度方向统计,得到各个图像块对应的方向梯度直方图;
对各个图像块对应的方向梯度直方图进行方差估计,确定各个图像块对应的方差特征。
其中,方向梯度直方图用于描述图像块梯度的方向信息的统计值。
具体地,计算机设备通过统计各个图像块中的像素的梯度信息和梯度方向信息,得到各个图像块对应的方向梯度直方图;通过对各个图像块对应的方向梯度直方图进行方差估计,确定各个图像块对应的方差特征。
在本实施例中,通过各个图像块中的像素的梯度信息和梯度方向信息来得到方向梯度直方图,进而利用方向梯度直方图来获取方差特征,无需利用像素的颜色值,避免了场景中光照因素的影响,有利于提高图像中码区位置的定位效果。
在一些实施例中,上述步骤S103,根据各个图像块对应的方差特征,对各个图像块进行分类处理,得到对应的类别为码区的一个或多个目标图像块,具体包括如下内容:
将各个图像块对应的方差特征与预设方差阈值进行比较处理,得到各个图像块的方差比较结果;
在方差比较结果为图像块对应的方差特征大于预设方差阈值的情况下,将图像块的类别标记为码区,以得到对应的类别为码区的一个或多个目标图像块。
具体地,计算机设备获取预设方差阈值,然后计算机设备将各个图像块的对应的方差特征与预设方差阈值进行比较处理;在方差比较结果为该图像块对应的方差特征大于预设方差阈值的情况下,将该图像块的类别标记为码区,并将图像块作为目标图像块;在方差比较结果为图像块对应的方差特征小于预设方差阈值的情况下,将图像块的类别标记为背景。
在本实施例中,通过将各个图像块对应的方差特征与预设方差阈值进行比较处理,得到各个图像块的方差比较结果,实现了图像块的合理分类,能够将类别为码区的目标图像块作为处理依据来执行后续码区定位步骤,而非使用所有图像块来进行码区定位,不仅提高了码区定位效率,还能够提高码区定位的准确率。
在一些实施例中,上述步骤S104,对一个或多个目标图像块进行聚类处理,得到待识别码图中的码区位置,具体包括如下内容:
对一个或多个目标图像块进行聚类处理,得到一个或多个目标图像块对应的多个像素簇群;
分别对多个像素簇群进行像素统计处理,得到各个像素簇群的像素数量,并确定多个像素簇群中像素数量最多的目标像素簇群;
根据目标像素簇群中的像素,确定待识别码图中的码区位置。
其中,像素簇群是指由目标图像块中像素聚类后得到的簇群。目标像素簇群是指定位得到的码区所在的簇群。
具体地,计算机设备可以将一个或多个目标图像块聚类为预设数量的像素簇群,例如,计算机设备将一个或多个目标图像块聚类为2个像素簇群;计算机设备还可以通过自适应聚类算法,无需预先设置需聚类得到的像素簇群的数量,通过自适应聚类算法,得到一个或多个目标图像块对应的多个像素簇群;分别统计各个像素簇群中像素的数量,得到各个像素簇群的像素数量,并将像素数量最多像素簇群作为目标像素簇群;根据目标像素簇群中各个像素的位置,确定待识别码图中的码区位置。
在本实施例中,通过对一个或多个目标图像块进行聚类处理,得到一个或多个目标图像块对应的多个像素簇群;进而将多个像素簇群中像素数量最多的作为目标像素簇群;最后根据目标像素簇群中的像素,确定待识别码图中的码区位置,通过对类别为码区的目标图像块进一步聚类得出码区位置,而非从待识别码图的所有图像块中聚类得出,不仅提高了数据处理效率,还进一步提高了待识别码图中的码区位置的定位准确率。
在一些实施例中,如图3所示,在对一个或多个目标图像块进行聚类处理,得到待识别码图中的码区位置之后,该方法还包括对待识别码图进行粗定位处理和图片剪裁处理,具体包括如下内容:
步骤S301,对码区位置进行码区提取处理,得到码区位置对应的外包矩形框。
其中,外包矩形框指令是指能够提取出码区位置的外包矩形框的程序指令。
步骤S302,获得外包矩形框的顶点坐标。
步骤S303,根据顶点坐标,对待识别码图进行粗定位处理和图片剪裁处理,得到待识别码图中的目标码图。
在上述步骤S104中获取到待识别码图中的码区位置后,计算机设备还可以对码区位置的形状进一步优化。具体地,计算机设备可以通过外包矩形框指令从待识别码图中的码区位置中提取出码区位置对应的外包矩形框;获得外包矩形框的顶点坐标;通过顶点坐标,对待识别码图进行粗定位处理,得到待识别码图中目标码图的码区位置;根据目标码图的码区位置,对待识别码图进行图片剪裁处理,得到待识别码图中的目标码图。
需要说明的是,上述步骤S104中获取到待识别码图中的码区位置为待识别码图中码区的精确定位,但是由于各个待识别码图的拍摄角度存在不同,各个待识别码图对应的原物品上展示码图的表面平整度也存在不同,原物品表面展示的码图的完整度可能也不同,导致待识别码图中码区位置多数为不规则形状,不适合直接将该码区位置用于后续其他的图像处理中的,例如码区解码等。因此,可以通过对待识别码图中的目标码图进行粗定位,使得到的目标码图的码区位置较为规整,以便于增强后续其他的图像处理的处理效果。
在本实施例中,通过外包矩形框指令从待识别码图中的码区位置中提取得到码区位置对应的外包矩形框;获得外包矩形框的顶点坐标;根据顶点坐标,对待识别码图进行粗定位处理和图片剪裁处理,得到待识别码图中的目标码图,不仅实现了对待识别码图中的码区位置的规整优化,提高了后续的其他图像处理的处理效果,还实现了目标码图的裁剪和获取。
在一些实施例中,如图4所示,提供了另一种码区定位方法,以该方法应用于计算机设备为例进行说明,包括以下步骤:
步骤S401,对获取的待识别码图进行切分处理,得到待识别码图对应的多个图像块;其中,多个图像块中满足预设条件的两个图像块之间存在重叠部分。
步骤S402,通过梯度算子,分别对待识别码图的横向和纵向进行梯度处理,得到待识别码图的横向梯度幅值和纵向梯度幅值。
步骤S403,对横向梯度幅值和纵向梯度幅值进行平方根处理,得到初始梯度信息。
步骤S404,对横向梯度幅值和纵向梯度幅值进行反正切处理,得到初始梯度方向信息。
步骤S405,根据待识别码图的初始梯度信息和初始梯度方向信息,分别确定各个图像块的梯度信息和梯度方向信息。
步骤S406,根据各个图像块的梯度信息和梯度方向信息,对各个图像块中的像素的梯度信息进行梯度方向统计,得到各个图像块对应的方向梯度直方图;对各个图像块对应的方向梯度直方图进行方差估计,确定各个图像块对应的方差特征。
步骤S407,将各个图像块对应的方差特征与预设方差阈值进行比较处理,得到各个图像块的方差比较结果。
步骤S408,在方差比较结果为图像块对应的方差特征大于预设方差阈值的情况下,将图像块的类别标记为码区,以得到对应的类别为码区的一个或多个目标图像块。
步骤S409,对一个或多个目标图像块进行聚类处理,得到一个或多个目标图像块对应的多个像素簇群;分别对多个像素簇群进行像素统计处理,得到各个像素簇群的像素数量,并确定多个像素簇群中像素数量最多的目标像素簇群。
步骤S410,根据目标像素簇群中的像素,确定待识别码图中的码区位置。
上述码区定位方法,能够实现以下有益效果:通过梯度信息和梯度方向信息来对待识别码图的图像块进行分类,避免了光照对图像块的影响,提高了待识别码图中码区定位的准确率,并通过对类别为码区的目标图像块进一步聚类得出码区位置,而非从整个待识别码图中聚类得出,不仅能够提高数据处理效率,还能进一步提高待识别码图中的码区位置的定位准确率。
为了更清晰阐明本公开实施例提供的码区定位方法,以下以一个具体的实施例对上述码区定位方法进行具体说明。如图5所示,提供了又一种码区定位方法,可以应用于计算机设备,具体包括如下内容:通过对目标物品上的Dot-peen码图进行图像采集,计算机设备获取到目标物品的待识别码图;计算机设备采用Sobel算子求取待识别码图的梯度图和梯度方向图;然后采用预设步长和预设滑动窗口对待识别码图进行切分,得到待识别码图对应的多个图像块,并将多个图像块存储至切片列表中;其中,预设步长的数值小于预设滑动窗口的尺寸。
计算机设备判断切片列表是否为空值;在检测到切片列表中图像块不为空的情况下,计算机设备从切片列表中取出图像块,然后根据该图像块的梯度图和梯度方向图求取该图像块的方向梯度直方图;根据该图像块的方向梯度直方图,得到该图像块的方差特征。计算机设备判断该图像块的方差特征是否大于预设方差阈值;在检测到该图像块的方差特征大于预设方差阈值的情况下,将该图像块标记为码区,并将该标记后的图像块存储至分类列表;在检测到该图像块的方差特征小于预设方差阈值的情况下,将该图像块标记为背景,并将该标记后的图像块存储至分类列表,重复上述步骤,即计算机设备不断从切片列表中取出图像块,不断往分类列表中存储标记后的图像块,直到计算机设备检测到切片列表中图像块为空。计算机设备将分类列表中标记为码区的图像块作为目标图像块,然后对分类列表中的目标图像块进行聚类,得到待识别码图的码区位置。
另外,计算机设备通过外包矩形框指令,对待识别码图中的码区位置进行码区提取处理,得到码区位置对应的外包矩形框。根据外包矩形框的顶点坐标,对待识别码图进行粗定位处理和图片剪裁处理,得到待识别码图中的目标码图。
在本实施例中,通过方向梯度直方图的方差特征对图像块进行分类,能够在复杂光照场景下定位到Dot-peen的码区位置,解决了传统技术中对光照敏感的局限性,提高了待识别码图中的码区位置的定位准确率。
应该理解的是,虽然如上述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种码区定位装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的码区定位装置实施例中的具体限定可以参见上文中对于码区定位方法的限定,在此不再赘述。
在一些实施例中,如图6示,提供了一种码区定位装置600,包括:
获得模块601,用于获得待识别码图切分得到的各个图像块的梯度信息和梯度方向信息;
确定模块602,用于根据各个图像块的梯度信息和梯度方向信息,确定各个图像块对应的方差特征;
分类模块603,用于根据各个图像块对应的方差特征,对各个图像块进行分类处理,得到对应的类别为码区的一个或多个目标图像块;
聚类模块604,用于对一个或多个目标图像块进行聚类处理,得到待识别码图中的码区位置。
在一些实施例中,在获得待识别码图切分得到的各个图像块的梯度信息和梯度方向信息方面,获得模块601具体用于:
对获取的待识别码图进行切分处理,得到待识别码图对应的多个图像块;其中,多个图像块中满足预设条件的两个图像块之间存在重叠部分;
根据待识别码图的初始梯度信息和初始梯度方向信息,分别确定各个图像块的梯度信息和梯度方向信息;其中,初始梯度信息和初始梯度方向信息是对待识别码图的横向梯度幅值和纵向梯度幅值分别处理得到的。
在一些实施例中,码区定位装置600还包括梯度处理模块,该梯度处理模块具体用于:
通过梯度算子,分别对待识别码图的横向和纵向进行梯度处理,得到待识别码图的横向梯度幅值和纵向梯度幅值;
对横向梯度幅值和纵向梯度幅值进行平方根处理,得到初始梯度信息;
对横向梯度幅值和纵向梯度幅值进行反正切处理,得到初始梯度方向信息。
在一些实施例中,在根据各个图像块的梯度信息和梯度方向信息,确定各个图像块对应的方差特征方面,确定模块602具体用于:
根据各个图像块的梯度信息和梯度方向信息,对各个图像块中的像素的梯度信息进行梯度方向统计,得到各个图像块对应的方向梯度直方图;
对各个图像块对应的方向梯度直方图进行方差估计,确定各个图像块对应的方差特征。
在一些实施例中,在根据各个图像块对应的方差特征,对各个图像块进行分类处理,得到对应的类别为码区的一个或多个目标图像块方面,分类模块603具体用于:
将各个图像块对应的方差特征与预设方差阈值进行比较处理,得到各个图像块的方差比较结果;
在方差比较结果为图像块对应的方差特征大于预设方差阈值的情况下,将图像块的类别标记为码区,以得到对应的类别为码区的一个或多个目标图像块。
在一些实施例中,在对一个或多个目标图像块进行聚类处理,得到待识别码图中的码区位置方面,聚类模块604具体用于:
对一个或多个目标图像块进行聚类处理,得到一个或多个目标图像块对应的多个像素簇群;
分别对多个像素簇群进行像素统计处理,得到各个像素簇群的像素数量,并确定多个像素簇群中像素数量最多的目标像素簇群;
根据目标像素簇群中的像素,确定待识别码图中的码区位置。
在一些实施例中,码区定位装置600还包括粗定位模块,该粗定位模块具体用于:
对码区位置进行码区提取处理,得到码区位置对应的外包矩形框;
获得外包矩形框的顶点坐标;
根据顶点坐标,对待识别码图进行粗定位处理和图片剪裁处理,得到待识别码图中的目标码图。
上述码区定位装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以以硬件形式内嵌于或独立于计算机设备中的处理器,也可以以软件形式存储于计算机设备中的存储器,以便于处理器调用执行以上各个模块对应的操作。
在一些实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元以及输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现上述的码区定位方法中的步骤。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一些实施例中,还提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一些实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。其内部结构可以如图8所示。
在一些实施例中,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(FerroelectricRandom Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(StaticRandom Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种码区定位方法,其特征在于,包括:
获得待识别码图切分得到的各个图像块的梯度信息和梯度方向信息;
根据所述各个图像块的梯度信息和梯度方向信息,确定所述各个图像块对应的方差特征;
根据所述各个图像块对应的方差特征,对所述各个图像块进行分类处理,得到对应的类别为码区的一个或多个目标图像块;
对所述一个或多个目标图像块进行聚类处理,得到所述待识别码图中的码区位置。
2.根据权利要求1所述的方法,其特征在于,所述获得待识别码图切分得到的各个图像块的梯度信息和梯度方向信息,包括:
对获取的待识别码图进行切分处理,得到所述待识别码图对应的多个图像块;其中,所述多个图像块中满足预设条件的两个图像块之间存在重叠部分;
根据所述待识别码图的初始梯度信息和初始梯度方向信息,分别确定各个图像块的梯度信息和梯度方向信息;其中,所述初始梯度信息和所述初始梯度方向信息是对所述待识别码图的横向梯度幅值和纵向梯度幅值分别处理得到的。
3.根据权利要求2所述的方法,其特征在于,在所述根据所述待识别码图的初始梯度信息和初始梯度方向信息,分别确定各个图像块的梯度信息和梯度方向信息之前,所述方法还包括:
通过梯度算子,分别对所述待识别码图的横向和纵向进行梯度处理,得到所述待识别码图的所述横向梯度幅值和所述纵向梯度幅值;
对所述横向梯度幅值和所述纵向梯度幅值进行平方根处理,得到所述初始梯度信息;
对所述横向梯度幅值和所述纵向梯度幅值进行反正切处理,得到所述初始梯度方向信息。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述各个图像块的梯度信息和梯度方向信息,确定所述各个图像块对应的方差特征,包括:
根据所述各个图像块的梯度信息和梯度方向信息,对所述各个图像块中的像素的梯度信息进行梯度方向统计,得到所述各个图像块对应的方向梯度直方图;
对所述各个图像块对应的方向梯度直方图进行方差估计,得到所述各个图像块对应的方差特征。
5.根据权利要求4所述的方法,其特征在于,所述根据所述各个图像块对应的方差特征,对所述各个图像块进行分类处理,得到对应的类别为码区的一个或多个目标图像块,包括:
将所述各个图像块对应的方差特征与预设方差阈值进行比较处理,得到所述各个图像块的方差比较结果;
在所述方差比较结果为所述图像块对应的方差特征大于所述预设方差阈值的情况下,将所述图像块的类别标记为码区,以得到对应的类别为码区的一个或多个目标图像块。
6.根据权利要求5所述的方法,其特征在于,所述对所述一个或多个目标图像块进行聚类处理,得到所述待识别码图中的码区位置,包括:
对所述一个或多个目标图像块进行聚类处理,得到所述一个或多个目标图像块对应的多个像素簇群;
分别对所述多个像素簇群进行像素统计处理,得到各个所述像素簇群的像素数量,并确定所述多个像素簇群中像素数量最多的目标像素簇群;
根据所述目标像素簇群中的像素,确定所述待识别码图中的码区位置。
7.根据权利要求1至3任意一项所述的方法,其特征在于,在所述对所述一个或多个目标图像块进行聚类处理,得到所述待识别码图中的码区位置之后,所述方法还包括:
对所述码区位置进行码区提取处理,得到所述码区位置对应的外包矩形框;
获得所述外包矩形框的顶点坐标;
根据所述顶点坐标,对所述待识别码图进行粗定位处理和图片剪裁处理,得到所述待识别码图中的目标码图。
8.一种码区定位装置,其特征在于,包括:
获得模块,用于获得待识别码图切分得到的各个图像块的梯度信息和梯度方向信息;
确定模块,用于根据所述各个图像块的梯度信息和梯度方向信息,确定所述各个图像块对应的方差特征;
分类模块,用于根据所述各个图像块对应的方差特征,对所述各个图像块进行分类处理,得到对应的类别为码区的一个或多个目标图像块;
聚类模块,用于对所述一个或多个目标图像块进行聚类处理,得到所述待识别码图中的码区位置。
9.一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202211654040.9A 2022-12-22 2022-12-22 码区定位方法、装置、计算机设备及计算机可读存储介质 Active CN115880362B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211654040.9A CN115880362B (zh) 2022-12-22 2022-12-22 码区定位方法、装置、计算机设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211654040.9A CN115880362B (zh) 2022-12-22 2022-12-22 码区定位方法、装置、计算机设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN115880362A true CN115880362A (zh) 2023-03-31
CN115880362B CN115880362B (zh) 2023-08-08

Family

ID=85755338

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211654040.9A Active CN115880362B (zh) 2022-12-22 2022-12-22 码区定位方法、装置、计算机设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN115880362B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116822549A (zh) * 2023-08-30 2023-09-29 北京紫光青藤微系统有限公司 用于离散dpm码区域的定位方法及装置、图像处理设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106981055A (zh) * 2017-03-30 2017-07-25 西安交通大学 一种iccd图像去噪方法
CN110490020A (zh) * 2019-07-31 2019-11-22 珠海市杰理科技股份有限公司 条码识别方法、装置、计算机设备和存储介质
CN111027343A (zh) * 2019-12-12 2020-04-17 中科微至智能制造科技江苏有限公司 条形码区域定位方法和装置
US20200302135A1 (en) * 2019-03-19 2020-09-24 Sasken Technologies Ltd Method and apparatus for localization of one-dimensional barcodes
CN113705268A (zh) * 2021-08-30 2021-11-26 山东大学 一种二维码定位方法及系统
WO2022237811A1 (zh) * 2021-05-11 2022-11-17 北京字跳网络技术有限公司 图像处理方法、装置及设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106981055A (zh) * 2017-03-30 2017-07-25 西安交通大学 一种iccd图像去噪方法
US20200302135A1 (en) * 2019-03-19 2020-09-24 Sasken Technologies Ltd Method and apparatus for localization of one-dimensional barcodes
CN110490020A (zh) * 2019-07-31 2019-11-22 珠海市杰理科技股份有限公司 条码识别方法、装置、计算机设备和存储介质
CN111027343A (zh) * 2019-12-12 2020-04-17 中科微至智能制造科技江苏有限公司 条形码区域定位方法和装置
WO2022237811A1 (zh) * 2021-05-11 2022-11-17 北京字跳网络技术有限公司 图像处理方法、装置及设备
CN113705268A (zh) * 2021-08-30 2021-11-26 山东大学 一种二维码定位方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BAOXI YUAN ET AL.: "Fast QR code detection based on BING and AdaBoost-SVM", 《2019 IEEE 20TH INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE SWITCHING AND ROUTING (HPSR)》, pages 1 - 6 *
郭改放 等: "基于边缘和水平集的复杂背景金属零件 二维条码精确定位方法", 《上海交通大学学报》, vol. 51, no. 1, pages 90 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116822549A (zh) * 2023-08-30 2023-09-29 北京紫光青藤微系统有限公司 用于离散dpm码区域的定位方法及装置、图像处理设备
CN116822549B (zh) * 2023-08-30 2023-12-22 北京紫光青藤微系统有限公司 用于离散dpm码区域的定位方法及装置、图像处理设备

Also Published As

Publication number Publication date
CN115880362B (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
CN111259889A (zh) 图像文本识别方法、装置、计算机设备及计算机存储介质
CN110738125A (zh) 利用Mask R-CNN选择检测框的方法、装置及存储介质
US20190340744A1 (en) Image processing method, terminal and storge medium
CN108229232B (zh) 批量扫描二维码的方法和批量扫描二维码的装置
US20180253852A1 (en) Method and device for locating image edge in natural background
CN115239644B (zh) 混凝土缺陷识别方法、装置、计算机设备和存储介质
CN115880362B (zh) 码区定位方法、装置、计算机设备及计算机可读存储介质
CN114241358A (zh) 基于数字孪生变电站的设备状态展示方法、装置和设备
CN112651953A (zh) 图片相似度计算方法、装置、计算机设备及存储介质
CN110991201B (zh) 条码检测方法及相关装置
CN115759148A (zh) 图像处理方法、装置、计算机设备及计算机可读存储介质
CN110807342B (zh) 条形码定位方法、装置、计算机设备和存储介质
CN113378837A (zh) 车牌遮挡识别方法、装置、电子设备和存储介质
CN116051811B (zh) 区域识别方法、装置、计算机设备及计算机可读存储介质
CN116596935A (zh) 形变检测方法、装置、计算机设备及计算机可读存储介质
CN115908363A (zh) 肿瘤细胞统计方法、装置、设备和存储介质
CN115063473A (zh) 物体高度的检测方法、装置、计算机设备、存储介质
CN115731442A (zh) 图像处理方法、装置、计算机设备和存储介质
CN116091998A (zh) 图像处理方法、装置、计算机设备和存储介质
CN114511862A (zh) 表格识别方法、装置及电子设备
CN117437654B (zh) 一种基于语义识别的栅格地图解析方法、设备和介质
CN117274366B (zh) 线条边距确定方法和装置
CN116612474B (zh) 对象检测方法、装置、计算机设备及计算机可读存储介质
CN116798056B (zh) 表格图像定位方法、装置、设备、计算机可读存储介质
CN116452702B (zh) 信息图表快速设计方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant