发明内容
本申请提供一种标识码位置定位模型的训练及定位方法、装置、电子设备,以克服定位标识码的位置的精准度较低的问题。
第一方面,本申请提供一种标识码位置定位模型的训练方法,所述方法包括:
获取目标样本图像集;所述目标样本图像集中包括:对印刷有至少一个标识码的印刷纸张进行图像采集得到的样本图像;
基于所述目标样本图像集中的样本图像,对标识码位置定位模型进行N轮训练,得到训练好的标识码位置定位模型;其中,所述标识码位置定位模型包括:第一预设数量的卷积层,以及,第二预设数量的空洞卷积层;所述第一预设数量大于所述第二预设数量;所述第二预设数量的空洞卷积层穿插在所述第一预设数量的卷积层中;所述N为大于或等于1的整数,所述标识码位置定位模型用于识别标识码在图像中的位置,所述卷积层和所述空洞卷积层均用于提取与标识码在图像中的位置相关的特征。
可选的,所述基于所述目标样本图像集中的样本图像,对所述标识码位置定位模型进行训练,包括:
针对第i轮训练,从所述第一预设数量的卷积层中确定第三预设数量的卷积层;所述第三预设数量的卷积层中的其中一个卷积层为所述标识码位置定位模型的最后一个卷积层;所述i为大于或等于1,且小于或等于N的整数;所述第三预设数量小于所述第一预设数量;
基于所述目标样本图像集中的样本图像,对第i-1轮训练后的标识码位置定位模型进行第i轮训练;其中,在第i轮训练过程中,所述标识码位置定位模型的输出特征融合了第三预设数量的卷积层中所有卷积层的输出特征。
可选的,在所述得到训练好的标识码位置定位模型之后,还包括:
将所述训练好的标识码位置定位模型中权重为零的参数删除。
第二方面,本申请提供一种标识码位置定位方法,所述方法包括:
在纸张上印刷排版后的页面,得到印刷纸张;所述页面包括至少一个标识码;
获取所述印刷纸张的图像;
将所述图像输入至训练好的标识码位置定位模型中,得到所述至少一个标识码在所述印刷纸张中的位置;所述训练好的标识码位置定位模型为采用如第一方面任一项所述的方法训练得到的。
可选的,在所述至少一个标识码在所述印刷纸张中的位置之后,还包括:
若至少一个所述标识码在所述印刷纸张中的位置与所述标识码的在所述排版后的页面的预设位置不同,则调整排版后的页面在纸张上的印刷位置;
或者,输出提示信息,所述提示信息用于指示所述标识码在所述印刷纸张中的位置错误。
可选的,所述获取所述印刷纸张的图像,包括:
获取双目摄像头采集的所述印刷纸张的图像。
第三方面,本申请提供一种标识码位置定位模型的训练装置,所述装置包括:
获取模块,用于获取目标样本图像集;所述目标样本图像集中包括:对印刷有至少一个标识码的印刷纸张进行图像采集得到的样本图像;
训练模块,用于基于所述目标样本图像集中的样本图像,对标识码位置定位模型进行N轮训练,得到训练好的标识码位置定位模型;其中,所述标识码位置定位模型包括:第一预设数量的卷积层,以及,第二预设数量的空洞卷积层;所述第一预设数量大于所述第二预设数量;所述第二预设数量的空洞卷积层穿插在所述第一预设数量的卷积层中;所述N为大于或等于1的整数,所述标识码位置定位模型用于识别标识码在图像中的位置,所述卷积层和所述空洞卷积层均用于提取与标识码在图像中的位置相关的特征。
第四方面,本申请提供一种标识码位置定位装置,所述装置包括:
印刷模块,用于在纸张上印刷排版后的页面,得到印刷纸张;所述页面包括至少一个标识码;
获取模块,用于获取所述印刷纸张的图像;
输入模块,用于将所述图像输入至训练好的标识码位置定位模型中,得到所述至少一个标识码在所述印刷纸张中的位置;所述训练好的标识码位置定位模型为采用如第一方面任一项所述的方法训练得到的。
第五方面,本申请提供一种电子设备,包括:至少一个处理器、存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述电子设备执行第一方面和第二方面任一项所述的方法。
第六方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现第一方面和第二方面任一项所述的方法。
本申请提供的标识码位置定位模型的训练及定位方法、装置、电子设备,通过使用“对印刷有至少一个标识码的印刷纸张进行图像采集”得到的样本图像,对标识码位置定位模型进行N轮训练,可以得到训练好的标识码位置定位模型。其中,该标识码位置定位模型包括第一预设数量的卷积层,以及,第二预设数量的空洞卷积层。通过结合第二预设数量的空洞卷积层对上述包括标识码的样本图像进行特征提取,可以在增加卷积感受野的同时,降低卷积过程的计算量。此外,相较于通过对卷积得到的特征图进行下采用来降低卷积过程的计算量,通过空洞卷积层来降低卷积过程的计算量,不会丢失特征图的分辨率,保证了不会丢失特征图包括的标识码的位置信息,进而提高了对标识码位置定位模型进行训练的精确度。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面对本申请涉及到的名词概念进行解释:
空洞卷积(Atrous Convolution):又称为扩张卷积(Dilated Convolution)。空洞卷积是在普通卷积的基础上添加空洞得到的。在相同参数量的情况下,空洞卷积的感受野大于普通卷积的感受野。其中,空洞卷积的空洞率(或者叫做扩张率)越大,空洞卷积的感受野越大。
物品标识码在市场流通检测、质量检测、物品防伪等方面均有广泛应用。物品标识码通常印刷在物品的包装盒上。根据印刷标识码相关标准规定,以及,用户需求等,标识码需要印刷在物品包装盒的特定位置。
以上述标识码为条形码为例,图1为一种印刷物品标识码的过程示意图。如图1所示,一张印刷纸张上可以印刷有多个平铺展开的包装盒。然后,印刷设备可以在该印刷有包装盒的印刷纸张上印刷标识码。
如图1所示,假设包装盒1上印刷的标识码的位置是正确的,那么包装盒2、包装盒3、包装盒5、包装盒6上印刷的标识码的位置是错误的。而标识码位置错误可能不符合行业相关标准而导致该包装盒无法使用,或者,后续需要使用该标识码时无法在特定位置处检测到该标识码等问题。因此,对标识码在印刷纸张中的位置进行检测是至关重要的。
图2为现有的一种标识码位置定位方法的流程示意图。如图2所示,现有的标识码位置定位方法主要包括以下步骤:
步骤1、与印刷设备连接的上位机,接收印刷设备的视觉检测系统采集的印刷纸张的图像。
步骤2、上位机接收到该印刷纸张的图像之后,通过灰度处理、二值化处理,以及,形态学腐蚀与膨胀处理的图像增强方式对该图像进行图像增强,得到增强后的印刷纸张的图像。
步骤3、上位机通过标记连通区域的方式,识别出标识码,并定位标识码在该印刷纸张中的位置。
其中,通过标记连通区域的方式,需要基于图像中各个像素点的值,将可能是标识码的像素点连接起来,以勾勒出标识码的形状。然而,当上述视觉检测系统采集的印刷纸张的图像的较模糊(标识码的清晰度较差)时,表示标识码的像素点的值的精确度可能较差。而且,上述图像增强算法也可能进一步使得印刷纸张中各像素点的值发生变化,进一步导致表示标识码的像素点的值的精确度可能较差,进而导致通过标记连通区域的方式,得到的标识码在该印刷纸张中的位置精确度较差。
也就是说,现有的标识码位置定位方法对印刷纸张的图像质量要求较高。印刷纸张的图像质量较差的原因主要是标识码所在的印刷纸张相对较大,印刷设备批量印刷的标识码的尺寸一般都较小,而视觉检测系统需要采集整张印刷纸张的图像,因此导致该图像中的标识码清晰度较差。
因此,一些实施例在上述方法的基础上,提出了使用多个视觉检测系统近距离靠近印刷纸张,以采集清晰度较高的印刷纸张各部分的图像。然后,将上述多个视觉检测系统采集到的印刷纸张各部分的图像进行拼接,以获取完整的该印刷纸张的图像。然后,基于该拼接之后的印刷纸张的图像,通过上述现有的标识码位置定位方法,对标识码的位置进行定位。
然而,上述拼接之后印刷纸张的图像可能与原印刷纸张的图像之间存在差异,进而仍然可能导致基于该拼接之后印刷纸张的图像,得到的标识码在该印刷纸张中的位置精确度较差。
考虑到现有的标识码位置定位方法存在精确度较差的问题是需要基于精确的图像中各个像素点的值,勾勒出标识码的形状之后,才能对标识码的位置进行定位,本申请提供了一种不需要基于精确的图像中各个像素点的值,即可定位标识码在印刷纸张中的位置的方法。该方法通过训练好的标识码位置定位模型,即可获取标识码在印刷纸张中的位置,避免了使用图像中各个像素点的值,对印刷纸张的图像的质量要求较低,提高了对标识码在印刷纸张中的位置进行定位的精确度。
应理解,本申请对上述印刷设备的类型不进行限定。示例性的,该印刷设备例如可以是喷墨印刷设备(例如平张喷墨印刷设备,或者滚筒喷墨印刷设备),或者激光印刷设备。上述与印刷设备连接的上位机可以是具有处理功能的终端或者服务器等电子设备。此外,本申请对标识码的类型也不进行限定。示例性的,上述标识码的例如可以是条形码,或者,二维码或者量子云码等。
下面结合具体地实施例对本申请如何训练上述标识码位置定位模型的技术方案进行详细说明。其中,训练标识码位置定位模型的方法的执行主体可以是与印刷设备连接的上位机,也可以是其他具有处理功能的电子设备。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图3为本申请提供的一种标识码位置定位模型的训练方法的流程示意图。如图3所示,该方法包括以下步骤:
S101、获取目标样本图像集。
其中,该目标样本图像集中包括:对印刷有至少一个标识码的印刷纸张进行图像采集得到的样本图像。
作为一种可能的实现方式,上述目标样本图像集中的样本图像可以是前述“多个视觉检测系统采集到的印刷纸张各部分的图像进行拼接得到的”印刷纸张的图像。或者,上述目标样本图像集中的样本图像还可以是双目摄像头对印刷有至少一个标识码的印刷纸张进行图像采集得到的图像。再或者,上述目标样本图像集中可以包括多个视觉检测系统采集到的印刷纸张各部分的图像进行拼接得到的,以及,双目摄像头对印刷有至少一个标识码的印刷纸张进行图像采集得到的,两种类型的图像。
作为另一种可能的实现方式,上述目标样本图像集中的图像还可以包括:对“印刷有至少一个标识码的印刷纸张进行图像采集得到的样本图像”进行增加噪声、翻转变换等处理,得到的处理后的样本图像。通过上述样本图像,以及,处理后的样本图像对标识码位置定位模型进行训练,可以提高标识码位置定位模型的鲁棒性,进而提高标识码位置定位模型定位标识码位置的精确度。或者,上述目标样本图像集中还可以包括:将设备生成的标识码与印刷纸张的图像进行合成得到的图像。其中,上述设备生成的标识码为该合成得到的图像的前景,上述印刷纸张的图像为该合成得到的图像的背景。
可选的,电子设备可以通过应用程序接口(Application ProgrammingInterface,API),或者,图形用户界面(Graphical User Interface,GUI),等方式获取目标样本图像集。
S102、基于目标样本图像集中的样本图像,对标识码位置定位模型进行N轮训练,得到训练好的标识码位置定位模型。上述N为大于或等于1的整数。
上述标识码位置定位模型用于识别标识码在图像中的位置。该标识码位置定位模型包括:第一预设数量的卷积层,以及,第二预设数量的空洞卷积层。上述第二预设数量的空洞卷积层穿插在第一预设数量的卷积层中。其中,该第一预设数量大于第二预设数量。上述卷积层和空洞卷积层均用于提取与标识码在图像中的位置相关的特征。
示例性的,以目标样本图像集中的样本图像的大小为416×416(像素值)、上述第一预设数量为56、第二预设数量为3、各层空洞卷积层的空洞率均为2为例,图4为本申请提供的一种标识码位置定位模型的结构示意图。如图4所示,其中的“1x”、“2x”、“8x”和“4x”均表示相同的卷积层结构重复相应的次数。Conv全称为Convolution(卷积),在图4中表示卷积层。Res全称为Residual(残差),在本申请中表示对应卷积层输出特征图的大小。
应理解,本申请对上述标识码位置定位模型是否还包括其他结构并不进行限定,图4仅是示例性的展示了标识码位置定位模型中与本申请相关的部分结构。示例性的,该标识码位置定位模型中例如还可以包括全连接层、激活函数、标识码分类头(ClassificationHead)、标识码位置回归头(Regression Head)等结构。
作为一种可能的实现方式,考虑到标识码位置定位模型中顺序越后的卷积层的输出特征包含的特征语义越多,以及,顺序越前的卷积层的输出特征包括的标识码的位置特征越多,因此,针对第i轮训练(i为大于或等于1,且小于或等于N的整数),电子设备可以融合上述标识码位置定位模型中顺序较后的卷积层的输出特征,以及,顺序较前的卷积层的输出特征,以提高对标识码位置定位模型的训练的精确度,进而提高使用该训练好的标识码位置定位模型对标识码的位置进行定位的精确度。
具体的,针对第i轮训练,电子设备可以从上述第一预设数量的卷积层中确定出第三预设数量的卷积层。其中,该第三预设数量的卷积层中的其中一个卷积层为标识码位置定位模型的最后一个卷积层。该最后一个卷积层即可视为上述所说的标识码位置定位模型中顺序较后的卷积层。“该第三预设数量的卷积层中除了该最后一个卷积层之外”的卷积层即可视为上述所说的顺序较前的卷积层。上述第三预设数量小于第一预设数量。
然后,电子设备可以基于上述目标样本图像集中的样本图像,对第i-1轮训练后的标识码位置定位模型进行第i轮训练。其中,在第i轮训练过程中,该标识码位置定位模型的输出特征融合了上述第三预设数量的卷积层中所有卷积层的输出特征。具体实现时,本申请对电子设备如何融合该第三预设数量的卷积层中各卷积层的输出特征不进行限定,可以参照现有的实现方式,本申请在此不再赘述。
示例性的,以上述第三预设数量的卷积层分别为图4中所示的第x层卷积层、第y层卷积层,以及,第z层卷积层(标识码位置定位模型的最后一个卷积层)为例,如图4所示,第x层卷积层的输出特征图的通道数(该层卷积核的个数)为512,第y层卷积层的输出特征图的通道数为1024,第z层卷积层的输出特征图的通道数为2048。则在对第x层卷积层、第y层卷积层,以及,第z层卷积层的输出特征进行融合时,电子设备可以通过大小为1×1的卷积核,通道数为512的卷积层,对上述第x层卷积层和第y层卷积层的输出特征图进行转换,得到通道数为512的输出特征图。此时,上述三个卷积层的输出特征图的通道数均为512,大小均为52×52。然后,电子设备可以将第x层卷积层、第y层卷积层,以及,第z层卷积层的输出特征图进行相加,得到融合后的输出特征图。
可选的,上述N的取值、第一预设数量、第二预设数量,以及,第三预设数量例如可以是用户预先存储在电子设备中的。
作为另一种可能的实现方式,针对第i轮训练,电子设备还可以基于上述标识码位置定位模型的最后一个卷积层的输出特征,以及,上述目标样本图像集中的样本图像,对第i-1轮训练后的标识码位置定位模型进行第i轮训练。
在本实施例中,通过使用“对印刷有至少一个标识码的印刷纸张进行图像采集”得到的样本图像,对标识码位置定位模型进行N轮训练,可以得到训练好的标识码位置定位模型。其中,该标识码位置定位模型包括第一预设数量的卷积层,以及,第二预设数量的空洞卷积层。通过结合第二预设数量的空洞卷积层对上述包括标识码的样本图像进行特征提取,可以在增加卷积感受野的同时,降低卷积过程的计算量。此外,相较于通过对卷积得到的特征图进行下采用来降低卷积过程的计算量,通过空洞卷积层来降低卷积过程的计算量,不会丢失特征图的分辨率,保证了不会丢失特征图包括的标识码的位置信息,进而提高了对标识码位置定位模型进行训练的精确度。
作为一种可能的实现方式,在得到训练好的标识码位置定位模型之后,电子设备还可以将该训练好的标识码位置定位模型中权重为零的参数删除,以减少该训练好的标识码位置定位模型的数据量大小,进而减少该训练好的标识码位置定位模型占用的存储空间。此外,通过将权重为零的参数删除,在使用该训练好的标识码位置定位模型对标识码的位置进行定位时,还可以减少位置定位过程的计算量,提高对标识码的位置进行定位的效率,进而提高了对标识码的位置进行定位的实时性。
在得到训练好的标识码位置定位模型之后,可以使用该标识码位置定位模型,对标识码在印刷纸张中的位置进行定位。上述训练好的标识码位置定位模型可以存储在印刷设备中,或者,与该印刷设备连接的上位机中。
当该标识码位置定位模型存储在印刷设备中时,使用该训练好的标识码位置定位模型对标识码在印刷纸张中的位置进行定位的方法的执行主体即为该印刷设备。当该标识码位置定位模型存储在与印刷设备连接的上位机中时,使用该训练好的标识码位置定位模型对标识码在印刷纸张中的位置进行定位的方法的执行主体即为该上位机。
下面以本申请提供的标识码位置定位方法的执行主体为印刷设备为例,结合具体地实施例对本申请如何对标识码位置进行定位的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图5为本申请提供的一种标识码位置定位方法的流程示意图。如图5所示,该方法包括以下步骤:
S201、印刷设备在纸张上印刷排版后的页面,得到印刷纸张。
其中,上述页面包括至少一个标识码。示例性的,该标识码可以是条形码或者二维码等类型的标识码。
S202、印刷设备获取印刷纸张的图像。
作为第一种可能的实现方式,印刷设备可以获取双目摄像头采集的印刷纸张的图像。其中,上述双目摄像头属于该印刷设备的一部分。双目摄像头采集图像的范围较大,相较于采用现有的视觉检测系统采集印刷纸张的图像,或者,拼接得到的印刷纸张的图像,双目摄像头可以直接采集到完整的印刷纸张的图像,提高了印刷纸张的图像中的标识码的清晰度。
作为第二种可能的实现方式,上述印刷纸张的图像还可以是印刷设备中双目视觉检测系统对双目摄像头采集到的印刷纸张的图像进行预处理之后得到的图像。在该实现方式下,以上述印刷设备为喷墨印刷设备为例,图6为本申请提供的一种标识码位置定位方法的应用场景示意图。如图6所示,经过喷墨模组将标识码印刷到印刷纸张上之后,该印刷有标识码的印刷纸张按照速度v在该喷墨印刷设备运动平台(例如可以为输纸传送带)上运动,该运动平台的上方设置的双目视觉检测系统可以采集该印刷纸张的图像。
针对上述双目视觉检测系统,示例性的,图7为本申请提供的一种双目视觉检测系统的结构示意图。如图7所示,该双目视觉检测系统可以包括双目摄像头功能模块、图像品质调整模块、外围内存电路、现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)及外围电路,以及,电源模块。
其中,双目摄像头功能模块即为上述双目摄像头。图像品质调整模块例如可以为图像信号处理(Image Signal Processing,ISP)芯片。通过该ISP芯片,可以对双目摄像头采集到的印刷纸张的图像进行去噪、增加对比度等图像增强处理,以提高对标识码在印刷纸张中的位置进行定位的精确度。然后ISP可以将图像增强处理之后的印刷纸张的图像发送到FPGA及外围电路。FPGA及外围电路可以从外围内存电路中获取图像处理程序,通过该程序,FPGA可以对图像品质调整模块传输过来的印刷纸张的图像进行进一步的图像增强,以进一步提高对标识码在印刷纸张中的位置进行定位的精确度。电源模块用于为上述FPGA及外围电路供电。
此外,若本申请提供的标识码位置定位方法的执行主体为与印刷设备连接的上位机,上述双目视觉检测系统还可以包括与上位机的数据通信模块,用于将FPGA得到的图像增强后的印刷纸张的图像,发送给该上位机。示例性的,该数据通信模块例如可以通过通用串行总线(Universal Serial Bus,USB)实现。
作为第三种可能的实现方式,上述印刷纸张的图像还可以是通过前述现有的视觉检测系统采集到的印刷纸张的图像。或者,该印刷纸张的图像还可以是通过多个视觉检测系统采集到的印刷纸张的各部分的图像,拼接得到的完整的印刷纸张的图像。
S203、将图像输入至训练好的标识码位置定位模型中,得到至少一个标识码在印刷纸张中的位置。
其中,上述训练好的标识码位置定位模型为采用如前述任一实施例所述的标识码位置定位模型的训练方法训练得到的。使用上述训练好的标识码位置定位模型,印刷设备可以得到该输入的印刷纸张的图像中的标识码在印刷纸张中的位置。
在本实施例中,通过将包括标识码的印刷纸张的图像,输入上述训练好的标识码位置定位模型,可以得到标识码在该印刷纸张的图像中的位置。通过上述方法,实现了对印刷设备印刷的标识码的位置进行实时的检测。此外,相较于现有的需要基于精确的印刷纸张的图像中各个像素点的值,才能确定标识码的位置的方法,通过上述方法,不需要针对各个像素点的值进行分析,即可定位标识码在印刷纸张中的位置,因此该方法对印刷纸张的图像的质量要求较低,提高了对标识码在印刷纸张中的位置进行定位的精确度。此外,上述训练好的标识码位置定位模型包括第一预设数量的卷积层,以及,第二预设数量的空洞卷积层。如前述所说,该训练好的标识码位置定位模型的精确度较高,因此进一步提高了使用该训练好的标识码位置定位模型得到的标识码的位置的精确度。
进一步的,作为一种可能的实现方式,在印刷设备得到上述至少一个标识码在印刷纸张中的位置之后,还可以判断该至少一个标识码在印刷纸张中的位置,与标识码的在排版后的页面的预设位置是否相同,以确定该至少一个标识码在印刷纸张中的位置是否正确。
可选的,印刷设备例如可以根据标识码的检测框(Bounding Box)在印刷纸张中的坐标,以及,标识码的在排版后的页面的预设坐标,确定标识码在印刷纸张中的位置,与标识码的在排版后的页面的预设位置是否相同。若标识码的检测框在印刷纸张中的坐标,与,标识码的在排版后的页面的预设坐标相同,则可以确定标识码在印刷纸张中的位置,与标识码的在排版后的页面的预设位置相同。若标识码的检测框在印刷纸张中的坐标,与,标识码的在排版后的页面的预设坐标不同,则可以确定标识码在印刷纸张中的位置,与标识码的在排版后的页面的预设位置不同。
若该至少一个标识码在印刷纸张中的位置与标识码的在排版后的页面的预设位置不同,说明该至少一个标识码在印刷纸张中的位置与预期不符,则印刷设备可以确定该至少一个标识码在印刷纸张中的位置错误。因此,印刷设备可以调整上述排版后的页面在纸张上的印刷位置,以使标识码在印刷纸张中的位置正确。若该至少一个标识码在印刷纸张中的位置与标识码的在排版后的页面的预设位置相同,说明该至少一个标识码在印刷纸张中的位置正确,则印刷设备可以不对排版后的页面在纸张上的印刷位置进行调整。
示例性的,印刷设备例如可以根据标识码的检测框在印刷纸张中的坐标与标识码的在排版后的页面的预设坐标,对排版后的页面在纸张上的印刷位置进行调整。
作为另一种可能的实现方式,在上述至少一个标识码在印刷纸张中的位置与标识码的在排版后的页面的预设位置不同时,印刷设备还可以输出用于指示标识码在印刷纸张中的位置错误的提示信息,以提示用户对标识码在印刷纸张中的位置进行调整。
示例性的,印刷设备例如可以通过印刷设备的显示装置,或者,声音提示装置等输出该提示信息。再或者,该印刷设备还可以将该提示信息输出给与该印刷设备连接的上位机。然后,该上位机可以通过上位机的显示装置输出该提示信息,以使用户可以获取该提示信息。
具体的,本申请印刷设备输出该提示信息之后,用户如何对标识码在印刷纸张中的位置进行调整不进行限定。示例性的,用户例如可以对标识码在上述排版后的页面中的位置进行调整,以使标识码在印刷纸张中的位置正确。
作为一种可能的实现方式,若上述目标样本图像集中还包括各样本图像中各标识码的种类的标签信息,电子设备还可以基于该目标样本图像集中的样本图像,以及各标识码的种类的标签信息,对标识码位置定位模型进行N轮训练,得到训练好的标识码位置定位模型。在该实现方式下,使用该训练好的标识码位置定位模型,印刷设备还可以基于输入的印刷纸张的图像,输出该印刷纸张中各标识码的种类信息。
图8为本申请提供的一种标识码位置定位模型的训练装置300的结构示意图。如图8所示,该装置300可以包括:获取模块301、训练模块302。其中,
获取模块301,用于获取目标样本图像集。其中,所述目标样本图像集中包括:对印刷有至少一个标识码的印刷纸张进行图像采集得到的样本图像。
训练模块302,用于基于所述目标样本图像集中的样本图像,对标识码位置定位模型进行N轮训练,得到训练好的标识码位置定位模型。其中,所述标识码位置定位模型包括:第一预设数量的卷积层,以及,第二预设数量的空洞卷积层;所述第一预设数量大于所述第二预设数量;所述第二预设数量的空洞卷积层穿插在所述第一预设数量的卷积层中;所述N为大于或等于1的整数,所述标识码位置定位模型用于识别标识码在图像中的位置,所述卷积层和所述空洞卷积层均用于提取与标识码在图像中的位置相关的特征。
可选的,训练模块302,具体用于针对第i轮训练,从所述第一预设数量的卷积层中确定第三预设数量的卷积层;所述第三预设数量的卷积层中的其中一个卷积层为所述标识码位置定位模型的最后一个卷积层;所述i为大于或等于1,且小于或等于N的整数;所述第三预设数量小于所述第一预设数量;
基于所述目标样本图像集中的样本图像,对第i-1轮训练后的标识码位置定位模型进行第i轮训练;其中,在第i轮训练过程中,所述标识码位置定位模型的输出特征融合了第三预设数量的卷积层中所有卷积层的输出特征。
可选的,该装置300还可以包括删除模块303,用于在所述得到训练好的标识码位置定位模型之后,将所述训练好的标识码位置定位模型中权重为零的参数删除。
本实施例提供的标识码位置定位模型的训练装置300,可以执行上述标识码位置定位模型的训练方法实施例,其实现原理和技术效果类似,在此不再赘述。
图9为本申请提供的一种标识码位置定位装置400的结构示意图。如图9所示,该装置400可以包括:印刷模块401、获取模块402,以及,输入模块403。其中,
印刷模块401,用于在纸张上印刷排版后的页面,得到印刷纸张。其中,所述页面包括至少一个标识码。
获取模块402,用于获取所述印刷纸张的图像。
输入模块403,用于将所述图像输入至训练好的标识码位置定位模型中,得到所述至少一个标识码在所述印刷纸张中的位置。其中,所述训练好的标识码位置定位模型为采用前述任一项实施例所述的标识码位置定位模型的训练方法训练得到的。
可选的,所述装置400还可以包括调整模块404,用于在所述至少一个标识码在所述印刷纸张中的位置之后,在至少一个所述标识码在所述印刷纸张中的位置与所述标识码的在所述排版后的页面的预设位置不同时,调整排版后的页面在纸张上的印刷位置;或者,输出提示信息。其中,所述提示信息用于指示所述标识码在所述印刷纸张中的位置错误。
可选的,获取模块402,具体用于获取双目摄像头采集的所述印刷纸张的图像。
本实施例提供的标识码位置定位装置400,可以执行上述标识码位置定位方法实施例,其实现原理和技术效果类似,在此不再赘述。
图10为本发明提供的一种电子设备的结构示意图。该电子设备例如可以是印刷设备或者能够与印刷设备连接的上位机。如图10所示,该电子设备500可以包括:至少一个处理器501和存储器502。其中,
存储器502,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
存储器502可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器501用于执行存储器502存储的计算机执行指令,以实现前述方法实施例所述的标识码位置定位模型的训练方法或者标识码位置定位方法。其中,处理器501可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路。
可选的,该电子设备500还可以包括通信接口503。在具体实现上,如果通信接口503、存储器502和处理器501独立实现,则通信接口503、存储器502和处理器501可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry StandardArchitecture,简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果通信接口503、存储器502和处理器501集成在一块芯片上实现,则通信接口503、存储器502和处理器501可以通过内部接口完成通信。
本发明还提供了一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或者光盘等各种可以存储程序代码的介质,具体的,该计算机可读存储介质中存储有程序指令,程序指令用于上述实施例中的方法。
本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。数据处理装置的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得数据处理装置实施上述的各种实施方式提供的标识码位置定位模型的训练方法或者标识码位置定位方法。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。