CN113743146A - 基于深度学习的批量图形码识别方法、装置及存储介质 - Google Patents
基于深度学习的批量图形码识别方法、装置及存储介质 Download PDFInfo
- Publication number
- CN113743146A CN113743146A CN202110806681.0A CN202110806681A CN113743146A CN 113743146 A CN113743146 A CN 113743146A CN 202110806681 A CN202110806681 A CN 202110806681A CN 113743146 A CN113743146 A CN 113743146A
- Authority
- CN
- China
- Prior art keywords
- graphic code
- graphic
- extraction model
- codes
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000013135 deep learning Methods 0.000 title claims abstract description 32
- 238000000605 extraction Methods 0.000 claims abstract description 172
- 239000000284 extract Substances 0.000 claims abstract description 12
- 238000012795 verification Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 47
- 230000008569 process Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 23
- 239000000969 carrier Substances 0.000 claims description 9
- 238000002372 labelling Methods 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 239000000463 material Substances 0.000 description 15
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Electromagnetism (AREA)
- Toxicology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及基于深度学习的批量图形码识别方法、装置及存储介质。本申请采集批量图形码的视频,将视频逐帧分解获取若干批量图形码的图像,计算图像的清晰度,选取清晰度最高的图像为目标图像输入到经训练能够识别条形的第一图形码提取模型和第二图形码提取模型进行图形码的识别提取,将图形码逐一从包含批量图形码的图像中提取出来,分别对第一图形码提取模型和第二图形码提取模型提取出来的单个图形码进行解析,将解析结果进行对比,如果一致则判定图形码提取解析正确,如果不一致则输出提取解析错误。本申请能够对图形码解析结果的自验证,并在提取解析错误情况频繁发生时重新训练第一图形码提取模型和第二图形码提取模型。
Description
技术领域
本申请涉及图形码批量处理领域,尤其涉及一种基于深度学习的批量图形码识别方法、装置及存储介质。
背景技术
图形码是用特定的几何图形按照设定的规则所形成的表示数据信息的图形,图形码被广泛应用于物料管理等领域。
对于服务器生产过程中,生产服务器的每件物料,尤其是电子元器件,都需要配置一个唯一的识别码,该识别码会一直伴随直至该物料报废。识别码往往由图形码来表示。再生产中,需要将各个物料处理过程详细的记录在生产管理系统中,在处理环节之前或之后往往需要对物料的图形码信息进行采集。一般的工作人员通过扫码枪对逐个物料的图形码进行扫码以收集数据,并将收集的数据录入到生产管理系统的数据库中。使用扫码枪收集物料的图形码信息,效率低,当物料数量多,需要收集大量图形码数据时,采用扫码枪扫码耗时长,且容易发生重扫或者漏扫的情况,还需进行额外的查重、查漏工作。严重影响制约生产环节的高效进行。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供一种基于深度学习的批量图形码识别方法、装置及存储介质。
第一方面,本申请提供一种基于深度学习的批量图形码识别方法,包括:
采集并处理批量的图形码图像获取目标图像,所述目标图像中至少包括一个图形码;
将所述目标图像分别输入第一图形码提取模型和第二图形码提取模型进行处理以提取目标图像中的图形码;
所述第一图形码提取模型从所述目标图像中分辨并提取第一组图形码,依次解析第一组图形码中的图形码获取第一组解析结果,所述第二图形码提取模型从所述目标图像中分辨并提取第二组图形码,依次解析第二组图形码中的图形码获取第二组解析结果;
将第一组解析结果中的解析结果与第二组解析结果中相应的解析结果对比是否一致,
是则存储相应的解析结果;否则输出提取解析错误提醒,并对提取解析错误进行记录统计。
更进一步地,采集并处理批量的图形码图像获取目标图像包括:
通过视频设备采集图形码载体的视频,所述图形码载体上包含批量的图形码;
从视频中提取若干图像,并计算所得图像的清晰度;
选取最高清晰度的图像,并由最高清晰度的图像获取目标图像。
更进一步地,对所述视频设备和批量密集图形码的载体的位置进行调节确保所述视频设备的镜头视野中的图形码均为完整的图形码。
更进一步地,设置所述视频设备的视频参数,使得拍摄视频的视频帧的大小符合所述第一图形码提取模型和所述第二图形码提取模型的输入图像大小要求。
更进一步地,所述第一图形码提取模型通过第一图形码训练集训练YOLO模型获取,所述第二图形码提取模型通过第二图形码训练集训练YOLO模型获取,训练的第一图形码提取模型和第二图形码提取模型经过校验集校验。
更进一步地,制作第一图形码训练集、第二图形码训练集和校验集包括:
采集若干包含图形码的图片;
通过标注工具标注图形码在图片中的位置;
将所述标注工具生成的标注信息和相应的图片组合形成的数据集;
将数据集复制三份形成所述第一图形码训练集、第二图形码训练集和校验集。
更进一步地,根据统计结果判断第一图形码提取模型和第二图形码提取模型的识别精度是否不满足要求,是则对第一图形码提取模型和第二图形码提取模型重新训练验证。
更进一步地,所述第一图形码提取模型和所述第二图形码提取模型并行运行,对第一组图形码进行解码的过程与对第二组图形码解码的过程并行运行。
第二方面,本申请提供一种基于深度学习的批量图形码识别的装置。所述基于深度学习的批量图形码识别的装置包括:
采集模块,所述采集模块用于采集批量图形码的视频;
图像处理模块,所述图像处理模块从采集模块获取视频,并从视频抽帧获取若干图像,计算图像的清晰度;选取清晰度最高的图像形成目标图像;
第一图形码提取模块,所述第一图形码提取模块实现第一图形码提取模型,从所述图像处理模块获取目标图像,从目标图像中逐一提取图形码形成第一组图形码;
第二图形码提取模块,所述第二图形码提取模块实现第二图形码提取模型,从所述图像处理模块获取目标图像,从目标图像中逐一提取图形码形成第二组图形码;
第一解码模块,所述第一解码模块从所述第一图形码提取模型获取第一组图形码,所述第一解码模块对第一组图形码依次进行解析获取第一组解析结果;
第二解码模块,所述第二解码模块从所述第二图形码提取模型获取第二组图形码,所述第二解码模块对第二组图形码依次进行解析获取第二组解析结果;
校验模块,所述校验模块从所述第一解码模块获取第一组解析结果,所述校验模块从所述第二解码模块获取第二组解析结果;所述校验模块对比第一组解析结果与相应的第二组解析结果是否相同,是则将相应的图像码及解析结果存放到存储模块,否则输出提取解析错误提醒并控制日志模块记录相应的提取解析错误日志;
所述日志模块还统计提取解析错误日志,根据统计结果判断第一图形码提取模型和第二图形码提取模型的识别精度是否不满足要求;
训练模块,所述训练模块在日志模块分析第一图形码提取模型和第二图形码提取模型的识别精度不满足要求的情况下进一步训练第一图形码提取模型和第二图形码提取模型。
第三方面,本申请提供一种实现基于深度学习的批量图形码识别方法的存储介质。所述实现基于深度学习的批量图形码识别方法的存储介质存储至少一条指令,执行所述指令实现所述基于深度学习的批量图形码识别方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
本申请利用视频的方式采集批量物料的批量图形码;对视频进行抽帧获取若干图像,计算所得图像的清晰度并选取清晰度最高的图像作为目标图像进行图形码的识别提取解析;一方面有利于第一图形码提取模型和第二图形码提取模块准确识别提取图形码,另一方面有利于获取更加清晰的图形码进行解析,保证图形码解析的准确性。
本申请的所述第一图形码提取模型和所述第二图形码提取模块并行运行实现分别对相同的目标图像进行图形码提取,对第一组图形码进行解码的过程与对第二组图形码解码的过程并行进行;使第一图形码提取模型和第二图形码提取模块从同样的目标图像中所提取的图形码的解析结果之间能够相互印证。使得本申请能自动分辨出提取或者解析错误,将错误的结果排除。确保输出图形码识别结果的准确性。
另外,本申请在确定提取解析错误时,发出提取解析错误提醒并对提取解析错误进行记录、统计。一方面,工作人员可以根据提取解析错误提醒对错误提取或解析的图形码进行溯源。另一方面,根据统计结果可以判断第一图形码提取模型和第二图形码提取模型的精确度是否符合要求,如果第一图形码提取模型和第二图形码提取模型的精度不符合要求,则对第一图形码提取模型和第二图形码提取模型进行重新训练以获取符合精确度要求的第一图形码提取模型和第二图形码提取模型,确保图形码提取的精度,避免误提取的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的基于深度学习的批量图形码识别方法的流程图;
图2为本申请实施例提供的采集并处理批量的图形码图像获取目标图像的流程图;
图3为本申请实施例提供的第一图形码提取模型和第二图形码提取模型训练的流程图;
图4为本申请实施例提供的基于深度学习的批量图形码识别的装置的架构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
实施例1
本申请实施例提供一种基于深度学习的批量图形码识别方法,参阅图1所示,所述基于深度学习的批量图形码识别方法包括:
S100,采集并处理批量的图形码图像获取目标图像,所述目标图像中至少包括一个图形码。
具体的,参阅图2所示,采集并处理批量的图形码图像获取目标图像包括:
S101,通过视频设备采集图形码载体的视频,所述图形码载体上包含批量的图形码;应用在物料图形码识别的过程中,图形码载体即物料上相应的图形码标签,将物料上图形码标签统一朝向,通过视频设备采集批量物料的图形码。视频采集时,对所述视频设备和批量密集图形码的载体的位置进行调节确保所述视频设备的镜头视野中的图形码均为完整的图形码。
在视频设备条件允许的情况下,设置所述视频设备的视频参数,使得拍摄视频的视频帧的大小符合第一图形码提取模型和第二图形码提取模型的输入图像大小要求。
S102,从视频中提取若干图像,并计算所得图像的清晰度;具体实施过程中,以第一设定时刻的视频帧为起始的图像,按照设定的时间间隔从视频中抽取一定数量的视频帧作为后续抽取的图像。通过Tenengrad梯度算法、Laplacian梯度方法和方差方法中的任意一种计算所得图片的清晰度。具体的,以Tenengrad梯度算法为例进行说明:
通过imread指令读取图像;
通过RGB2GRAY指令将读取的图像转为相应的灰度图像;
在利用Sobel算子计算灰度图像的平均梯度,以所述平均梯度作为清晰度的衡量指标。灰度图像的平均梯度越大,则灰度图像所对应的原来图像的清晰度越高。
S103,选取最高清晰度的图像。具体实施过程中,比较各个图像所对应灰度图像的平均梯度,获取最大的平均梯度,比较最大的平均梯度于设定的梯度阈值,如果最大的平均梯度大于设定的梯度阈值则选取平均梯度最大的图像,否则重新执行S200,重新S200时设定起始的图像为第二设定时刻的视频帧。
S104,检测图像的的大小是否符合第一图形码提取模型和第二图形码提取模型输入图像大小的要求,是则执行S105,否则,执行S106;
S105,以平均梯度最大的图像作为目标图像;
S106,通过resize指令调整平均梯度最大的图像的大小以符合要求,以调整后的图像作为目标图像。
本申请利用视频的方式采集批量物料的批量图形码;对视频进行抽帧获取若干图像,计算所得图像的清晰度并选取清晰度最高的图像作为目标图像进行图形码的识别提取解析;一方面有利于第一图形码提取模型和第二图形码提取模块准确识别提取图形码,另一方面有利于获取更加清晰的图形码进行解析,保证图形码解析的准确性。
S200,将所述目标图像分别输入所述第一图形码提取模型和所述第二图形码提取模型进行处理以提取目标图像中的图形码;所述第一图形码提取模型从所述目标图像中分辨并提取第一组图形码,所述第二图形码提取模型从所述目标图像中分辨并提取第二组图形码,所述第一图形码提取模型和所述第二图形码提取模型并行运行,使得第一组图形码和第二组图形码的提取过程保持相对的同步。具体实施过程中,所述第一图形码提取模型和所述第二图形码提取模型输出图形码在目标图形中的所在区域的位置,通过创建若干空白图片,空白图片的尺寸与相应图形码所在区域的位置大小一致,将相应图形码复制到相应的空白图片中以提取图形码。
其中,所述第一图形码提取模型通过第一图形码训练集训练YOLO模型获取,所述第二图形码提取模型通过第二图形码训练集训练YOLO模型获取,训练的第一图形码提取模型和第二图形码提取模型经过校验集校验。具体实施过程中,参阅图3所示,第一图形码提取模型和第二图形码提取模型训练过程包括:
S201,采集若干包含图形码的图片;
S202,通过标注工具标注图形码在图片中的位置;所述标注工具为lableImg标注工具,通过lableImg标注工具能够标注每张图片中图形码的位置,所述lableImg标注工具将图形码位置存储于标注信息中。
S203,将所述标注工具生成的标注信息和相应的图片组合形成的数据集;
S204,将数据集复制三份形成所述第一图形码训练集、第二图形码训练集和校验集。具体实施过程中将所述第一图形码训练集、第二图形码训练集和所述校验集设置于指定的目录下。
S205,配置训练YOLO模型的参数;
具体实施过程中训练YOLO模型的参数包括:
YOLO模型输入的宽度、高度和通道数,其中,宽度和高度为32的整数倍,根据宽度和高度调整视频设备的视频参数。
动量参数,所述动量参数为影响梯度下降的最优的速度,本实施例的动量参数采用0.9。
权重衰减正则系数,所述权重衰减正则系数用于防止过拟合,本实施例的权重衰减正则系数采用0.0005。
学习率,所述学习率影响权值更新的速度,学习率大权值更新的速度就快。本实施例的学习率采用0.005。
学习率策略,所述学习率策略巨顶学习率下降的方式,本申请实施例采用steps的学习率策略,相应的,设置若干学习率变动节点以及对应每个学习率学习率变动节点的学习率衰减系数,在迭代训练次数达到相应的学习率变动节点时,当前的学习率乘以相应学习率衰减系数来更新学习率,后面的迭代训练按更新的学习率进行直至下一学习率变动节点。
最大迭代次数,YOLO模型在迭代训练过程中,当训练迭代次数处于1000次范围内,则每训练迭代100次保存一次权值,1000次以上,每训练10000次保存一次权值;最大迭代次数即决定训练过程中最大的迭代次数。
迭代要训练的图片的数量。
S206,通过第一图形码训练集按照设定的训练YOLO模型的参数对YOLO模型训练生成第一图形码提取模型,并通过所述校验集进行校验。
通过第二图形码训练集按照设定的训练YOLO模型的参数对YOLO模型训练生成第二图形码提取模型,并通过所述校验集进行校验。
S300,依次解析第一组图形码中的图形码获取第一组解析结果,依次解析第二组图形码中的图形码获取第二组解析结果;具体实施过程中,配置用于解析图形码的zbar库或zxing库。设置第一解码程序和第二解码程序,第一解码程序和第二解码程序通过调用zbar库或者zxing库实现图形码解析,第一解码程序解析所述第一组图形码获取第一组解析结果,第二解码程序解析所述第二组图形码获取第二组解析结果。第一解码程序和第二解码程序并行运行,使得第一组解析结果和第二组解析结果的解析过程保持相对的同步。具体实施过程中,判断第一组图形码中图形码和第二组图形码中的图形码的位置是否一致,是则比较两图形码相应的解析结果。
S400,将第一组解析结果中的解析结果与第二组解析结果中相应的解析结果对比是否一致,是则存储相应的解析结果;否则输出提取解析错误提醒,并对提取解析错误进行记录统计。
在应用到物料管理方面,识别图形码是为了将图形码携带的信息输入到管理系统,在步骤S400中,相应的解析结果一致时,存储相应的解析结果到指定存储位置,由管理系统从指定存储位置获取解析结果。
具体实施过程中,通过记录日志的形式记录所发生的提取解析错误和提取解析错误发生的具体时刻。
所述基于深度学习的批量图形码识别方法还包括:根据统计结果判断第一图形码提取模型和第二图形码提取模型的识别精度是否不满足要求,是则对第一图形码提取模型和第二图形码提取模型重新训练验证。
具体实施过程中,周期性地获取日志所记录的提取解析错误和提取解析错误发生的具体时刻。统计在设定周期内发生的提取解析错误的次数,并将次数与设定的次数阈值进行比较,如果次数大于次数阈值则第一图形码提取模型和第二图形码提取模型的识别精度不满足要求,对第一图形码提取模型和第二图形码提取模型重新训练。
实施例2
本申请实施例提供一种基于深度学习的批量图形码识别的装置,参阅图4所示,基于深度学习的批量图形码识别的装置包括:
采集模块,所述采集模块用于采集批量图形码的视频;具体的,所述采集模块配置于视频设备。
图像处理模块,所述图像处理模块从采集模块获取视频,并从视频抽帧获取若干图像,计算图像的清晰度;选取清晰度最高的图像形成目标图像;
第一图形码提取模块,所述第一图形码提取模块实现第一图形码提取模型,从所述图像处理模块获取目标图像,从目标图像中逐一提取图形码形成第一组图形码;
第二图形码提取模块,所述第二图形码提取模块实现第二图形码提取模型,从所述图像处理模块获取目标图像,从目标图像中逐一提取图形码形成第二组图形码;
第一解码模块,所述第一解码模块从所述第一图形码提取模型获取第一组图形码,所述第一解码模块对第一组图形码依次进行解析获取第一组解析结果;
第二解码模块,所述第二解码模块从所述第二图形码提取模型获取第二组图形码,所述第二解码模块对第二组图形码依次进行解析获取第二组解析结果;
校验模块,所述校验模块从所述第一解码模块获取第一组解析结果,所述校验模块从所述第二解码模块获取第二组解析结果;所述校验模块对比第一组解析结果与相应的第二组解析结果是否相同,是则将相应的图像码及解析结果存放到存储模块,否则通过提示模型输出提取解析错误提醒并控制日志模块记录相应的提取解析错误日志;
所述日志模块还统计提取解析错误日志,根据统计结果判断第一图形码提取模型和第二图形码提取模型的识别精度是否不满足要求;
训练模块,所述训练模块在日志模块分析第一图形码提取模型和第二图形码提取模型的识别精度不满足要求的情况下进一步训练第一图形码提取模型和第二图形码提取模型。
实施例3
本申请实施例提供一种实现基于深度学习的批量图形码识别方法的存储介质。所述实现基于深度学习的批量图形码识别方法的存储介质存储至少一条指令,执行所述指令实现所述基于深度学习的批量图形码识别方法。
本申请的所述第一图形码提取模型和所述第二图形码提取模块并行运行实现分别对相同的目标图像进行图形码提取,对第一组图形码进行解码的过程与对第二组图形码解码的过程并行进行;使第一图形码提取模型和第二图形码提取模块从同样的目标图像中所提取的图形码的解析结果之间能够相互印证。使得本申请能自动分辨出提取或者解析错误,将错误的结果排除。确保输出图形码识别结果的准确性。
另外,本申请在确定提取解析错误时,发出提取解析错误提醒并对提取解析错误进行记录、统计。一方面,工作人员可以根据提取解析错误提醒对错误提取或解析的图形码进行溯源。另一方面,根据统计结果可以判断第一图形码提取模型和第二图形码提取模型的精确度是否符合要求,如果第一图形码提取模型和第二图形码提取模型的精度不符合要求,则对第一图形码提取模型和第二图形码提取模型进行重新训练以获取符合精确度要求的第一图形码提取模型和第二图形码提取模型,确保图形码提取的精度,避免误提取的问题。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于深度学习的批量图形码识别方法,其特征在于,包括:
采集并处理批量的图形码图像获取目标图像,所述目标图像中至少包括一个图形码;
将所述目标图像分别输入第一图形码提取模型和第二图形码提取模型进行处理以提取目标图像中的图形码;
所述第一图形码提取模型从所述目标图像中分辨并提取第一组图形码,依次解析第一组图形码中的图形码获取第一组解析结果,所述第二图形码提取模型从所述目标图像中分辨并提取第二组图形码,依次解析第二组图形码中的图形码获取第二组解析结果;
将第一组解析结果中的解析结果与第二组解析结果中相应的解析结果对比是否一致,
是则存储相应的解析结果;否则输出提取解析错误提醒,并对提取解析错误进行记录统计。
2.根据权利要求1所述基于深度学习的批量图形码识别方法,其特征在于,采集并处理批量的图形码图像获取目标图像包括:
通过视频设备采集图形码载体的视频,所述图形码载体上包含批量的图形码;
从视频中提取若干图像,并计算所得图像的清晰度;
选取最高清晰度的图像,并由最高清晰度的图像获取目标图像。
3.根据权利要求2所述基于深度学习的批量图形码识别方法,其特征在于,对所述视频设备和批量密集图形码的载体的位置进行调节确保所述视频设备的镜头视野中的图形码均为完整的图形码。
4.根据权利要求2所述基于深度学习的批量图形码识别方法,其特征在于,设置所述视频设备的视频参数,使得拍摄视频的视频帧的大小符合所述第一图形码提取模型和所述第二图形码提取模型的输入图像大小要求。
5.根据权利要求1所述基于深度学习的批量图形码识别方法,其特征在于,所述第一图形码提取模型通过第一图形码训练集训练YOLO模型获取,所述第二图形码提取模型通过第二图形码训练集训练YOLO模型获取,训练的第一图形码提取模型和第二图形码提取模型经过校验集校验。
6.根据权利要求5所述基于深度学习的批量图形码识别方法,其特征在于,制作第一图形码训练集、第二图形码训练集和校验集包括:
采集若干包含图形码的图片;
通过标注工具标注图形码在图片中的位置;
将所述标注工具生成的标注信息和相应的图片组合形成的数据集;
将数据集复制三份形成所述第一图形码训练集、第二图形码训练集和校验集。
7.根据权利要求1所述基于深度学习的批量图形码识别方法,其特征在于,根据统计结果判断第一图形码提取模型和第二图形码提取模型的识别精度是否不满足要求,是则对第一图形码提取模型和第二图形码提取模型重新训练验证。
8.根据权利要求1所述基于深度学习的批量图形码识别方法,其特征在于,所述第一图形码提取模型和所述第二图形码提取模型并行运行,对第一组图形码进行解码的过程与对第二组图形码解码的过程并行进行。
9.一种基于深度学习的批量图形码识别的装置,其特征在于,包括:
采集模块,所述采集模块用于采集批量图形码的视频;
图像处理模块,所述图像处理模块从采集模块获取视频,并从视频抽帧获取若干图像,计算图像的清晰度;选取清晰度最高的图像形成目标图像;
第一图形码提取模块,所述第一图形码提取模块实现第一图形码提取模型,从所述图像处理模块获取目标图像,从目标图像中逐一提取图形码形成第一组图形码;
第二图形码提取模块,所述第二图形码提取模块实现第二图形码提取模型,从所述图像处理模块获取目标图像,从目标图像中逐一提取图形码形成第二组图形码;
第一解码模块,所述第一解码模块从所述第一图形码提取模型获取第一组图形码,所述第一解码模块对第一组图形码依次进行解析获取第一组解析结果;
第二解码模块,所述第二解码模块从所述第二图形码提取模型获取第二组图形码,所述第二解码模块对第二组图形码依次进行解析获取第二组解析结果;
校验模块,所述校验模块从所述第一解码模块获取第一组解析结果,所述校验模块从所述第二解码模块获取第二组解析结果;所述校验模块对比第一组解析结果与相应的第二组解析结果是否相同,是则将相应的图像码及解析结果存放到存储模块,否则输出提取解析错误提醒并控制日志模块记录相应的提取解析错误日志;
所述日志模块还统计提取解析错误日志,根据统计结果判断第一图形码提取模型和第二图形码提取模型的识别精度是否不满足要求;
训练模块,所述训练模块在日志模块分析第一图形码提取模型和第二图形码提取模型的识别精度不满足要求的情况下进一步训练第一图形码提取模型和第二图形码提取模型。
10.一种实现基于深度学习的批量图形码识别方法的存储介质,其特征在于,所述实现基于深度学习的批量图形码识别方法的存储介质存储至少一条指令,执行所述指令实现如权利要求1-8任一所述基于深度学习的批量图形码识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110806681.0A CN113743146A (zh) | 2021-07-16 | 2021-07-16 | 基于深度学习的批量图形码识别方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110806681.0A CN113743146A (zh) | 2021-07-16 | 2021-07-16 | 基于深度学习的批量图形码识别方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113743146A true CN113743146A (zh) | 2021-12-03 |
Family
ID=78728709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110806681.0A Withdrawn CN113743146A (zh) | 2021-07-16 | 2021-07-16 | 基于深度学习的批量图形码识别方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113743146A (zh) |
-
2021
- 2021-07-16 CN CN202110806681.0A patent/CN113743146A/zh not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4676225B2 (ja) | スキャン・ドキュメントから電子フォームに取り込むための方法および装置 | |
CN107403128B (zh) | 一种物品识别方法及装置 | |
US20090041361A1 (en) | Character recognition apparatus, character recognition method, and computer product | |
CN111652225B (zh) | 基于深度学习的非侵入式摄像读取方法及系统 | |
CN111046859B (zh) | 字符识别方法及装置 | |
CN112699775A (zh) | 基于深度学习的证件识别方法、装置、设备及存储介质 | |
CN109886978B (zh) | 一种基于深度学习的端到端告警信息识别方法 | |
CN107403179B (zh) | 一种物品包装信息的注册方法及装置 | |
Shetty et al. | Segmentation and labeling of documents using conditional random fields | |
CN113963147B (zh) | 一种基于语义分割的关键信息提取方法及系统 | |
CN112036295A (zh) | 票据图像处理方法、装置、存储介质及电子设备 | |
CN113903022A (zh) | 基于特征金字塔与注意力融合的文本检测方法及系统 | |
CN116932499B (zh) | 一种dwg格式文件批量修改标注的方法 | |
CN113469005A (zh) | 一种银行回单的识别方法、相关装置及存储介质 | |
CN112613367A (zh) | 票据信息文本框获取方法、系统、设备及存储介质 | |
CN116052848B (zh) | 一种医学成像质控的数据编码方法及系统 | |
KR20020058161A (ko) | 코드화된 패턴 및 이의 코드 추출 방법 | |
CN113743146A (zh) | 基于深度学习的批量图形码识别方法、装置及存储介质 | |
CN116562247A (zh) | 电子表格内容生成方法、装置和计算机设备 | |
CN113920497B (zh) | 一种铭牌识别模型的训练、铭牌的识别方法及相关装置 | |
CN113221875B (zh) | 基于主动学习的目标检测模型训练方法 | |
CN115294593A (zh) | 一种图像信息抽取方法、装置、计算机设备及存储介质 | |
CN114120057A (zh) | 一种基于PaddleDetection的混淆矩阵生成方法 | |
CN116912867B (zh) | 结合自动标注和召回补全的教材结构提取方法和装置 | |
CN116229493B (zh) | 跨模态的图片文本命名实体识别方法、系统及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20211203 |
|
WW01 | Invention patent application withdrawn after publication |