CN115205860A - 工件正反面识别方法、装置、设备及存储介质 - Google Patents

工件正反面识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115205860A
CN115205860A CN202210870410.6A CN202210870410A CN115205860A CN 115205860 A CN115205860 A CN 115205860A CN 202210870410 A CN202210870410 A CN 202210870410A CN 115205860 A CN115205860 A CN 115205860A
Authority
CN
China
Prior art keywords
workpiece
text box
recognized
text
circle center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210870410.6A
Other languages
English (en)
Inventor
钟裕
沈飞
曹恩华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shengjing Intelligent Technology Jiaxing Co ltd
Original Assignee
Shengjing Intelligent Technology Jiaxing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shengjing Intelligent Technology Jiaxing Co ltd filed Critical Shengjing Intelligent Technology Jiaxing Co ltd
Priority to CN202210870410.6A priority Critical patent/CN115205860A/zh
Publication of CN115205860A publication Critical patent/CN115205860A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种工件正反面识别方法、装置、设备及存储介质,属于工件识别技术领域,方法通过采集待识别工件的图像;输入待识别工件的图像至文本框检测模型,输出文本框参数集合,文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的;根据文本框参数集合中的每组文本框参数,确定文本框参数集合中带角度文本框的数量;若带角度文本框的数量等于第一预设阈值,则确定待识别工件的当前面为反面;若带角度文本框的数量等于第二预设阈值,提取待识别工件的圆心和半径;基于圆心、半径和预设判断规则,识别待识别工件的当前面为正面或反面,通过自动识别文本框参数和几何特征,有效地提高了自动化生产线的工作效率。

Description

工件正反面识别方法、装置、设备及存储介质
技术领域
本发明涉及工件识别技术领域,尤其涉及一种工件正反面识别方法、装置、设备及存储介质。
背景技术
为了提高制造类企业的工厂自动化和智能化水平,在建立‘灯塔工厂’或‘黑灯工厂’时需要鲁邦的决策信号配合高度自动化机器完成。在轴承、汽车制造、轮船和军工行业中,轮形工件的生产制造和后期装配是极其重要的一个环节,对轮形工件正反面进行准确判别是一项重要工序。目前,为准确地识别出轮形工件的正反面,多采用人工识别判定的方法。
但是,人工识别判定的方法既浪费人力和开支,同时降低了自动化生产线的工作效率。
发明内容
本发明提供一种工件正反面识别方法、装置、设备及存储介质,用以解决现有技术中人工识别工件正反面效率低的缺陷,实现自动、准确地完成对工件正反面的识别,提高生产线的工作效率。
本发明提供一种工件正反面识别方法,包括:
采集待识别工件的图像;
输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,所述文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的;
根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量;
若所述带角度文本框的数量等于第一预设阈值,则确定所述待识别工件的当前面为反面;
若所述带角度文本框的数量等于第二预设阈值,提取所述待识别工件的圆心和半径;
基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面。
根据本发明提供的一种工件正反面识别方法,所述文本框参数包括旋转因子;
所述根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量,包括:
若所述旋转因子小于预设阈值,确定所述旋转因子对应的文本框为带角度的文本框;
统计所有所述带角度的文本框,得到所述文本框参数集合中带角度文本框的数量。
根据本发明提供的一种工件正反面识别方法,所述基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面,包括:
分别计算每个所述带角度文本框的中心点与所述圆心的距离值;
判断各个所述中心点与所述圆心的距离值是否均小于或等于第一预设距离值;
若小于或等于第一预设距离值,则确定所述待识别工件的当前面为正面,否则为反面。
根据本发明提供的一种工件正反面识别方法,所述判断各个所述中心点与所述圆心的距离值是否均小于或等于第一预设距离值,包括:
将所有的所述中心点与所述圆心的距离值进行两两相减并分别取绝对值;
分别判断每个所述绝对值是否均小于或等于第一预设距离值。
根据本发明提供的一种工件正反面识别方法,所述分别计算每个所述带角度文本框的中心点与所述圆心的距离值之前,还包括:
确定每个所述带角度文本框的较长边的边垂线;
分别计算每个所述边垂线与所述圆心的距离值;
若每个所述边垂线与所述圆心的距离值均小于或等于第二预设距离值,则确定所述带角度文本框为正常文本框,否则重新采集待识别工件的图像。
根据本发明提供的一种工件正反面识别方法,所述提取所述待识别工件的圆心和半径,包括:
采集所述待识别工件的圆形边界上的预设数量的点;
转换所述预设数量的点的坐标至圆坐标系中,将所述预设数量的点对应的圆的交点作为所述待识别工件的圆心;
当在所述圆心对应的外圆的半径上检测到内圆时,确定出所述半径的大小。
根据本发明提供的一种工件正反面识别方法,所述输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,包括:
输入所述待识别工件的图像至文本框检测模型,所述文本框检测模型通过识别所述待识别工件的图像中的目标框,确定所述目标框的四个角的点坐标;根据所述四个角的点坐标,获取所述目标框的最小外接矩形;基于预设关系、所述目标框和所述最小外接矩形,输出文本框参数集合。
本发明还提供一种工件正反面识别装置,包括:
采集模块,用于采集待识别工件的图像;
大数据模块,用于输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,所述文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的;
确定模块,用于根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量;若所述带角度文本框的数量等于第一预设阈值,则确定所述待识别工件的当前面为反面;
提取模块,用于若所述带角度文本框的数量等于第二预设阈值,提取所述待识别工件的圆心和半径;
识别模块,用于基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述工件正反面识别方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述工件正反面识别方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述工件正反面识别方法。
本发明提供的一种工件正反面识别方法、装置、设备及存储介质,方法通过采集待识别工件的图像;输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,所述文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的;根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量;若所述带角度文本框的数量等于第一预设阈值,则确定所述待识别工件的当前面为反面;若所述带角度文本框的数量等于第二预设阈值,提取所述待识别工件的圆心和半径;基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面,通过机器学习模型自动识别文本框参数,然后结合待识别工件的几何特征自动的完成对待识别工件正反面的识别,提升了自动化水平的同时,有效地提高了自动化生产线的工作效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的工件正反面识别方法的流程示意图;
图2是本发明提供的文本框检测模型的工作原理示意图;
图3是本发明提供的文本框样本的原理示意图;
图4是本发明提供的工件轮廓检测结果的示意图;
图5是本发明提供的文本框的边垂线的原理示意图;
图6是本发明提供的工件正反面识别装置的结构示意图;
图7是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图7描述本发明的一种工件正反面识别方法、装置、设备及存储介质。
图1是本发明提供的工件正反面识别方法的流程示意图,图2是本发明提供的文本框检测模型的工作原理示意图,图3是本发明提供的文本框样本的原理示意图。
如图1所示,本实施例提供的一种工件正反面识别方法,执行主体可以是自动化控制系统,本实施例中的工件以驱动轮的轮形工件为例进行说明,主要包括以下步骤:
101、采集待识别工件的图像。
具体的,轮形工件自身有独有的特性,即轮形工件上齿根或齿勾槽中存在文字特征,定义带有文字特征的一面为正面,正面所背对的另一面即为反面,定义图像采集设备所对着的方向为下,即图像采集设备识别后的待识别工件面的朝向为朝上,也就是最终识别到的结果为正面朝上或反面朝上,定义需要进行正反面识别的工件为待识别工件。具体的,采集待识别工件的图像的方式可以是通过摄像头采集,也可以是通过其他的方式进行采集,本实施例中不再进行详细说明,只要能够清晰准确地捕捉到待识别工件的图像即可。
102、输入待识别工件的图像至文本框检测模型,输出文本框参数集合,文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的。
具体的,在有效地采集到待识别工件的图像之后,将其输入至提前训练好的神经网络模型即文本框检测模型之中,然后文本框检测模型进行数据的运算处理,输出文本框参数集合,文本框参数集合指的是多组的文本框参数。即文本框检测模型的输入为图像,输出为文本框参数,针对不同的待识别工件输出得到的文本框参数数量不同,以驱动轮为例,其本身有三组按顺序排列的文本框,因此,文本框检测模型检测到的文本框参数集合包括三组文本框参数。其中,文本框检测模型对待识别工件的详细的处理过程,如图2所示,文本框检测模型的具体识别过程为首先通过Backbone将待识别工件的图像转化为目标框,然后再通过Feature map确定出目标框的四个角的点坐标,再通过RoIAlign将四个角的点坐标转化为最小外接矩形,最后再通过两个FC层,将最小外接矩形转化为文本框参数集合,其中cls表示每组文本框参数的标识,以保证多组文本框参数识别的准确度。
而具体的文本框检测模型是基于工件的图像样本和文本框参数样本进行训练所得到的。具体的训练过程则可以是:首先制作数据集,如图3所示,矩形框的标签除了(x,y,w,h)之外,还需要有表示旋转框的额外标签,即(α1,α2,α3,α4,),以及旋转因子r来表示矩形框是否发生了旋转,即是否为带角度的矩形框,需说明的是,该处指出的矩形框,记为后续识别过程中对应的文本框,也就是矩形框在文本框检测模型的训练过程中作为样本。
然后按照字符方向进行矩形框的标注,得到四个角的点坐标,进行mask图制作,利用opencv求解矩形框的最小外接矩形,得到x,y,w,h,根据图3原理可知,α1=s1/w,α2=s2/h,α3=s3/w,α4=s4/h,当标注矩形框为水平时,α均为1,旋转因子r为标注矩形框与最小外接矩的比值,当标注矩形框为水平时,r等于1。在训练文本框检测模型时,采用fasterrcnn架构,包含Backbone,Feature map,RoIAlign和两个FC层,最后生成两个分支,一个分支为分类信息,可设置为1,另一个分支为预测框的九个信息,九个信息指的是(x,y,w,h,α1,α2,α3,α4,r)。分类信息可以理解为具体的每一组的名称,也就是每一组的九个信息对应着一个分类信息,从而保证每组九个信息的准确识别。在得到数据集和神经网络模型之后,按批次送入数据集,并进行数据增强,不断进行反向传播修正模型参数,直至模型收敛,保存模型,得到最终的文本框检测模型。在具体的应用中,就是将待识别工件的图像输入至文本框检测模型中,文本框检测模型输出文本框参数信息集合,文本框参数信息集合中可以包括多组的文本框参数,每组的文本框参数均为(x,y,w,h,α1,α2,α3,α4,r),其中,理论上r值为1,认为文本框为水平,实际上当r值大于某一预设阈值时,便认为文本框是水平的,否则为带角度文本框。
其中,模型训练过程中采用的多任务损失函数的计算公式如(1)所示:
Figure BDA0003760495460000081
其中,Ncls表示用于计算分类损失的Anchors数,默认是256;Lcls表示分类损失函数,常用的是交叉熵损失,用于前景和背景的分类任务;Nreg表示参与偏移量回归损失计算的前景Anchors数,一般选取离实际标签最接近的Anchor作为前景Anchor;Lreg表示回归损失函数,用于9个偏移值的回归任务;Lreg包含三个部分,分别是4个边框(xywh)的回归损失Lh、4个旋转框因子(α1~α4)的回归Lα和1个旋转因子(r)的回归损失Lr,具体如公式(2):
Lreg=λ1Lh2Lα3Lr (2)
其中,λ1、λ2和λ3为3项损失的均衡化权重,三部分各自均采用光滑L1(Smooth L1)损失,公式如下(3):
Figure BDA0003760495460000082
式中,δ是超参数,y是真实分数,f(x)是模型的预测分数。
因此,
Figure BDA0003760495460000083
αi表示模型预测旋转框因子,
Figure BDA0003760495460000084
表示真实旋转框因子;
同理,
Figure BDA0003760495460000085
ri表示模型预测的旋转因子,
Figure BDA0003760495460000086
表示真实的旋转因子。
103、根据文本框参数集合中的每组文本框参数,确定文本框参数集合中带角度文本框的数量。
具体的,得到的文本框参数集合中包括着多组的文本框参数,根据每组的文本框参数的具体的r值的大小,确定出文本框参数集合中的带角度文本框的数量。
104、若带角度文本框的数量等于第一预设阈值,则确定待识别工件的当前面为反面。
具体的,当确定出带角度文本框数量等于第一预设阈值时,则可以确定当前待识别工件的识别当前面为反面,例如第一预设阈值可以是0,也就是说在当前面未识别到带角度文本框时,表明当前面未识别到文字特征,此时的待识别工件对应的面便是反面。当然,根据不同的工件的特性,具体的第一预设阈值可以进行人为灵活设定,本实施例中不进行具体限定说明。
105、若带角度文本框的数量等于第二预设阈值,提取待识别工件的圆心和半径。
同理,若确定带角度文本框的数量等于第二预设阈值时,提取待识别工件的圆心和半径,例如第二预设阈值可以是3,也就是当识别到三个带角度的文本框时,便进行更为详细的识别确定当前面为正面还是反面,便需要提取待识别工件的圆心和半径。其中,若是识别到的带角度文本框数量不等于第一预设阈值,同时也不等于第二预设阈值时,表明此时的图像识别存在误差,则需要重新进行待识别工件的图像识别。
106、基于圆心、半径和预设判断规则,识别待识别工件的当前面为正面或反面。
在提取得到待识别工件的圆心和半径之后,便可以基于提取得到的待识别工件的圆心、半径和预设判断规则,识别出待识别工件的当前面为正面还是反面,也就是在识别到第二预设阈值的带角度文本框之后,便需要进一步的通过对待识别工件的轮廓信息进行几何特征的验证,来保证正反面识别的准确度。
本实施例提供的一种工件正反面识别方法,通过采集待识别工件的图像;输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,所述文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的;根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量;若所述带角度文本框的数量等于第一预设阈值,则确定所述待识别工件的当前面为反面;若所述带角度文本框的数量等于第二预设阈值,提取所述待识别工件的圆心和半径;基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面,通过机器学习模型自动识别文本框参数,然后结合待识别工件的几何特征自动的完成对待识别工件正反面的识别,提升了自动化水平的同时,有效地提高了自动化生产线的工作效率。
进一步的,在上述实施例的基础上,本实施例中的文本框参数包括旋转因子;具体的,根据文本框参数集合中的每组文本框参数,确定文本框参数集合中带角度文本框的数量,则可以包括:若旋转因子小于预设阈值,确定旋转因子对应的文本框为带角度的文本框;统计所有带角度的文本框,便可以得到文本框参数集合中带角度文本框的数量。
进一步的,在上述实施例的基础上,本实施例中的提取待识别工件的圆心和半径,可以是通过霍夫圆检测算法,霍夫圆检测算法针对前景点进行处理,首先对待识别工件的图像进行边缘检测得到前景边界点,本实施例中为轮形工件,其图像中存在圆形,则其轮廓必定属于前景点。检测原理同霍夫变换检测直线一样,将圆形的一般性方程进行坐标变换,由x-y坐标系转换到a-b坐标系,写成如下形式(a-x)2+(b-y)2=r2,那么x-y坐标系中圆形边界上的一点对应到a-b坐标系中即为一个圆。而x-y坐标系中的一个圆形边界上有很多个点,对应到a-b坐标系中就会有很多个圆。由于原图像中这些点都在同一个圆形上,那么转换后a和b必定也满足a-b坐标系下的所有圆形的方程式,此时许多对应的圆都会相交于一个点,那么这个交点即为圆心(a,b)。于是圆心和半径的具体提取过程则可以是采集待识别工件的圆形边界上的预设数量的点;转换预设数量的点的坐标至圆坐标系中,将预设数量的点对应的圆的交点作为待识别工件的圆心;统计局部交点处圆的个数,取每一个局部对应的圆个数的最大值,得到待识别工件的原图像中对应的圆形的圆心坐标(a,b),当在圆心对应的外圆的半径上检测到内圆时,便可以确定出半径的大小,从而得出具体的待识别工件的圆心和半径,如图4所示为本发明提供的工件轮廓检测结果的示意图。
进一步的,在上述实施例的基础上,本实施例中的基于圆心、半径和预设判断规则,识别待识别工件的当前面为正面或反面,可以包括:分别计算每个带角度文本框的中心点与圆心的距离值,也就是计算点与点的距离值,然后判断各个中心点与圆心的距离值是否均小于或等于第一预设距离值,例如第一预设距离值可以是1/5半径,半径指的是待识别工件的半径,若小于或等于第一预设距离值,则确定待识别工件的当前面为正面,否则为反面。而具体的判断各个中心点与圆心的距离值是否均小于或等于第一预设距离值,则可以是包括:将所有的中心点与圆心的距离值进行两两相减并分别取绝对值;分别判断每个绝对值是否均小于或等于第一预设距离值。即判断得到的多个带角度文本框的中心点的距离与待识别工件的圆心的距离是否相等,若相等则表明此时的带角度文本框在同一圆的边界上,此时表明文本框为正确的文字特征,从而更加精确地表明当前面为正面,否则为反面。
进一步的,在上述实施例的基础上,本实施例中的在分别计算每个带角度文本框的中心点与圆心的距离值之前,还需要进一步的确定带角度文本框是否正常,具体则可以包括:确定每个带角度文本框的较长边的边垂线;带角度的文本框为矩形框,且为长方形,因此针对于较长边做边垂线,此时的边垂线指向待识别工件的圆心方向,如图5所示,为本发明提供的文本框的边垂线的原理示意图,然后分别计算每个边垂线与圆心的距离值,计算过程便是点到直线的计算方式;若每个边垂线与圆心的距离值均小于或等于第二预设距离值,则确定带角度文本框为正常文本框,否则认为文本检测区域为误检框,便需要重新采集待识别工件的图像,重新获取正确的文本检测区域。只有在保证了检测到正确的文本检测区域之后,才能进行后续的每个文本框到圆心的距离的检测,才能保证最终识别结果的准确性。
基于同一总的发明构思,本申请还保护一种工件正反面识别装置,下面对本发明提供的工件正反面识别装置进行描述,下文描述的工件正反面识别装置与上文描述的工件正反面识别方法可相互对应参照。
图6是本发明提供的工件正反面识别装置的结构示意图。
如图6所示,本实施例提供的一种工件正反面识别装置,包括:
采集模块601,用于采集待识别工件的图像;
大数据模块602,用于输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,所述文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的;
确定模块603,用于根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量;若所述带角度文本框的数量等于第一预设阈值,则确定所述待识别工件的当前面为反面;
提取模块604,用于若所述带角度文本框的数量等于第二预设阈值,提取所述待识别工件的圆心和半径;
识别模块605,用于基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面。
本实施例提供的一种工件正反面识别装置,通过采集待识别工件的图像;输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,所述文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的;根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量;若所述带角度文本框的数量等于第一预设阈值,则确定所述待识别工件的当前面为反面;若所述带角度文本框的数量等于第二预设阈值,提取所述待识别工件的圆心和半径;基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面,通过机器学习模型自动识别文本框参数,然后结合待识别工件的几何特征自动的完成对待识别工件正反面的识别,提升了自动化水平的同时,有效地提高了自动化生产线的工作效率。
进一步的,本实施例中的所述文本框参数包括旋转因子;
所述确定模块603,具体用于:
若所述旋转因子小于预设阈值,确定所述旋转因子对应的文本框为带角度的文本框;
统计所有所述带角度的文本框,得到所述文本框参数集合中带角度文本框的数量。
进一步的,本实施例中的识别模块605,具体用于:
分别计算每个所述带角度文本框的中心点与所述圆心的距离值;
判断各个所述中心点与所述圆心的距离值是否均小于或等于第一预设距离值;
若小于或等于第一预设距离值,则确定所述待识别工件的当前面为正面,否则为反面。
进一步的,本实施例中的识别模块605,具体还用于:
将所有的所述中心点与所述圆心的距离值进行两两相减并分别取绝对值;
分别判断每个所述绝对值是否均小于或等于第一预设距离值。
进一步的,本实施例中的识别模块605,具体还用于:
确定每个所述带角度文本框的较长边的边垂线;
分别计算每个所述边垂线与所述圆心的距离值;
若每个所述边垂线与所述圆心的距离值均小于或等于第二预设距离值,则确定所述带角度文本框为正常文本框,否则重新采集待识别工件的图像。
进一步的,本实施例中的提取模块604,具体用于:
采集所述待识别工件的圆形边界上的预设数量的点;
转换所述预设数量的点的坐标至圆坐标系中,将所述预设数量的点对应的圆的交点作为所述待识别工件的圆心;
当在所述圆心对应的外圆的半径上检测到内圆时,确定出所述半径的大小。
进一步的,本实施例中的大数据模块602,具体用于:
输入所述待识别工件的图像至文本框检测模型,所述文本框检测模型通过识别所述待识别工件的图像中的目标框,确定所述目标框的四个角的点坐标;根据所述四个角的点坐标,获取所述目标框的最小外接矩形;基于预设关系、所述目标框和所述最小外接矩形,输出文本框参数集合。
图7是本发明提供的电子设备的结构示意图。
如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行工件正反面识别方法,该方法包括:采集待识别工件的图像;输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,所述文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的;根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量;若所述带角度文本框的数量等于第一预设阈值,则确定所述待识别工件的当前面为反面;若所述带角度文本框的数量等于第二预设阈值,提取所述待识别工件的圆心和半径;基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的采集待识别工件的图像;输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,所述文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的;根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量;若所述带角度文本框的数量等于第一预设阈值,则确定所述待识别工件的当前面为反面;若所述带角度文本框的数量等于第二预设阈值,提取所述待识别工件的圆心和半径;基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的采集待识别工件的图像;输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,所述文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的;根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量;若所述带角度文本框的数量等于第一预设阈值,则确定所述待识别工件的当前面为反面;若所述带角度文本框的数量等于第二预设阈值,提取所述待识别工件的圆心和半径;基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种工件正反面识别方法,其特征在于,包括:
采集待识别工件的图像;
输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,所述文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的;
根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量;
若所述带角度文本框的数量等于第一预设阈值,则确定所述待识别工件的当前面为反面;
若所述带角度文本框的数量等于第二预设阈值,提取所述待识别工件的圆心和半径;
基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面。
2.根据权利要求1所述的工件正反面识别方法,其特征在于,所述文本框参数包括旋转因子;
所述根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量,包括:
若所述旋转因子小于预设阈值,确定所述旋转因子对应的文本框为带角度的文本框;
统计所有所述带角度的文本框,得到所述文本框参数集合中带角度文本框的数量。
3.根据权利要求1所述的工件正反面识别方法,其特征在于,所述基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面,包括:
分别计算每个所述带角度文本框的中心点与所述圆心的距离值;
判断各个所述中心点与所述圆心的距离值是否均小于或等于第一预设距离值;
若小于或等于第一预设距离值,则确定所述待识别工件的当前面为正面,否则为反面。
4.根据权利要求3所述的工件正反面识别方法,其特征在于,所述判断各个所述中心点与所述圆心的距离值是否均小于或等于第一预设距离值,包括:
将所有的所述中心点与所述圆心的距离值进行两两相减并分别取绝对值;
分别判断每个所述绝对值是否均小于或等于第一预设距离值。
5.根据权利要求3所述的工件正反面识别方法,其特征在于,所述分别计算每个所述带角度文本框的中心点与所述圆心的距离值之前,还包括:
确定每个所述带角度文本框的较长边的边垂线;
分别计算每个所述边垂线与所述圆心的距离值;
若每个所述边垂线与所述圆心的距离值均小于或等于第二预设距离值,则确定所述带角度文本框为正常文本框,否则重新采集待识别工件的图像。
6.根据权利要求1所述的工件正反面识别方法,其特征在于,所述提取所述待识别工件的圆心和半径,包括:
采集所述待识别工件的圆形边界上的预设数量的点;
转换所述预设数量的点的坐标至圆坐标系中,将所述预设数量的点对应的圆的交点作为所述待识别工件的圆心;
当在所述圆心对应的外圆的半径上检测到内圆时,确定出所述半径的大小。
7.根据权利要求1所述的工件正反面识别方法,其特征在于,所述输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,包括:
输入所述待识别工件的图像至文本框检测模型,所述文本框检测模型通过识别所述待识别工件的图像中的目标框,确定所述目标框的四个角的点坐标;根据所述四个角的点坐标,获取所述目标框的最小外接矩形;基于预设关系、所述目标框和所述最小外接矩形,输出文本框参数集合。
8.一种工件正反面识别装置,其特征在于,包括:
采集模块,用于采集待识别工件的图像;
大数据模块,用于输入所述待识别工件的图像至文本框检测模型,输出文本框参数集合,所述文本框检测模型是基于工件的图像样本和文本框参数样本进行训练得到的;
确定模块,用于根据所述文本框参数集合中的每组文本框参数,确定所述文本框参数集合中带角度文本框的数量;若所述带角度文本框的数量等于第一预设阈值,则确定所述待识别工件的当前面为反面;
提取模块,用于若所述带角度文本框的数量等于第二预设阈值,提取所述待识别工件的圆心和半径;
识别模块,用于基于所述圆心、所述半径和预设判断规则,识别所述待识别工件的当前面为正面或反面。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述工件正反面识别方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述工件正反面识别方法。
CN202210870410.6A 2022-07-22 2022-07-22 工件正反面识别方法、装置、设备及存储介质 Pending CN115205860A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210870410.6A CN115205860A (zh) 2022-07-22 2022-07-22 工件正反面识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210870410.6A CN115205860A (zh) 2022-07-22 2022-07-22 工件正反面识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115205860A true CN115205860A (zh) 2022-10-18

Family

ID=83584901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210870410.6A Pending CN115205860A (zh) 2022-07-22 2022-07-22 工件正反面识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115205860A (zh)

Similar Documents

Publication Publication Date Title
EP3937128A2 (en) Image defect detection method and apparatus, electronic device, storage medium and product
CN112419299B (zh) 一种螺栓缺失检测方法、装置、设备及存储介质
CN110619333B (zh) 一种文本行分割方法、文本行分割装置及电子设备
CN110135514B (zh) 一种工件分类方法、装置、设备及介质
CN108256454B (zh) 一种基于cnn模型的训练方法、人脸姿态估测方法及装置
CN114972258B (zh) 基于机器视觉的电池表面缺陷检测方法、系统及相关设备
CN113516619B (zh) 一种基于图像处理技术的产品表面瑕疵识别方法
CN111415339A (zh) 一种复杂纹理工业产品图像缺陷检测方法
CN113947597B (zh) 一种基于屏蔽重建的工业缺陷检测方法、装置及介质
CN112085721A (zh) 基于人工智能的水淹车定损方法、装置、设备及存储介质
CN111178405A (zh) 一种融合多种神经网络的相似物体识别方法
CN110378337B (zh) 金属切削刀具图纸标识信息视觉输入方法及系统
CN115205860A (zh) 工件正反面识别方法、装置、设备及存储介质
CN116542926A (zh) 电池的二维码缺陷识别方法、装置、设备及存储介质
CN112001336A (zh) 行人越界报警方法、装置、设备及系统
CN112070735A (zh) 一种基于特设卷积算子的沥青芯样图像提取方法及系统
CN115937492A (zh) 一种基于特征识别的变电设备红外图像识别方法
CN115375965A (zh) 一种目标场景识别的预处理方法、目标场景识别方法
CN113554024A (zh) 一种车辆的清洁度的确定方法、装置及计算机设备
CN112016675A (zh) 用于钢板表面缺陷检测的cnn模型训练方法和装置
CN112614172A (zh) 基于三维视觉的平面和/或曲面划分方法以及系统
CN114723748B (zh) 电机控制器的检测方法、装置、设备及存储介质
CN112926590B (zh) 线缆上字符的分割识别方法及其系统
CN117036816A (zh) 一种船舶货仓状态检测方法
CN117745530A (zh) 一种动力电池表面缺陷视觉检测图像预处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination