CN116188940A - 训练模型的方法、装置、存储介质以及电子设备 - Google Patents
训练模型的方法、装置、存储介质以及电子设备 Download PDFInfo
- Publication number
- CN116188940A CN116188940A CN202310028098.0A CN202310028098A CN116188940A CN 116188940 A CN116188940 A CN 116188940A CN 202310028098 A CN202310028098 A CN 202310028098A CN 116188940 A CN116188940 A CN 116188940A
- Authority
- CN
- China
- Prior art keywords
- detection algorithm
- printed circuit
- algorithm model
- circuit board
- target detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种训练模型的方法、装置、存储介质以及电子设备。其中,该方法包括:获取第一目标检测算法模型以及历史时段第一印刷电路板缺陷部位的第一尺寸以及预设阈值,确定聚类后的第一尺寸中的最小值与预设阈值的差值;在差值小于零的情况下,在第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型;获取已标注好的多个第二印刷电路板图像,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型。本申请解决了由于深度学习算法中的深层卷积会使微小目标感受野不断变大,多次下采样后目标特征图减小造成的印刷电路板缺陷的漏检,识别结果准确性较差的技术问题。
Description
技术领域
本申请涉及印刷电路板检测领域,具体而言,涉及一种训练模型的方法、装置、存储介质以及电子设备。
背景技术
近年来,随着深度学习的不断发展,基于深度学习的印刷电路板缺陷检测方法主要分为单阶段印刷电路板缺陷检测方法和两阶段印刷电路板缺陷检测方法,两阶段印刷电路板缺陷检测方法首先进行区域推荐,然后进行目标分类,这类算法一般检测速度慢,但检测精度较高,比如RCNN系列算法;单阶段印刷电路板缺陷检测方法能够直接回归出目标的位置和类别,输出缺陷检测的结果,这类算法一般检测速度快,但检测精度稍低,如YOLO系列算法。随着单阶段目标检测方法的不断改进,单阶段目标检测方法越来越多的被用于工业界。然而,印刷电路板缺陷外观面积较小,对于微小的目标区域,深度学习算法中的深层卷积会使微小目标感受野不断变大,多次下采样后目标特征图不断减小,从而容易造成印刷电路板缺陷的漏检,识别结果的准确性较差。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种训练模型的方法、装置、存储介质以及电子设备,以至少解决由于深度学习算法中的深层卷积会使微小目标感受野不断变大,多次下采样后目标特征图减小造成的印刷电路板缺陷的漏检,识别结果准确性较差的技术问题。
根据本申请实施例的一个方面,提供了一种训练模型的方法,包括:获取第一目标检测算法模型,其中,第一目标检测算法模型的YOLO层设置有第一数量的第一预测模块,其中,各个第一预测模块对应的第一特征图尺度大小不同;获取历史时段第一印刷电路板缺陷部位的第一尺寸以及预设阈值,确定聚类后的第一尺寸中的最小值与预设阈值的差值,其中,预设阈值用于指无需增设预测模块临界值;在差值小于零的情况下,在第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型,其中,第二预测模块对应的第二特征图尺度大于第一预测模块对应的第一特征图的最大尺度;获取已标注好的多个第二印刷电路板图像,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型。
可选地,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型,包括:按照预定比例将多个第二印刷电路板划分为训练集与测试集;基于训练集对第二目标检测算法模型进行训练,得到第二目标检测算法模型中各层网络所占的第一权重值,其中,各层网络包括:Darknet层网络与YOLO层网络;基于测试集验证第一权重值的有效性确定有效的第二权重值,基于第二权重值构建第三目标检测算法模型。
可选地,在基于训练集对第二目标检测算法模型进行训练的过程中,第二目标检测算法采用的损失函数为CIOU边界损失函数。
可选地,第二预测模块对应的第二特征图尺度根据历史时段中第一尺寸聚类后对应的最小值确定,最小值越小,第二预测模块对应的第二特征图尺度越大。
可选地,在得到第三目标检测算法模型之后,上述方法还包括:获取待检测的第三印刷电路板图像;采用第三目标检测算法模型对第三印刷电路板图像进行分析,得到第三印刷电路板图像的识别结果,其中,识别结果用于指示第三印刷电路板的缺陷类型。
可选地,采用第三目标检测算法模型对第三印刷电路板图像进行分析,得到第三印刷电路板图像的识别结果,包括:基于聚类算法将多个第三印刷电路板图像中的各个第三印刷电路板缺陷尺寸聚类为多类缺陷尺寸;将聚类后的多类缺陷尺寸平均分配给第三目标检测算法模型得到第三印刷电路板图像的识别结果。
可选地,识别结果包括以下至少之一:线路漏焊、线路缺损、线路开路以及线路短路。
根据本申请实施例的另一方面,还提供了一种训练模型的装置,包括:第一获取模块,用于获取第一目标检测算法模型,其中,第一目标检测算法模型的YOLO层设置有第一数量的第一预测模块,其中,各个第一预测模块对应的第一特征图尺度大小不同;第二获取模块,用于获取历史时段第一印刷电路板缺陷部位的第一尺寸以及预设阈值,确定聚类后的第一尺寸中的最小值与预设阈值的差值,其中,预设阈值用于指无需增设预测模块临界值;第一确定模块,用于在差值小于零的情况下,在第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型,其中,第二预测模块对应的第二特征图尺度大于第一预测模块对应的第一特征图尺度的最大尺度;第二确定模块,用于获取已标注好的多个第二印刷电路板图像,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型。
根据本申请实施例的另一方面,还提供了一种非易失性存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行任意一种训练模型的方法。
根据本申请实施例的另一方面,还提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现任意一种训练模型的方法。
在本申请实施例中,通过获取第一目标检测算法模型,其中,第一目标检测算法模型的YOLO层设置有第一数量的第一预测模块,其中,各个第一预测模块对应的第一特征图尺度大小不同;获取历史时段第一印刷电路板缺陷部位的第一尺寸以及预设阈值,确定聚类后的第一尺寸中的最小值与预设阈值的差值,其中,预设阈值用于指无需增设预测模块临界值;在差值小于零的情况下,在第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型,其中,第二预测模块对应的第二特征图尺度大于第一预测模块对应的第一特征图的最大尺度;获取已标注好的多个第二印刷电路板图像,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型,达到了根据印刷电路板的尺寸调整预测模块的个数以及特征尺度的目的,实现了提升模型识别精度,减少缺陷漏检的技术效果,进而解决了由于深度学习算法中的深层卷积会使微小目标感受野不断变大,多次下采样后目标特征图减小造成的印刷电路板缺陷的漏检,识别结果准确性较差的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的训练模型的方法的流程示意图;
图2是YOLO3算法模型的基本结构示意图;
图3是本申请一实施例中的印刷电路板缺陷检测方法的流程示意图;
图4是本申请的常见缺陷情况示意图;
图5是根据本申请实施例的一种训练模型的装置的结构示意图;
图6示出了可以用来实施本申请的实施例的示例电子设备600的示意性框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例,提供了一种训练模型的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的训练模型的方法,如图1所示,该方法包括如下步骤:
步骤S102,获取第一目标检测算法模型,其中,第一目标检测算法模型的YOLO层设置有第一数量的第一预测模块,其中,各个第一预测模块对应的第一特征图尺度大小不同;
步骤S104,获取历史时段第一印刷电路板缺陷部位的第一尺寸以及预设阈值,确定聚类后的第一尺寸中的最小值与预设阈值的差值,其中,预设阈值用于指无需增设预测模块临界值;
可以理解的,通过历史时段第一印刷电路板聚类后的缺陷第一尺寸可以确定是否增设预测模块,例如,如果聚类后的第一尺寸中最小值小于预设阈值,则可以设置特尺度更大的预测模块(即检测精度更高的预测模块),以满足不同尺寸的测试要求。
容易注意到的是,聚类后的缺陷尺寸基本可以预测现在、以后可能要检测的印刷电路板缺陷的尺寸,因此,可以通过聚类后的第一印刷板缺陷尺度大小确定是否增设特征尺度更大的预测模块。
步骤S106,在差值小于零的情况下,在第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型,其中,第二预测模块对应的第二特征图尺度大于第一预测模块对应的第一特征图尺度的最大尺度,优选的,上述第二数量为1个;
可以理解的,如果差值大于等于零,则表示当前预测模块满足精确度要求,则可以暂不增加预测模块。而如果差值小于零,则相当于检测电路板的缺陷图像尺寸是比较小的,即对精度的要求是比较高的,因此,需要新增预测模块,以用于对较小尺寸的印刷电路板的进行检测。
例如,历史时段第一印刷电路板缺陷部位的第一尺寸像素为5×5,预设像素阈值为10×10,则差值小于0,则可以确定现在要增加的预测模块的数量为1个,特征尺度为104×104。
步骤S108,获取已标注好的多个第二印刷电路板图像,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型。
需要说明的是,上述第一目标检测算法模型包括但不限于:YOLO3算法模型,也可以为YOLO4算法模型以及YOLO5算法模型等。
现以YOLO3算法模型为例进行介绍,图2是YOLO3算法模型的基本机构示意图,如图2所示,该算法模型主要由两个网络组成,分别Darknet53网络和YOLO层网络,Darknet53主要用来提取输入图像特征的,它是由一系列的1×1和3×3的卷积层组成,并且引入了残差控制结构,突破了卷积神经网络层数的限制,能够很好的提取图像特征;YOLO层网络主要负责检测物体的功能,它有3个不同尺度的预测模块,利用图像特征融合金字塔思想,将不同尺度的特征图拼接进行信息传递,通过上采样和拼接等方式将高通道和小尺寸特征语义融合到低通道和大尺寸特征语义信息中。
如图2所示,假设原YOLOv3最终输出的3个尺度特征图分别为13×13、26×26和52×52,本申请现可增加输出尺度104×104模块,具体的,可由Res2后引出一个预测尺度,和第三个预测尺度特征向量的上采样进行融和,形成尺度大小为104×104的输出特征图。
该训练模型的方法中,通过获取第一目标检测算法模型,其中,第一目标检测算法模型的YOLO层设置有第一数量的第一预测模块,其中,各个第一预测模块对应的第一特征图尺度大小不同;获取历史时段已检测的第一印刷电路板缺陷的第一尺寸以及预设阈值,确定聚类后的第一尺寸中的最小值与预设阈值的差值,其中,预设阈值用于指无需增设预测模块临界值;在差值小于零的情况下,在第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型,其中,第二预测模块对应的第二特征图尺度大于第一预测模块对应的第一特征图的最大尺度;获取已标注好的多个第二印刷电路板图像,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型,达到了根据印刷电路板的尺寸调整预测模块的个数以及特征尺度的目的,实现了提升模型识别精度,减少缺陷漏检的技术效果,进而解决了由于深度学习算法中的深层卷积会使微小目标感受野不断变大,多次下采样后目标特征图减小造成的印刷电路板缺陷的漏检,识别结果准确性较差的技术问题。
本申请一些实施例中,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型,可以通过如下方式确定,具体的,可按照预定比例将多个第二印刷电路板划分为训练集与测试集;基于训练集对第二目标检测算法模型进行训练,得到第二目标检测算法模型中各层网络所占的第一权重值,其中,各层网络包括:Darknet层网络与YOLO层网络;基于测试集验证第一权重值的有效性确定有效的第二权重值,基于第二权重值构建第三目标检测算法模型。
举例而言,图3是本申请一实施例中的印刷电路板缺陷检测方法的流程示意图,如图3所示,可将已标注好的多个第二印刷电路板图像按照预定比例,例如2:1的比例分为训练集与测试集,然后基于训练集对第二目标检测算法模型(即改进的目标检测算法模型)进行训练得到各层网络的权重值(即权限检测权重),基于测试集对第二目标检测算法模型进行验证权重值的有效性,得到最终验证有效的检测权重,然后可以利用检测权重构建缺陷检测软件系统,最终,将电路板图像采集装置采集到的图像输入值该缺陷检测软件系统,得到缺陷检测结果。
需要说明的是,在基于训练集对第二目标检测算法模型进行训练的过程中,第二目标检测算法采用的损失函数为CIOU边界损失函数。
可以理解的,第二预测模块对应的第二特征图尺度根据历史时段中第一尺寸聚类后对应的最小值确定,最小值越小,第二预测模块对应的第二特征图尺度越大。
以上述实施例举例的YOLO3为例,可通过采用CIoU边界损失函数代替原YOLO3中的IoU边界损失函数。需要说明的是,IoU是两个目标区域重叠部分除以两个目标区域集合部分的结果,它是衡量在某一特定数据集上检测目标物体准确度的标准,然而IoU并没有考虑两个框之间的位置信息,当预测框和真实框不相交时,此时IoU为0,模型此时将无法进行继续优化,这大大增加了缺陷检测的漏检率。CIoU增加了检测框尺度的损失计算,增加了长和宽的损失计算,这样预测框就会更加符合真实框,CIoU的计算公式如下:
可以理解的,印刷电路板缺陷外观图像较小,通过选用CIoU边界损失函数可以更加准确地确定其位置,能够大大降低漏检率。
本申请一些实施例中,在得到第三目标检测算法模型之后,还可以获取待检测的第三印刷电路板图像;采用第三目标检测算法模型对第三印刷电路板图像进行分析,得到第三印刷电路板图像的识别结果,其中,识别结果用于指示第三印刷电路板的缺陷类型。
本申请一些可选的实施例中,采用第三目标检测算法模型对第三印刷电路板图像进行分析,得到第三印刷电路板图像的识别结果,可以通过如下方式实现,具体的,可基于聚类算法将多个第三印刷电路板中的各个第三电路板缺陷尺度聚类为多类缺陷尺寸;将聚类后的多类缺陷尺寸平均分配给第三目标检测算法模型得到第三印刷电路板图像的识别结果。
例如,检测尺度为4个,分别为上述的13×13、26×26、52×52,以及现增加输出尺度104×104模块,针对这4个检测尺度,可使用聚类算法对标注好的缺陷外观图像尺寸进行聚类,将聚类得到的12个先验框平均分给4个检测尺度,通过增加的104×104输出特征图能够检测到更加微小的缺陷,并且使用聚类算法聚类缺陷外观图像实际大小尺寸,能够更加快速地使检测模型收敛,从而提高缺陷检测效率。
需要说明的是,识别结果包括以下至少之一:线路漏焊、线路缺损、线路开路以及线路短路。图4是本申请的常见缺陷情况示意图,如图4所示,从左至右依次为线路漏焊、线路缺损、线路开路以及线路短路的示意图。
图5是根据本申请实施例的一种训练模型的装置,如图5所示,该装置包括:
第一获取模块50,用于获取第一目标检测算法模型,其中,第一目标检测算法模型的YOLO层设置有第一数量的第一预测模块,其中,各个第一预测模块对应的第一特征图尺度大小不同;
第二获取模块52,用于获取历史时段第一印刷电路板缺陷部位第一尺寸以及预设阈值,确定聚类后的第一尺寸中的最小值与预设阈值的差值,其中,预设阈值用于指无需增设预测模块临界值;
第一确定模块54,用于在差值小于零的情况下,在第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型,其中,第二预测模块对应的第二特征图尺度大于第一预测模块对应的第一特征图的最大尺度;
第二确定模块56,用于获取已标注好的多个第二印刷电路板图像,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型。
该训练模型的装置中,第一获取模块50,用于获取第一目标检测算法模型,其中,第一目标检测算法模型的YOLO层设置有第一数量的第一预测模块,其中,各个第一预测模块对应的第一特征图尺度大小不同;第二获取模块52,用于获取历史时段第一印刷电路板缺陷部位的第一尺寸以及预设阈值,确定聚类后的第一尺寸中的最小值与预设阈值的差值,其中,预设阈值用于指无需增设预测模块临界值;第一确定模块54,用于在差值小于零的情况下,在第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型,其中,第二预测模块对应的第二特征图尺度大于第一预测模块对应的第一特征图的最大尺度;第二确定模块56,用于获取已标注好的多个第二印刷电路板图像,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型,达到了根据印刷电路板的尺寸调整预测模块的个数以及特征尺度的目的,实现了提升模型识别精度,减少缺陷漏检的技术效果,进而解决了由于深度学习算法中的深层卷积会使微小目标感受野不断变大,多次下采样后目标特征图减小造成的印刷电路板缺陷的漏检,识别结果准确性较差的技术问题。
根据本申请实施例的另一方面,还提供了一种非易失性存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行任意一种训练模型的方法。
具体地,上述存储介质用于存储以下功能的程序指令,实现以下功能:
获取第一目标检测算法模型,其中,第一目标检测算法模型的YOLO层设置有第一数量的第一预测模块,其中,各个第一预测模块对应的第一特征图尺度大小不同;获取历史时段第一印刷电路板缺陷部位的第一尺寸以及预设阈值,确定聚类后第一尺寸中的最小值与预设阈值的差值,其中,预设阈值用于指无需增设预测模块临界值;在差值小于零的情况下,在第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型,其中,第二预测模块对应的第二特征图尺度大于第一预测模块对应的第一特征图的最大尺度;获取已标注好的多个第二印刷电路板图像,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型。
可选地,在本实施例中,上述存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。上述存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
在本申请一示例性实施例中,还提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现上述任一项的训练模型的方法。
可选地,该计算机程序在被处理器执行时可实现如下步骤:
获取第一目标检测算法模型,其中,第一目标检测算法模型的YOLO层设置有第一数量的第一预测模块,其中,各个第一预测模块对应的第一特征图尺度大小不同;获取历史时段第一印刷电路板缺陷部位的第一尺寸以及预设阈值,确定聚类后第一尺寸中的最小值与预设阈值的差值,其中,预设阈值用于指无需增设预测模块临界值;在差值小于零的情况下,在第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型,其中,第二预测模块对应的第二特征图尺度大于第一预测模块对应的第一特征图的最大尺度;获取已标注好的多个第二印刷电路板图像,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型。
根据本申请的实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述任一项的训练模型的方法。
可选地,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入设备输出设备和上述处理器连接。
图6示出了可以用来实施本申请的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如训练模型的方法。例如,在一些实施例中,训练模型的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的训练模型的方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行训练模型的方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
在本申请相关实施例中,通过获取第一目标检测算法模型,其中,第一目标检测算法模型的YOLO层设置有第一数量的第一预测模块,其中,各个第一预测模块对应的第一特征图尺度大小不同;获取历史时段第一印刷电路板缺陷部位的第一尺寸以及预设阈值,确定聚类后的第一尺寸中的最小值与预设阈值的差值,其中,预设阈值用于指无需增设预测模块临界值;在差值小于零的情况下,在第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型,其中,第二预测模块对应的第二特征图尺度大于第一预测模块对应的第一特征图的最大尺度;获取已标注好的多个第二印刷电路板图像,基于多个第二印刷电路板图像对第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型,达到了根据印刷电路板的尺寸调整预测模块的个数以及特征尺度的目的,实现了提升模型识别精度,减少缺陷漏检的技术效果,进而解决了由于深度学习算法中的深层卷积会使微小目标感受野不断变大,多次下采样后目标特征图减小造成的印刷电路板缺陷的漏检,识别结果准确性较差的技术问题。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种训练模型的方法,其特征在于,包括:
获取第一目标检测算法模型,其中,所述第一目标检测算法模型的YOLO层设置有第一数量的第一预测模块,其中,各个第一预测模块对应的第一特征图尺度大小不同;
获取历史时段第一印刷电路板缺陷部位的第一尺寸以及预设阈值,确定聚类后的第一尺寸中的最小值与所述预设阈值的差值,其中,所述预设阈值用于指无需增设预测模块临界值;
在所述差值小于零的情况下,在所述第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型,其中,所述第二预测模块对应的第二特征图尺度大于所述第一预测模块对应的第一特征图的最大尺度;
获取已标注好的多个第二印刷电路板图像,基于所述多个第二印刷电路板图像对所述第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型。
2.根据权利要求1所述的方法,其特征在于,基于所述多个第二印刷电路板图像对所述第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型,包括:
按照预定比例将所述多个第二印刷电路板划分为训练集与测试集;
基于所述训练集对所述第二目标检测算法模型进行训练,得到所述第二目标检测算法模型中各层网络所占的第一权重值,其中,所述各层网络包括:Darknet层网络与YOLO层网络;
基于所述测试集验证所述第一权重值的有效性确定有效的第二权重值,基于所述第二权重值构建所述第三目标检测算法模型。
3.根据权利要求2所述的方法,其特征在于,在基于所述训练集对所述第二目标检测算法模型进行训练的过程中,所述第二目标检测算法采用的损失函数为CIOU边界损失函数。
4.根据权利要求1所述的方法,其特征在于,所述第二预测模块对应的第二特征图尺度根据所述历史时段中所述第一尺寸聚类后对应的最小值确定,所述最小值越小,所述第二预测模块对应的第二特征图尺度越大。
5.根据权利要求1所述的方法,其特征在于,在得到第三目标检测算法模型之后,所述方法还包括:
获取待检测的第三印刷电路板图像;
采用所述第三目标检测算法模型对所述第三印刷电路板图像进行分析,得到所述第三印刷电路板图像的识别结果,其中,所述识别结果用于指示所述第三印刷电路板的缺陷类型。
6.根据权利要求5所述的方法,其特征在于,采用所述第三目标检测算法模型对所述第三印刷电路板图像进行分析,得到所述第三印刷电路板图像的识别结果,包括:
基于聚类算法将所述多个第三印刷电路板图像中的各个第三印刷电路板缺陷尺寸聚类为多类缺陷尺寸;
将聚类后的所述多类缺陷尺寸平均分配给第三目标检测算法模型得到所述第三印刷电路板图像的识别结果。
7.根据权利要求1至权利要求6任意一项所述的方法,其特征在于,所述识别结果包括以下至少之一:线路漏焊、线路缺损、线路开路以及线路短路。
8.一种训练模型的装置,其特征在于,包括:
第一获取模块,用于获取第一目标检测算法模型,其中,所述第一目标检测算法模型的YOLO层设置有第一数量的第一预测模块,其中,各个第一预测模块对应的第一特征图尺度大小不同;
第二获取模块,用于获取历史时段第一印刷电路板缺陷部位的第一尺寸以及预设阈值,确定聚类后的第一尺寸中的最小值与所述预设阈值的差值,其中,所述预设阈值用于指无需增设预测模块临界值;
第一确定模块,用于在所述差值小于零的情况下,在所述第一目标检测算法模型中的YOLO层增设第二数量的第二预测模块得到第二目标检测算法模型,其中,所述第二预测模块对应的第二特征图尺度大于所述第一预测模块对应的第一特征图的最大尺度;
第二确定模块,用于获取已标注好的多个第二印刷电路板图像,基于所述多个第二印刷电路板图像对所述第二目标检测算法模型进行模型训练及测试得到第三目标检测算法模型。
9.一种非易失性存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述训练模型的方法。
10.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的训练模型的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310028098.0A CN116188940A (zh) | 2023-01-09 | 2023-01-09 | 训练模型的方法、装置、存储介质以及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310028098.0A CN116188940A (zh) | 2023-01-09 | 2023-01-09 | 训练模型的方法、装置、存储介质以及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116188940A true CN116188940A (zh) | 2023-05-30 |
Family
ID=86432102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310028098.0A Pending CN116188940A (zh) | 2023-01-09 | 2023-01-09 | 训练模型的方法、装置、存储介质以及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116188940A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117710944A (zh) * | 2024-02-05 | 2024-03-15 | 虹软科技股份有限公司 | 模型缺陷检测方法、模型训练方法、目标检测方法和系统 |
CN117893513A (zh) * | 2024-01-19 | 2024-04-16 | 桂林诗宇电子科技有限公司 | 一种基于视觉神经网络算法的pcb板检测方法及系统 |
-
2023
- 2023-01-09 CN CN202310028098.0A patent/CN116188940A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117893513A (zh) * | 2024-01-19 | 2024-04-16 | 桂林诗宇电子科技有限公司 | 一种基于视觉神经网络算法的pcb板检测方法及系统 |
CN117710944A (zh) * | 2024-02-05 | 2024-03-15 | 虹软科技股份有限公司 | 模型缺陷检测方法、模型训练方法、目标检测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116188940A (zh) | 训练模型的方法、装置、存储介质以及电子设备 | |
CN113837596B (zh) | 一种故障确定方法、装置、电子设备及存储介质 | |
CN113705628B (zh) | 预训练模型的确定方法、装置、电子设备以及存储介质 | |
CN115082920A (zh) | 深度学习模型的训练方法、图像处理方法和装置 | |
CN113112497B (zh) | 一种基于零样本学习的工业外观缺陷检测方法、电子设备及存储介质 | |
CN113705362B (zh) | 图像检测模型的训练方法、装置、电子设备及存储介质 | |
CN113537192B (zh) | 图像检测方法、装置、电子设备及存储介质 | |
CN113469025A (zh) | 应用于车路协同的目标检测方法、装置、路侧设备和车辆 | |
CN113947188A (zh) | 目标检测网络的训练方法和车辆检测方法 | |
CN113870334A (zh) | 深度检测方法、装置、设备以及存储介质 | |
CN114821063A (zh) | 语义分割模型的生成方法及装置、图像的处理方法 | |
CN111784053A (zh) | 交易风险检测方法、设备及可读存储介质 | |
CN113052063A (zh) | 置信度阈值选择方法、装置、设备以及存储介质 | |
CN117593115A (zh) | 信贷风险评估模型的特征值确定方法、装置、设备和介质 | |
CN111724338B (zh) | 一种转盘异常识别方法、系统、电子设备及介质 | |
CN116186534B (zh) | 预训练模型的更新方法、装置及电子设备 | |
CN110544166A (zh) | 样本生成方法、装置及存储介质 | |
CN112749978B (zh) | 检测方法、装置、设备、存储介质以及程序产品 | |
CN115546539A (zh) | 基于机器视觉的磁翻板液位读取方法、装置及可读介质 | |
CN113221519B (zh) | 用于处理表格数据的方法、装置、设备、介质和产品 | |
CN115359322A (zh) | 一种目标检测模型训练方法、装置、设备和存储介质 | |
CN111898626B (zh) | 模型确定方法、装置和电子设备 | |
CN113807391A (zh) | 任务模型的训练方法、装置、电子设备及存储介质 | |
CN114266941A (zh) | 一种快速检测图像样本标注成果数据方法 | |
CN114581711A (zh) | 目标对象检测方法、装置、设备、存储介质以及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |