CN114155412A - 深度学习模型迭代方法、装置、设备及存储介质 - Google Patents
深度学习模型迭代方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114155412A CN114155412A CN202210119889.XA CN202210119889A CN114155412A CN 114155412 A CN114155412 A CN 114155412A CN 202210119889 A CN202210119889 A CN 202210119889A CN 114155412 A CN114155412 A CN 114155412A
- Authority
- CN
- China
- Prior art keywords
- labeling
- model
- sample data
- image sample
- pcb image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种深度学习模型迭代方法、装置、设备及存储介质,属于模型迭代技术领域。本发明通过自动对获取的PCB图像数据进行自动标注,并将标注的可靠度与预设可靠度阈值进行比较,提高标注准确性,得到目标标注结果对应的待训练PCB图像样本数据并训练,得到参考模型,通过对参考模型进行测试得到目标模型,并通过待训练PCB图像样本数据对目标模型进行迭代,自动完成模型迭代,不需要人工主动参与,提高迭代效率且迭代结果准确。
Description
技术领域
本发明涉及模型迭代技术领域,尤其涉及一种深度学习模型迭代方法、装置、设备及存储介质。
背景技术
深度学习作为近几年比较前沿的算法,已经开始在各行各业进行使用,比如:人脸识别、语音处理、智能推荐、工业缺陷检测等,当深度学习英语到实际场景中,会存在之前训练好的模型出现一些问题的情况,因此需要不断丰富数据集进行模型优化,通过对模型不断迭代,得到优化的模型。
现有的深度学习模型迭代需要依赖人工进行处理和监控,效率低、容易遗漏数据且人工成本高。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种深度学习模型迭代方法、装置、设备及存储介质,旨在解决现有技术人工进行模型迭代效率低的技术问题。
为实现上述目的,本发明提供了一种深度学习模型迭代方法,所述方法包括以下步骤:
对获取的PCB图像样本数据进行自动标注,得到标注可靠度;
将所述标注可靠度与预设可靠度阈值进行比较;
在所述标注可靠度大于等于所述预设可靠度阈值时,将所述标注可靠度对应的标注结果作为目标标注结果;
根据所述目标标注结果得到待训练PCB图像样本数据;
将所述待训练PCB图像样本数据通过预设训练策略进行模型训练,得到参考模型;
将所述参考模型进行测试,得到目标模型;
基于所述待训练PCB图像样本数据对所述目标模型进行深度学习模型迭代。
可选地,所述对获取的PCB图像样本数据进行自动标注,得到标注可靠度,包括:
通过预设初始模型对所述PCB图像样本数据进行自动标注;
根据标注结果输出标注置信度;
根据所述标注置信度得到标注可靠度。
可选地,所述将所述标注可靠度与预设可靠度阈值进行比较之后,还包括:
在所述标注可靠度小于所述预设可靠度阈值时,将所述标注可靠度对应的PCB图像样本数据作为二次标注数据;
基于所述二次标注数据生成标注任务,以使用户根据所述标注任务对所述二次标注数据进行交叉标注。
可选地,所述根据所述目标标注结果得到待训练PCB图像样本数据,包括:
根据交叉标注结果得到二次标注结果;
将所述二次标注结果对应的PCB图像样本数据以及所述目标标注结果对应的PCB图像样本数据进行汇总,得到待训练PCB图像样本数据。
可选地,所述将所述待训练PCB图像样本数据通过预设训练策略进行模型训练,得到参考模型,包括:
通过预设数据挑选条件对所述待训练PCB图像样本数据进行分类,得到分类待训练PCB图像样本数据;
根据所述分类待训练PCB图像样本数据进行模型训练,得到参考模型。
可选地,所述将所述参考模型进行测试,得到目标模型,包括:
根据所述参考模型对所述PCB图像样本数据进行训练,得到训练一致率;
根据所述训练一致率对所述参考模型进行评分;
在参考模型的评分大于预设评分阈值时,将所述参考模型作为目标模型。
可选地,所述基于所述待训练PCB图像样本数据对所述目标模型进行深度学习模型迭代,包括:
通过所述目标模型对所述待训练PCB图像样本数据进行训练;
根据训练结果得到待训练PCB图像样本数据的置信度;
在所述待训练PCB图像样本数据的置信度小于预设置信度阈值时,得到异常数据;
基于所述异常数据对所述目标模型进行深度学习模型迭代。
此外,为实现上述目的,本发明还提出一种深度学习模型迭代装置,所述深度学习模型迭代装置包括:
标注模块,用于对获取的PCB图像样本数据进行自动标注,得到标注可靠度;
比较模块,用于将所述标注可靠度与预设可靠度阈值进行比较;
所述比较模块,还用于在所述标注可靠度大于等于所述预设可靠度阈值时,将所述标注可靠度对应的标注结果作为目标标注结果;
获取模块,用于根据所述目标标注结果得到待训练PCB图像样本数据;
训练模块,用于将所述待训练PCB图像样本数据通过预设训练策略进行模型训练,得到参考模型;
测试模块,用于将所述参考模型进行测试,得到目标模型;
迭代模块,用于基于所述待训练PCB图像样本数据对所述目标模型进行深度学习模型迭代。
此外,为实现上述目的,本发明还提出一种深度学习模型迭代设备,所述深度学习模型迭代设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的深度学习模型迭代程序,所述深度学习模型迭代程序配置为实现如上文所述的深度学习模型迭代方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有深度学习模型迭代程序,所述深度学习模型迭代程序被处理器执行时实现如上文所述的深度学习模型迭代方法的步骤。
本发明通过对获取的PCB图像样本数据进行自动标注,得到标注可靠度;将所述标注可靠度与预设可靠度阈值进行比较;在所述标注可靠度大于等于所述预设可靠度阈值时,将所述标注可靠度对应的标注结果作为目标标注结果;根据所述目标标注结果得到待训练PCB图像样本数据;将所述待训练PCB图像样本数据通过预设训练策略进行模型训练,得到参考模型;将所述参考模型进行测试,得到目标模型;基于所述待训练PCB图像样本数据对所述目标模型进行深度学习模型迭代,可自动对获取的PCB图像数据进行标注并训练,得到参考模型,通过对参考模型进行测试得到目标模型,并通过待训练PCB图像样本数据对目标模型进行迭代,自动完成模型迭代,不需要人工主动参与,提高迭代效率且迭代结果准确。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的深度学习模型迭代设备的结构示意图;
图2为本发明深度学习模型迭代方法第一实施例的流程示意图;
图3为本发明深度学习模型迭代方法第二实施例的流程示意图;
图4为本发明深度学习模型迭代方法第三实施例的流程示意图;
图5为本发明深度学习模型迭代方法第四实施例的流程示意图;
图6为本发明深度学习模型迭代方法第五实施例的流程示意图;
图7为本发明深度学习模型迭代方法一实施例中迭代整体流程示意图;
图8为本发明深度学习模型迭代装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的深度学习模型迭代设备结构示意图。
如图1所示,该深度学习模型迭代设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对深度学习模型迭代设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及深度学习模型迭代程序。
在图1所示的深度学习模型迭代设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明深度学习模型迭代设备中的处理器1001、存储器1005可以设置在深度学习模型迭代设备中,所述深度学习模型迭代设备通过处理器1001调用存储器1005中存储的深度学习模型迭代程序,并执行本发明实施例提供的深度学习模型迭代方法。
本发明实施例提供了一种深度学习模型迭代方法,参照图2,图2为本发明深度学习模型迭代方法第一实施例的流程示意图。
本实施例中,所述深度学习模型迭代方法包括以下步骤:
步骤S10:对获取的PCB图像样本数据进行自动标注,得到标注可靠度。
需要说明的是,本实施例的执行主体为实现深度学习模型迭代的系统,也可为其他实现相同或者相似功能的设备,本实施例对此不加以限定。
在本实施例中,PCB(Printed Circuit Board,印制电路板)图像数据为系统收集的印刷电路板图像数据,可通过PCB图像数据进行工业缺陷检查。在初始没有模型时,系统自动将实际场景中的PCB图像样本数据按照提前设置的数据收集选择条件,对数据进行自动收集并保存。数据的收集选择条件可以包括:指定收集的数据量,例如收集PCB图像样本数据500张等,也可以为指定数据收集选择比例,例如收集3中不同类型的PCB图像数据,每种类型的PCB图像样本数据随机挑选60%、或者按PCB图像样本数据图像清晰度、图像大小按设置的比例进行收集和保存等,本实施例对此不作限制。
在具体实施中,标注可靠度为标注的数据的准确性,可将标注可靠度作为判断模型是否需要进行优化的条件之一。由于此时系统中没有模型,则系统自动将获取的PCB图像样本数据进行自动标注,标注结果为空,标注可靠度为0,若此时系统中有模型,则通过系统中存在的模型对收集到的PCB图像样本数据进行自动标注,得到标注可靠度。标注可靠度的分数为0-1,可根据场景的不同选择不同的标注可靠度确定的方式,例如通过深度学习模型输出的训练结果的置信度进行标注可靠度确定,或者随机选择不同的训练数据训练多个深度学习网络模型,采用多个模型进行集体标注后对输出的标注结果进行可靠度衡量,也可为其他可进行标注可靠度确定的方法,本实施例对此不作限制。
步骤S20:将所述标注可靠度与预设可靠度阈值进行比较。
应理解的是,预设可靠度阈值可在标注前用户提前设置的阈值,可通过预设标注可靠度阈值判断当前标注结果是否可靠,预设可靠度阈值可为0.5、0.6、0.8等,可根据用户需求进行设置,本实施例中以0.5为例进行说明。通工匠当前标注数据的标注可靠度与预设可靠度阈值进行比较,可判断模型标注的数据是否可靠,是否可直接采纳系统中的模型标注的结果。
步骤S30:在所述标注可靠度大于等于所述预设可靠度阈值时,将所述标注可靠度对应的标注结果作为目标标注结果。
在具体实施中,目标标注结果为可直接进行训练的标注数据,当标注可靠度大于等于预设可靠度阈值,说明此时系统中模型标注的PCB图像样本数据较为准确和可靠,可直接采纳标注的结果,作为可训练的数据,将标注可靠度与预设可靠度阈值进行比较,可判断系统中模型自动标注是否可靠,极大的减少了人工需要标注的数据量,提高标注效率。
步骤S40:根据所述目标标注结果得到待训练PCB图像样本数据。
应理解的是,待训练PCB图像样本数据为标注好的、较为可靠的样本数据,可根据待训练PCB图像样本数据进行模型训练,得到训练好的模型。
步骤S50:将所述待训练PCB图像样本数据通过预设训练策略进行模型训练,得到参考模型。
在本实施例中,预设训练策略可为用户根据数据以及模型的种类和数量进行设置,例如将所有待训练PCB图像样本数据设置随机挑选条件挑选多份,并将每份的数据数量进行随机挑选,将挑选后的样本数据进行模型训练,得到参考模型。参考模型为通过待训练PCB图像样本数据进行训练得到的初始模型,得到参考模型后还需要对参考模型进行测试,提高模型的质量。
步骤S60:将所述参考模型进行测试,得到目标模型。
在具体实施中,目标模型为对模型进行筛选后的优化的模型,通过将参考模型进行模型测试,确定参考模型的质量,选择质量好的模型作为目标模型。
步骤S70:基于所述待训练PCB图像样本数据对所述目标模型进行深度学习模型迭代。
应理解的是,可通过目标模型对待训练PCB图像样本数据进行训练,并根据训练结果确定是否存在异常数据,异常数据为当前目标模型训练覆盖不到或者效果较弱的数据,当出现异常数据后,可对目标模型进行深度学习模型新一轮迭代,通过目标模型再次对PCB图像样本数据进行预测自动标注和训练,直至模型迭代的结果满足要求,通过异常数据对模型进行异常监控,减少人工监控工作量。
本实施例通过对获取的PCB图像样本数据进行自动标注,得到标注可靠度;将所述标注可靠度与预设可靠度阈值进行比较;在所述标注可靠度大于等于所述预设可靠度阈值时,将所述标注可靠度对应的标注结果作为目标标注结果;根据所述目标标注结果得到待训练PCB图像样本数据;将所述待训练PCB图像样本数据通过预设训练策略进行模型训练,得到参考模型;将所述参考模型进行测试,得到目标模型;基于所述待训练PCB图像样本数据对所述目标模型进行深度学习模型迭代,可自动对获取的PCB图像数据进行标注并训练,得到参考模型,通过对参考模型进行测试得到目标模型,并通过待训练PCB图像样本数据对目标模型进行迭代,自动完成模型迭代,不需要人工主动参与,提高迭代效率且迭代结果准确。
参考图3,图3为本发明深度学习模型迭代方法第二实施例的流程示意图。
基于上述第一实施例,本实施例深度学习模型迭代方法所述步骤S10,具体包括:
步骤S101:通过预设初始模型对所述PCB图像样本数据进行自动标注。
应理解的是,预设初始模型为系统中存在的模型,通过预设初始模型对收集到的PCB图像样本数据进行自动标注,标注输出结果可根据场景选择不同的方式,例如根据预设初始模型中的深度学习模型进行数据标注,根据标注结果输出置信度。若系统中不存在模型,则可直接将PCB图像样本数据自动标注为空,标注置信度为0。
步骤S102:根据标注结果输出标注置信度。
在具体实施中,通过预设初始模型对PCB图像样本数据进行自动标注后,可得到自动标注的数据的标注置信度。
步骤S103:根据所述标注置信度得到标注可靠度。
在本实施例中,标注置信度高则数据标注的可靠度高,标注置信度低则模型标注的数据可靠度低。标注结果以及标注置信度可根据设置的场景得到不同的标注结果。例如A:采用深度学习模型进行自动标注,输出的标注结果进行标注置信度衡量,标注置信度高的数据可靠度高,标注置信度低的数据可靠度低。B:采用不同的参数或随机选择不同的训练数据,训练多个深度学习网络模型,采用多个网络模型进行集体决策的方式,比如,3个模型决策,如果结果一致则以该结果为标注结果,可靠度为1,如果结果不一致则标注结果为空,可靠度为0。C:可采用上述A和B两种方法融合得到标注可靠度,如果3个模型结果一致,则以该结果为标注结果,标注可靠度设为3个模型输出的最小标注置信度值。还可为其他可得到标注可靠度的方式,本实施例对此不作限制。
本实施例通过预设初始模型对所述PCB图像样本数据进行自动标注;根据标注结果输出标注置信度;根据所述标注置信度得到标注可靠度,通过对预设初始模型标注的PCB图像样本数据输出的标注置信度得到对应的标注可靠度,可通过标注可靠度判断系统中的预设初始模型自动标注是否可靠,极大地减少了人工手动标注的数量。
参考图4,图4为本发明深度学习模型迭代方法第三实施例的流程示意图。
基于上述第一实施例,本实施例深度学习模型迭代方法在所述步骤S20之后,还包括:
步骤S21:在所述标注可靠度小于所述预设可靠度阈值时,将所述标注可靠度对应的PCB图像样本数据作为二次标注数据。
在具体实施中,二次标注数据为需要再次标注的数据,标注可靠度小于预设可靠度阈值,标注可靠度低,说明此时模型自动标注的结果可靠度并不达标,需要再次进行人工手动标注,以提高数据的可靠度。
步骤S22:基于所述二次标注数据生成标注任务,以使用户根据所述标注任务对所述二次标注数据进行交叉标注。
应理解的是,标注任务为需要人工进行手动标注的任务,对于标注可靠度不达标的数据,需要结合人工方式对二次标注数据进行手动标注数据,当得到二次标注数据后,系统会自动生成标注任务,分配给不同的人进行交叉标注,有些数据可能会标注多次,通过二次标注可以有效减少人工标注的不稳定性,提高数据标注的质量。
进一步地,所述步骤根据所述目标标注结果得到待训练PCB图像样本数据,包括:根据交叉标注结果得到二次标注结果;将所述二次标注结果对应的PCB图像样本数据以及所述目标标注结果对应的PCB图像样本数据自动进行汇总,得到待训练PCB图像样本数据。
需要说明的是,模型训练的待训练PCB图像样本数据为标注可靠度都满足预设标注可靠度阈值的数据,当存在小于预设标注可靠度阈值的数据时,需要生成标注任务,通过人工进行手动交叉标注,并生成二次标注结果,将二次标注结果对应的PCB图像样本数据和目标标注结果对应的PCB图像样本数据自动进行汇总,即将人工标注的数据和系统自动标注的数据进行汇总,得到待训练的PCB图像样本数据。
本实施例通过在所述标注可靠度小于所述预设可靠度阈值时,将所述标注可靠度对应的PCB图像样本数据作为二次标注数据基于所述二次标注数据生成标注任务,以使用户根据所述标注任务对所述二次标注数据进行交叉标注,通过对标注可靠度不达标的数据进行人工交叉标注,提高数据标注的质量。
参考图5,图5为本发明深度学习模型迭代方法第四实施例的流程示意图。
基于上述第一实施例,本实施例深度学习模型迭代方法所述步骤S50,具体包括:
步骤S501:通过预设数据挑选条件对所述待训练PCB图像样本数据进行分类,得到分类待训练PCB图像样本数据。
应理解的是,预设数据挑选条件为用户或工作人员根据待训练的样本数据的种类或者数量进行挑选的规则,例如自动将所有数据按照设置条件随机挑选3份,设置条件可以是:每种类别至少50组数据,最多300组数据;所有数据随机选择70%,通过预设数据挑选条件得到分类后的待训练PCB图像样本数据,待训练PCB图像样本数据分类灵活且全面。
步骤S502:根据所述分类待训练PCB图像样本数据进行模型训练,得到参考模型。
在具体实施中,参考模型为通过分类待训练PCB图像样本数据进行训练后得到的多个模型,例如通过3份数据可以训练3个模型,最后可以从3个模型中选择效果最好的模型进行使用,或者保留多个模型,采用多模型决策的方式得到参考模型,比通过人工划分训练集进行训练得到的单一模型更为准确和全面。
在本实施例中,当得到参考模型后,需要对得到的参考模型进行质量评价测试,以保证得到模型的质量,则步骤将所述参考模型进行测试,得到目标模型具体包括:根据所述参考模型对所述PCB图像样本数据进行训练,得到训练一致率;根据所述训练一致率对所述参考模型进行评分;在参考模型的评分大于预设评分阈值时,将所述参考模型作为目标模型。
应理解的是,训练一致率为参考模型中的多个模型进行训练得到训练结果的一致性。可根据训练一致率对参考模型进行评分,当评分大于预设评分阈值时,说明此模型的质量达到了设定的要求,并将模型质量好的参考模型作为目标模型。
需要说明的是,本方法通过对未标注的PCB图像样本数据输入至参考模型进行预测,并对每个模型统计与其他模型预测结果的一致率,按照训练一致率对每个模型进行评分。可首先在训练好的测试集中进行模型测试评价,没然后在未进行标注的数据中进行模型测试,测试方法如下:若在进行迭代之前系统中已经存在3个模型,将这3个模型作为旧模型,当前的参考模型中得到3个模型,共计6个模型,将未标注的PCB图像样本数据输入至6个模型中进行预测,对每个模型分别统计其与其他模型结果的一致率,按每个模型的训练一致率进行模型评分,并通过提前设置评分阈值,例如0.8,当模型的评分大于0.8,则可将大于0.8的模型作为目标模型,结合有标注的测试数据集中的测试评分和在大量现场无标注数据的测试评分,选择出最好的3个模型作为新一轮迭代后的模型,新一轮的模型,可能包含旧模型。
在具体实施中,当得到目标模型后,若目标模型有3个,可将模型组部署上线,当模型上线运行后,将场景中的所有数据预测结果进行保存,方便后续查看和分析。
本实施例通过预设数据挑选条件对所述待训练PCB图像样本数据进行分类,得到分类待训练PCB图像样本数据;根据所述分类待训练PCB图像样本数据进行模型训练,得到参考模型,通过预设数据挑选规则对数据进行分类,不同的分类结果可得到不同的模型训练结果,相比较人工划分训练数据存在主观因素的情况,可得到多种的模型,训练结果也更为准确。
参考图6,图6为本发明深度学习模型迭代方法第五实施例的流程示意图。
基于上述第一和第二实施例,本实施例深度学习模型迭代方法所述步骤S70,具体包括:
步骤S701:通过所述目标模型对所述待训练PCB图像样本数据进行训练。
应理解的是,当得到了目标模型后,可通过目标模型对待训练的样本数据进行训练,提升训练结果。
步骤S702:根据训练结果得到待训练PCB图像样本数据的置信度。
在具体实施中,存在得到的目标模型也会出现问题的情况,因此需要对模型训练进行监控,系统可自动收集每次训练后输出的置信度,并提前设置一个置信度阈值,当置信度阈值大于等于预设置信度阈值时,说明训练结果可靠度较高。预设置信度阈值可设置为0.6、0.7等,本实施例对此不作限制。
步骤S703:在所述待训练PCB图像样本数据的置信度小于预设置信度阈值时,得到异常数据。
需要说明的是,异常数据,指的是当前模型效果覆盖不到或者效果较弱的数据,可根据训练结果输出的置信度,当置信度分数小于预设置信度阈值时,说明数据训练的可靠度低,则将置信度低的数据作为异常数据,或者采用对比线上使用的多个模型结果,将多个模型结果不一致的数据作为异常数据。
步骤S704:基于所述异常数据对所述目标模型进行深度学习模型迭代。
在本实施例中,当得到了异常数据后,说明当前的模型质量不够好,存在一些问题,则需要对模型进行迭代,优化得到的目标模型,则可按照数据选择规则对得到的异常数据进行收集,异常数据反映了当前模型出现的问题,可通过异常数据将目标模型返回收集PCB图像样本数据的步骤,通过目标模型对自动收集的PCB图像样本数据进行自动标注,并根据标注结果得到待训练PCB图像样本数据,通过目标模型对待训练PCB图像样本数据,并根据训练结果对目标模型进行测试,不断迭代循环直至目标模型满足测试要求,完成深度学习模型迭代,得到最终的模型,通过对目标模型进行深度学习模型迭代,提升模型质量。
如图7所示,图7为本发明深度学习模型迭代整体流程示意图。通过系统自动收集PCB图像样本数据并保存,将收集到的数据进行标注,并根据标注置信度判断系统标注的数据是否可靠,当标注的数据不可靠时,通过人工对不可靠的数据进行重新标注,并将人工标注的数据以及系统自动标注的可靠的数据进行模型训练,得到模型后进行模型质量评价,根据评价结果得到筛选的质量好的模型,并将模型进行部署上线运行,系统通过模型训练输出的置信度对模型训练进行监控,当置信度较低时,可确定当前模型存在问题,则可对模型进行新一轮迭代,直至得到优化的模型,并将优化的模型进行部署上线运行。
本实施例通过所述目标模型对所述待训练PCB图像样本数据进行训练;根据训练结果得到待训练PCB图像样本数据的置信度;在所述待训练PCB图像样本数据的置信度小于预设置信度阈值时,得到异常数据;基于所述异常数据对所述目标模型进行深度学习模型迭代,通过系统自动监控模型训练结果,得到异常数据,并根据异常数据对效果不好的模型进行新一轮迭代,提升模型迭代效率,优化模型质量。
参照图8,图8为本发明深度学习模型迭代装置第一实施例的结构框图。
如图8所示,本发明实施例提出的深度学习模型迭代装置包括:
标注模块10,用于对获取的PCB图像样本数据进行自动标注,得到标注可靠度。
比较模块20,用于将所述标注可靠度与预设可靠度阈值进行比较。
所述比较模块20,还用于在所述标注可靠度大于等于所述预设可靠度阈值时,将所述标注可靠度对应的标注结果作为目标标注结果。
获取模块30,用于根据所述目标标注结果得到待训练PCB图像样本数据。
训练模块40,用于将所述待训练PCB图像样本数据通过预设训练策略进行模型训练,得到参考模型。
测试模块50,用于将所述参考模型进行测试,得到目标模型。
迭代模块60,用于基于所述待训练PCB图像样本数据对所述目标模型进行深度学习模型迭代。
本实施例通过对获取的PCB图像样本数据进行自动标注,得到标注可靠度;将所述标注可靠度与预设可靠度阈值进行比较;在所述标注可靠度大于等于所述预设可靠度阈值时,将所述标注可靠度对应的标注结果作为目标标注结果;根据所述目标标注结果得到待训练PCB图像样本数据;将所述待训练PCB图像样本数据通过预设训练策略进行模型训练,得到参考模型;将所述参考模型进行测试,得到目标模型;基于所述待训练PCB图像样本数据对所述目标模型进行深度学习模型迭代,可自动对获取的PCB图像数据进行标注并训练,得到参考模型,通过对参考模型进行测试得到目标模型,并通过待训练PCB图像样本数据对目标模型进行迭代,自动完成模型迭代,不需要依赖人工参与,提高迭代效率且迭代结果准确。
在一实施例中,所述标注模块10,还用于通过预设初始模型对所述PCB图像样本数据进行自动标注;根据标注结果输出标注置信度;根据所述标注置信度得到标注可靠度。
在一实施例中,所述比较模块20,还用于在所述标注可靠度小于所述预设可靠度阈值时,将所述标注可靠度对应的PCB图像样本数据作为二次标注数据;基于所述二次标注数据生成标注任务,以使用户根据所述标注任务对所述二次标注数据进行交叉标注。
在一实施例中,所述比较模块20,还用于根据交叉标注结果得到二次标注结果;将所述二次标注结果对应的PCB图像样本数据以及所述目标标注结果对应的PCB图像样本数据进行汇总,得到待训练PCB图像样本数据。
在一实施例中,所述训练模块40,还用于通过预设数据挑选条件对所述待训练PCB图像样本数据进行分类,得到分类待训练PCB图像样本数据;根据所述分类待训练PCB图像样本数据进行模型训练,得到参考模型。
在一实施例中,所述训练模块40,还用于根据所述参考模型对所述PCB图像样本数据进行训练,得到训练一致率;根据所述训练一致率对所述参考模型进行评分;在参考模型的评分大于预设评分阈值时,将所述参考模型作为目标模型。
在一实施例中,所述迭代模块60,还用于通过所述目标模型对所述待训练PCB图像样本数据进行训练;根据训练结果得到待训练PCB图像样本数据的置信度;在所述待训练PCB图像样本数据的置信度小于预设置信度阈值时,得到异常数据;基于所述异常数据对所述目标模型进行深度学习模型迭代。
此外,为实现上述目的,本发明还提出一种深度学习模型迭代设备,所述深度学习模型迭代设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的深度学习模型迭代程序,所述深度学习模型迭代程序配置为实现如上文所述的深度学习模型迭代方法的步骤。
由于本深度学习模型迭代设备采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有深度学习模型迭代程序,所述深度学习模型迭代程序被处理器执行时实现如上文所述的深度学习模型迭代方法的步骤。
由于本存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的深度学习模型迭代方法,此处不再赘述。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种深度学习模型迭代方法,其特征在于,所述深度学习模型迭代方法包括:
对获取的PCB图像样本数据进行自动标注,得到标注可靠度;
将所述标注可靠度与预设可靠度阈值进行比较;
在所述标注可靠度大于等于所述预设可靠度阈值时,将所述标注可靠度对应的标注结果作为目标标注结果;
根据所述目标标注结果得到待训练PCB图像样本数据;
将所述待训练PCB图像样本数据通过预设训练策略进行模型训练,得到参考模型;
将所述参考模型进行测试,得到目标模型;
基于所述待训练PCB图像样本数据对所述目标模型进行深度学习模型迭代。
2.如权利要求1所述的深度学习模型迭代方法,其特征在于,所述对获取的PCB图像样本数据进行自动标注,得到标注可靠度,包括:
通过预设初始模型对所述PCB图像样本数据进行自动标注;
根据标注结果输出标注置信度;
根据所述标注置信度得到标注可靠度。
3.如权利要求1所述的深度学习模型迭代方法,其特征在于,所述将所述标注可靠度与预设可靠度阈值进行比较之后,还包括:
在所述标注可靠度小于所述预设可靠度阈值时,将所述标注可靠度对应的PCB图像样本数据作为二次标注数据;
基于所述二次标注数据生成标注任务,以使用户根据所述标注任务对所述二次标注数据进行交叉标注。
4.如权利要求3所述的深度学习模型迭代方法,其特征在于,所述根据所述目标标注结果得到待训练PCB图像样本数据,包括:
根据交叉标注结果得到二次标注结果;
将所述二次标注结果对应的PCB图像样本数据以及所述目标标注结果对应的PCB图像样本数据进行汇总,得到待训练PCB图像样本数据。
5.如权利要求1所述的深度学习模型迭代方法,其特征在于,所述将所述待训练PCB图像样本数据通过预设训练策略进行模型训练,得到参考模型,包括:
通过预设数据挑选条件对所述待训练PCB图像样本数据进行分类,得到分类待训练PCB图像样本数据;
根据所述分类待训练PCB图像样本数据进行模型训练,得到参考模型。
6.如权利要求5所述的深度学习模型迭代方法,其特征在于,所述将所述参考模型进行测试,得到目标模型,包括:
根据所述参考模型对所述PCB图像样本数据进行训练,得到训练一致率;
根据所述训练一致率对所述参考模型进行评分;
在参考模型的评分大于预设评分阈值时,将所述参考模型作为目标模型。
7.如权利要求1-6中任一项所述的深度学习模型迭代方法,其特征在于,所述基于所述待训练PCB图像样本数据对所述目标模型进行深度学习模型迭代,包括:
通过所述目标模型对所述待训练PCB图像样本数据进行训练;
根据训练结果得到待训练PCB图像样本数据的置信度;
在所述待训练PCB图像样本数据的置信度小于预设置信度阈值时,得到异常数据;
基于所述异常数据对所述目标模型进行深度学习模型迭代。
8.一种深度学习模型迭代装置,其特征在于,所述深度学习模型迭代装置包括:
标注模块,用于对获取的PCB图像样本数据进行自动标注,得到标注可靠度;
比较模块,用于将所述标注可靠度与预设可靠度阈值进行比较;
所述比较模块,还用于在所述标注可靠度大于等于所述预设可靠度阈值时,将所述标注可靠度对应的标注结果作为目标标注结果;
获取模块,用于根据所述目标标注结果得到待训练PCB图像样本数据;
训练模块,用于将所述待训练PCB图像样本数据通过预设训练策略进行模型训练,得到参考模型;
测试模块,用于将所述参考模型进行测试,得到目标模型;
迭代模块,用于基于所述待训练PCB图像样本数据对所述目标模型进行深度学习模型迭代。
9.一种深度学习模型迭代设备,其特征在于,所述深度学习模型迭代设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的深度学习模型迭代程序,所述深度学习模型迭代程序配置为实现如权利要求1至7中任一项所述的深度学习模型迭代方法。
10.一种存储介质,其特征在于,所述存储介质上存储有深度学习模型迭代程序,所述深度学习模型迭代程序被处理器执行时实现如权利要求1至7中任一项所述的深度学习模型迭代方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210119889.XA CN114155412A (zh) | 2022-02-09 | 2022-02-09 | 深度学习模型迭代方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210119889.XA CN114155412A (zh) | 2022-02-09 | 2022-02-09 | 深度学习模型迭代方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114155412A true CN114155412A (zh) | 2022-03-08 |
Family
ID=80450025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210119889.XA Pending CN114155412A (zh) | 2022-02-09 | 2022-02-09 | 深度学习模型迭代方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114155412A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107644235A (zh) * | 2017-10-24 | 2018-01-30 | 广西师范大学 | 基于半监督学习的图像自动标注方法 |
CN108009589A (zh) * | 2017-12-12 | 2018-05-08 | 腾讯科技(深圳)有限公司 | 样本数据处理方法、装置和计算机可读存储介质 |
CN111210024A (zh) * | 2020-01-14 | 2020-05-29 | 深圳供电局有限公司 | 模型训练方法、装置、计算机设备和存储介质 |
CN112001407A (zh) * | 2020-03-11 | 2020-11-27 | 青岛慧拓智能机器有限公司 | 一种基于自动化标注的模型迭代训练方法及系统 |
CN112308144A (zh) * | 2020-10-30 | 2021-02-02 | 江苏云从曦和人工智能有限公司 | 一种筛选样本的方法、系统、设备及介质 |
CN112560971A (zh) * | 2020-12-21 | 2021-03-26 | 上海明略人工智能(集团)有限公司 | 一种主动学习自迭代的图像分类方法和系统 |
CN113240125A (zh) * | 2021-01-13 | 2021-08-10 | 深延科技(北京)有限公司 | 模型训练方法及装置、标注方法及装置、设备及存储介质 |
-
2022
- 2022-02-09 CN CN202210119889.XA patent/CN114155412A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107644235A (zh) * | 2017-10-24 | 2018-01-30 | 广西师范大学 | 基于半监督学习的图像自动标注方法 |
CN108009589A (zh) * | 2017-12-12 | 2018-05-08 | 腾讯科技(深圳)有限公司 | 样本数据处理方法、装置和计算机可读存储介质 |
CN111210024A (zh) * | 2020-01-14 | 2020-05-29 | 深圳供电局有限公司 | 模型训练方法、装置、计算机设备和存储介质 |
CN112001407A (zh) * | 2020-03-11 | 2020-11-27 | 青岛慧拓智能机器有限公司 | 一种基于自动化标注的模型迭代训练方法及系统 |
CN112308144A (zh) * | 2020-10-30 | 2021-02-02 | 江苏云从曦和人工智能有限公司 | 一种筛选样本的方法、系统、设备及介质 |
CN112560971A (zh) * | 2020-12-21 | 2021-03-26 | 上海明略人工智能(集团)有限公司 | 一种主动学习自迭代的图像分类方法和系统 |
CN113240125A (zh) * | 2021-01-13 | 2021-08-10 | 深延科技(北京)有限公司 | 模型训练方法及装置、标注方法及装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20200092447A (ko) | 설명 가능한 인공지능 모델링 및 시뮬레이션 시스템 및 방법 | |
US10984518B2 (en) | Methods and systems for assessing the quality of geospatial data | |
CN112070134A (zh) | 电力设备图像分类方法、装置、电力设备及存储介质 | |
CN111160469A (zh) | 一种目标检测系统的主动学习方法 | |
CN110033284A (zh) | 房源验真方法、装置、设备及存储介质 | |
CN111080117A (zh) | 设备风险标签的构建方法、装置、电子设备及存储介质 | |
CN115204536A (zh) | 楼宇设备故障预测方法、装置、设备及存储介质 | |
CN107016416B (zh) | 基于邻域粗糙集和pca融合的数据分类预测方法 | |
CN114090556A (zh) | 一种电力营销数据采集方法及系统 | |
CN117540826A (zh) | 机器学习模型的优化方法、装置、电子设备及存储介质 | |
CN113704389A (zh) | 一种数据评估方法、装置、计算机设备及存储介质 | |
CN114155412A (zh) | 深度学习模型迭代方法、装置、设备及存储介质 | |
CN116187754A (zh) | 生产线故障定位方法、设备及可读存储介质 | |
CN115423600A (zh) | 数据筛选方法、装置、介质及电子设备 | |
CN115035974A (zh) | 一种心理测评数据管理系统及方法 | |
CN112505337B (zh) | 一种辅助分析样品的数据处理方法 | |
US20210157707A1 (en) | Transferability determination apparatus, transferability determination method, and recording medium | |
CN110865939B (zh) | 应用程序质量监测方法、装置、计算机设备和存储介质 | |
CN113918471A (zh) | 测试用例的处理方法、装置及计算机可读存储介质 | |
CN114334696A (zh) | 质量检测方法及装置、电子设备和计算机可读存储介质 | |
CN112131354A (zh) | 答案筛选方法、装置、终端设备和计算机可读存储介质 | |
CN117314914B (zh) | 一种对工程无损检测图像的缺陷识别方法及相关设备 | |
CN113778875B (zh) | 一种系统测试缺陷分类方法、装置、设备及存储介质 | |
CN112434839B (zh) | 一种配电变压器重过载风险的预测方法及电子设备 | |
CN116450632B (zh) | 地理样本数据质量评估方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220308 |
|
RJ01 | Rejection of invention patent application after publication |