CN113052244B - 一种分类模型训练方法和一种分类模型训练装置 - Google Patents
一种分类模型训练方法和一种分类模型训练装置 Download PDFInfo
- Publication number
- CN113052244B CN113052244B CN202110340369.7A CN202110340369A CN113052244B CN 113052244 B CN113052244 B CN 113052244B CN 202110340369 A CN202110340369 A CN 202110340369A CN 113052244 B CN113052244 B CN 113052244B
- Authority
- CN
- China
- Prior art keywords
- samples
- training set
- classification
- initial training
- classification model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种分类模型训练方法和一种分类模型训练装置。该方法包括:从训练集中抽取部分样本作为初始训练集,用初始训练集训练分类模型;若得到的分类模型未达到预期效果,则根据分类模型对训练集的分类结果,更新当前初始训练集,更新方式包括:向初始训练集中加入至少部分分类错误的样本,和/或,从初始训练集中剔除部分分类正确的样本;利用更新后的初始训练集重新训练分类模型,直至分类模型达到预期效果或直至满足训练结束条件。本申请根据每次训练后分类模型对训练集的分类结果,分批次向初始训练集中添加分类错误的样本,和/或剔除分类正确的样本,可逐渐优化训练效果,克服类别之间样本不平衡问题,训练速度更快,且训练结果更佳。
Description
技术领域
本发明涉及机器学习技术领域,特别涉及一种分类模型训练方法和一种分类模型训练装置。
背景技术
随着深度学习的发展,AI(Artificial Intelligence,人工智能)在智能制造领域的作用越来越大,例如,在很多实际工程部署当中,AI在质量把控、缺陷检测方面起到了巨大的作用。
但是,在现有的工业大数据背景下,一次AI训练所需要的数据集越来越大,并且类别之间不平衡,往往一个数据集有几千到几万张图片,其中,有的类别会有几千张图,有的类别却只有几十张,差距在一到两个数量级。在这种特征下,带来了两个问题,一是:大数据集下训练时间会较长,数据集越大,训练时间越长。二是类别之间的不平衡,容易造成模型对分类的侧重不同,导致模型训练结果不好。
发明内容
鉴于现有技术分类模型的训练集数据多、类别间不平衡,导致训练时间长和训练结果不佳的问题,提出了本申请的一种分类模型训练方法和一种分类模型训练装置,以便克服上述问题。
为了实现上述目的,本申请采用了如下技术方案:
依据本申请的一个方面,提供了一种分类模型训练方法,该方法包括:
从训练集中抽取部分样本作为初始训练集,用初始训练集训练分类模型;
若得到的分类模型未达到预期效果,则根据分类模型对训练集的分类结果,更新当前初始训练集,更新方式包括:向初始训练集中加入至少部分分类错误的样本,和/或,从初始训练集中剔除部分分类正确的样本;
利用更新后的初始训练集重新训练分类模型,直至分类模型达到预期效果或直至满足训练结束条件。
可选地,从训练集中抽取部分样本作为初始训练集,包括:
以训练集中数量最少的一类负样本的样本个数为基准,按照预设比例分别选取相同数量的各类负样本,形成初始训练集的负样本集合。
可选地,从训练集中抽取部分样本作为初始训练集,还包括:
从训练集中选取部分正样本与负样本集合共同组成初始训练集,正样本在初始训练集中的占比不超过一半。
可选地,向初始训练集中加入至少部分分类错误的样本,包括:
从初始训练集以外的训练集样本中,挑选至少部分分类错误的样本加入初始训练集中;
若分类错误的样本中各类负样本间的样本个数差异小于预设标准,则将全部分类错误的负样本加入初始训练集中;
若差异不小于预设标准,则以数量最少的一类负样本的样本个数为基准,或者,以预设的固定数量为基准,挑选相应数量的各类负样本加入初始训练集中。
可选地,以数量最少的一类负样本的样本个数为基准,挑选相应数量的各类负样本加入初始训练集中,包括:以数量最少的一类负样本的样本个数为基准,按照预设比例分别选取相同数量的各类负样本,加入初始训练集中;
以预设的固定数量为基准,挑选相应数量的各类负样本加入初始训练集中,包括:按照预设的固定数量挑选各类负样本,加入初始训练集中,其中,若分类错误的样本中某类负样本的数量不足,则以分类正确的该类负样本补充。
可选地,向初始训练集中加入至少部分分类错误的样本,还包括:
根据所加入的分类错误的负样本的总量,从初始训练集以外的训练集样本中,按照预设比例选取相应数量的分类错误的正样本加入初始训练集中,若分类错误的样本中一分类正样本的数量不足,则以该分类下分类正确的正样本补充。
可选地,从初始训练集中剔除部分分类正确的样本,包括:
从初始训练集的每一类样本中,筛选出分类正确且置信度大于预设值的样本,按照相同的预设比例将筛选出的样本部分剔除。
可选地,直至满足训练结束条件包括:
设置训练分类模型的最大训练次数,当训练次数达到最大训练次数时,停止训练。
可选地,方法还包括:
在每次更新初始训练集后,检验初始训练集中的负样本数量,若某一类负样本的数量超过负样本总量的预设比例,则剔除一部分该类负样本,使该类负样本数量不超过负样本数量总数的预设比例。
依据本申请的另一个方面,提供了一种分类模型训练装置,分类模型训练装置包括处理器;以及被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器执行如上任一分类模型训练方法。
综上所述,本申请的有益效果是:
本申请通过在训练过程中不断更新调整初始训练集来优化分类模型的训练效果,根据前次训练所得分类模型对训练集的分类结果,向初始训练集中添加分类错误的样本,和/或,剔除分类正确的样本,可以逐渐优化训练效果,克服各类别间样本不平衡问题,训练速度更快,且训练结果更佳。
附图说明
图1为本申请一个实施例提供的一种分类模型训练方法步骤示意图;
图2为本申请一个实施例提供的一种分类模型训练方法流程示意图;
图3为本申请一个实施例提供的一种分类模型训练装置结构示意图;
图4为本申请另一个实施例提供的一种分类模型训练装置结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在本申请的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
本申请的技术构思是:在训练过程中,通过不断更新调整初始训练集来优化分类模型的训练效果,根据前次训练的分类模型对训练集的分类结果,向初始训练集中添加分类错误的样本,和/或,剔除分类正确的样本,可以逐渐优化训练效果,克服各类别间样本不平衡问题,训练速度更快,且训练结果更佳。
图1为本申请一个实施例提供的一种分类模型训练方法步骤示意图。如图1所示,该分类模型训练方法,包括:
步骤S110,从训练集中抽取部分样本作为初始训练集,用初始训练集训练分类模型。
通常在成熟的工业生产中,生产的良品率极高,而可供学习的瑕疵品占比很少。因此,虽然工业生产能为智能制造提供数据庞大的训练集,但是,其中的正样本(由良品产生)比例很高,可供学习的负样本(由瑕疵品产生)数量很少,且负样本的各类别之间分布严重不均。所以,直接使用全部训练集对分类模型进行训练,取得的效果并不太好。因此,本申请首先抽取其中部分数据用于分类模型训练,继而根据训练的结果进行调整优化,既能够提高训练效果,又能够缩短训练时间。
步骤S120,基于步骤S110训练得到的分类模型,若得到的分类模型未达到预期效果,则根据分类模型对训练集的分类结果,更新当前的初始训练集,更新方式包括:向初始训练集中加入至少部分分类错误的样本,和/或,从初始训练集中剔除部分分类正确的样本。
不同于现有技术中仅仅通过图片翻转、旋转、缩放等数据增强手段或加权手段来调整训练样本的方式,本申请中,在每次训练结束后会根据当前分类模型对训练集的训练结果,分批次地更新初始训练集,从而达到逐步优化训练分类模型的目的。更新方式中,对于分类错误的样本,可知分类模型对该类样本存在欠学习的问题,判断不够准确,因此将这类样本加入初始训练集以加强分类模型对该类样本的学习,提高分类正确率;而针对分类正确的样本,可知分类模型对该类样本已经存在良好的学习,甚至存在重复学习的嫌疑,通过删除部分分类正确的样本以改善样本之间的分布不均衡,克服训练样本数据相似、重复过多的问题。从而,更新后的初始训练集克服了前次训练中的不足。
步骤S130,利用更新后的初始训练集重新训练分类模型,直至分类模型达到预期效果或直至满足训练结束条件。其中,可以根据对验证集的分类结果来判断分类模型是否达到预期效果。
由此可知,本申请根据每次训练后分类模型对训练集的分类结果来更新初始训练集,可以有效针对之前的训练数据纰漏,纠正分类模型的训练不足,逐步改善分类模型的训练效果,使分类模型能够真正适应工业生产情况,全面学习各类样本分类。根据申请人的数据验证,本实施例分批次更新训练数据,所得到的分类模型训练效果比直接使用全部训练集所取得的训练效果要更好。
图2为本申请一个实施例提供的一种分类模型训练方法流程示意图。如图2所示,本实施例中,首先通过抽取部分训练集样本作为初始训练集,以该初始训练集训练分类模型。
而后,检测分类模型是否达到预期效果或满足结束条件。当结论为否时,使用该分类模型分类训练集,得到该分类模型对训练集的分类结果,继而根据该分类结果更新初始训练集。其中,可以根据更新初始训练集方式的不同,仅对训练集的部分样本进行分类。例如,若仅采用加入分类错误的样本的方式更新初始训练集,则只需要对训练集中除初始训练集外的剩余部分进行分类,得到分类结果;若仅采用剔除分类正确的样本的方式更新初始训练集,则只需要对训练集内初始训练集部分进行分类,得到分类结果。若是需要同时采用两种方式更新初始训练集,则直接对整个训练集进行分类。
继而,使用更新后的初始训练集再次训练分类模型,如此循环,直至分类模型达到预期效果或满足结束条件,训练结束。
在本申请的一个实施例中,步骤S110中从训练集中抽取部分样本作为初始训练集,包括:以训练集中数量最少的一类负样本的样本个数为基准,按照预设比例分别选取相同数量的各类负样本,形成初始训练集的负样本集合。
通过对训练集中负样本各类别的统计,以数量最少的负样本类别为基准选择各类负样本,能够克服负样本类别之间分布不均衡的问题,使分类模型全面学习到产品的各类瑕疵。假设数量最少的负样本类别的样本个数为A,则根据设定的预设比例,例如A/3、2A/5等,随机抽取每一类负样本组成初始训练集的负样本集合,从而各类负样本在初始训练集中的样本个数相同,克服了样本个数不均的问题。本申请中,所用样本为机器学习中常用样本,例如,每个样本均包括产品图像以及对应的标注等。
在本申请的一个实施例中,步骤S110中从训练集中抽取部分样本作为初始训练集,还包括:从训练集中选取部分正样本与负样本集合共同组成初始训练集,正样本在初始训练集中的占比不超过一半。鉴于实际成熟的工业生产中,良品占比极高,因而可提供的正样本存在大量重复、相似现象,而这种高度重复的正样本数据对分类模型的训练意义不大,还会拖慢模型的训练速度。因此,本实施例根据初始训练集中负样本的数量,选取不超过负样本数量总和的正样本数据,来组成初始训练集,以提高训练速度。优选地,正样本数据总数不超过负样本总数的一半,例如可以设定正样本数量为负样本集合数量的1/3。
在本申请的一个实施例中,步骤S120中,向初始训练集中加入至少部分分类错误的样本,包括:从初始训练集以外的训练集样本中,挑选至少部分分类错误的样本加入初始训练集中。
基于当前分类模型对训练集的分类结果(即:当前分类模型对训练集除初始训练集以外的剩余样本的分类结果),若分类错误的样本中各类负样本间的样本个数差异小于预设标准,则说明负样本之间不存在显著的不均衡,可以将全部分类错误的负样本加入初始训练集中。
若差异不小于预设标准,则说明负样本之间存在显著的不均衡,需要以数量最少的一类负样本的样本个数为基准,或者,以预设的固定数量为基准,挑选相应数量的各类负样本加入初始训练集中。
在本申请的一个优选实施例中,以数量最少的一类负样本的样本个数为基准,挑选相应数量的各类负样本加入初始训练集中,包括:以数量最少的一类负样本的样本个数为基准,按照预设比例分别选取相同数量的各类负样本,加入初始训练集中。类似于步骤S110中从训练集中抽取初始训练集,在更新初始训练集、加入分类错误的负样本时,同样要考虑负样本各类别之间的不均衡问题,以数量最少的一类负样本的样本个数为基准,按预设比例分别选取相同数量的各类负样本加入初始训练集中,这样可以在提高模型分类准确性的同时,克服训练数据类别间的不均衡问题。
此外,在本申请的另一个优选实施例中,还可以按照预设的固定数量为基准,挑选相应数量的各类负样本加入初始训练集中。具体包括:按照预设的固定数量挑选各类负样本,加入初始训练集中,若分类错误的样本中某类负样本的数量不足,则以分类正确的该类负样本补充。通过以预设的固定数量为基准,挑选相应数量的各类负样本加入初始训练集中,可以确保训练所用数据达到一定数量,以保证模型训练的效果。
在本申请的一个实施例中,步骤S120中,向初始训练集中加入至少部分分类错误的样本,还包括:根据所加入的分类错误的负样本的总量,从初始训练集以外的训练集样本中,按照预设比例选取相应数量的分类错误的正样本加入初始训练集中,若分类错误的样本中一分类正样本的数量不足,则以该分类下分类正确的正样本补充。
在本申请的一个实施例中,步骤S120中,从初始训练集中剔除部分分类正确的样本,包括:从初始训练集的每一类样本中,筛选出分类正确且置信度大于预设值的样本,按照相同的预设比例将筛选出的样本部分剔除。若样本分类正确置信度大于预设值,则说明分类模型对该类样本的分类效果良好,同时表明该类样本可能存在重复、占比过多的问题,通过删除部分分类正确且置信度大于预设值的样本,可以降低该类样本的训练占比,优化样本之间的比例,克服样本分布不均的问题。
在本申请的一个实施例中,所述步骤S130中,直至满足训练结束条件包括:设置训练分类模型的最大训练次数,当训练次数达到最大训练次数时,停止训练。通过设置训练结束条件,可以避免训练进入死循环的情况发生。本领域技术人员可理解地,还可以设置其他形式的训练结束条件,本申请在此不一一列举。
在本申请的一个实施例中,本分类模型训练方法还包括:在每次更新初始训练集后,检验初始训练集中的负样本数量,若某一类负样本的数量超过负样本总量的预设比例,则剔除一部分该类负样本,使该类负样本数量不超过负样本数量总数的预设比例。即,每一次初始训练集更新后,都对更新的初始训练集进行负样本类别均衡性检验,若某一类负样本过多,超过了负样本总量的预设比例,则需要预先剔除,克服该不平衡问题。优选地,该预设比例设置为1/3,即,保证初始训练集中每一类负样本都不超过负样本总量的1/3。
本申请还公开了一种分类模型训练装置,如图3所示,该分类模型训练装置包括:
抽取训练模块310,用于从训练集中抽取部分样本作为初始训练集,用初始训练集训练分类模型。
检查更新模块320,用于检查当前分类模型的训练效果,若得到的分类模型未达到预期效果,则根据分类模型对训练集的分类结果,更新当前初始训练集,更新方式包括:向初始训练集中加入至少部分分类错误的样本,和/或,从初始训练集中剔除部分分类正确的样本。
重复训练模块330,用于利用更新后的初始训练集重新训练分类模型,直至分类模型达到预期效果或直至满足训练结束条件。
在本申请的一个实施例中,抽取训练模块310,用于以训练集中数量最少的一类负样本的样本个数为基准,按照预设比例分别选取相同数量的各类负样本,形成初始训练集的负样本集合。
在本申请的一个实施例中,抽取训练模块310,还用于从训练集中选取部分正样本与负样本集合共同组成初始训练集,正样本在初始训练集中的占比不超过一半。
在本申请的一个实施例中,检查更新模块320,用于从初始训练集以外的训练集样本中,挑选至少部分分类错误的样本加入初始训练集中;若分类错误的样本中各类负样本间的样本个数差异小于预设标准,则将全部分类错误的负样本加入初始训练集中;若差异不小于预设标准,则以数量最少的一类负样本的样本个数为基准,或者,以预设的固定数量为基准,挑选相应数量的各类负样本加入初始训练集中。
在本申请的一个实施例中,检查更新模块320,以数量最少的一类负样本的样本个数为基准,按照预设比例分别选取相同数量的各类负样本,加入初始训练集中;或者,按照预设的固定数量挑选各类负样本,加入初始训练集中,若分类错误的样本中某类负样本的数量不足,则以分类正确的该类负样本补充。
在本申请的一个实施例中,检查更新模块320,还用于根据所加入的分类错误的负样本的总量,从初始训练集以外的训练集样本中,按照预设比例选取相应数量的分类错误的正样本加入初始训练集中,若分类错误的样本中一分类正样本的数量不足,则以该分类下分类正确的正样本补充。
在本申请的一个实施例中,检查更新模块320,用于从初始训练集的每一类样本中,筛选出分类正确且置信度大于预设值的样本,按照相同的预设比例将筛选出的样本部分剔除。
在本申请的一个实施例中,重复训练模块330,用于设置训练分类模型的最大训练次数,当训练次数达到最大训练次数时,停止训练。
在本申请的一个实施例中,该分类模型训练装置还包括:数量检验模块,用于在每次更新初始训练集后,检验初始训练集中的负样本数量,若某一类负样本的数量超过负样本总量的预设比例,则剔除一部分该类负样本,使该类负样本数量不超过负样本数量总数的预设比例。
本申请分类模型训练装置执行的过程与上述分类模型训练方法一致,在此不再赘述。
图4为本申请另一个实施例提供的一种分类模型训练装置结构示意图,如图4所示,该分类模型训练装置包括处理器;以及被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器执行如上任一分类模型训练方法。
请参考图4,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-AccessMemory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成分类模型训练装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
从训练集中抽取部分样本作为初始训练集,用初始训练集训练分类模型;若得到的分类模型未达到预期效果,则根据分类模型对训练集的分类结果,更新当前初始训练集,更新方式包括:向初始训练集中加入至少部分分类错误的样本,和/或,从初始训练集中剔除部分分类正确的样本;利用更新后的初始训练集重新训练分类模型,直至分类模型达到预期效果或直至满足训练结束条件。
上述本申请所示实施例揭示的分类模型训练装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述所示实施例中分类模型训练装置执行的方法,并具体用于执行:
从训练集中抽取部分样本作为初始训练集,用初始训练集训练分类模型;若得到的分类模型未达到预期效果,则根据分类模型对训练集的分类结果,更新当前初始训练集,更新方式包括:向初始训练集中加入至少部分分类错误的样本,和/或,从初始训练集中剔除部分分类正确的样本;利用更新后的初始训练集重新训练分类模型,直至分类模型达到预期效果或直至满足训练结束条件。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述,仅为本发明的具体实施方式,在本发明的上述教导下,本领域技术人员可以在上述实施例的基础上进行其他的改进或变形。本领域技术人员应该明白,上述的具体描述只是更好的解释本发明的目的,本发明的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种缺陷检测方法,其特征在于,该方法包括:
从训练集中抽取部分样本作为初始训练集,用所述初始训练集训练分类模型,所述训练集为图像训练集,所述图像训练集中的每个样本均包括产品图像以及对应的标注,其中,所述图像训练集中的正样本为良品产生的样本,所述图像训练集中的负样本为瑕疵品产生的样本;
若得到的分类模型未达到预期效果,则根据所述分类模型对所述训练集的分类结果,更新当前初始训练集,更新方式包括:向所述初始训练集中加入至少部分分类错误的样本,和从所述初始训练集中剔除部分分类正确的样本,
所述向所述初始训练集中加入至少部分分类错误的样本,包括:
从所述初始训练集以外的训练集样本中,挑选至少部分分类错误的样本加入所述初始训练集中;
若分类错误的样本中各类负样本间的样本个数差异小于预设标准,则将全部分类错误的负样本加入所述初始训练集中;
若差异不小于预设标准,则以数量最少的一类负样本的样本个数为基准,或者,以预设的固定数量为基准,挑选相应数量的各类负样本加入所述初始训练集中;
利用更新后的初始训练集重新训练所述分类模型,直至所述分类模型达到预期效果或直至满足训练结束条件;
所述分类模型用于缺陷检测。
2.根据权利要求1所述的缺陷检测方法,其特征在于,所述从训练集中抽取部分样本作为初始训练集,包括:
以所述训练集中数量最少的一类负样本的样本个数为基准,按照预设比例分别选取相同数量的各类负样本,形成所述初始训练集的负样本集合。
3.根据权利要求2所述的缺陷检测方法,其特征在于,所述从训练集中抽取部分样本作为初始训练集,还包括:
从所述训练集中选取部分正样本与所述负样本集合共同组成所述初始训练集,所述正样本在所述初始训练集中的占比不超过一半。
4.根据权利要求1所述的缺陷检测方法,其特征在于,以数量最少的一类负样本的样本个数为基准,挑选相应数量的各类负样本加入所述初始训练集中,包括:以数量最少的一类负样本的样本个数为基准,按照预设比例分别选取相同数量的各类负样本,加入所述初始训练集中;
以预设的固定数量为基准,挑选相应数量的各类负样本加入所述初始训练集中,包括:按照预设的固定数量挑选各类负样本,加入所述初始训练集中,其中,若分类错误的样本中某类负样本的数量不足,则以分类正确的该类负样本补充。
5.根据权利要求4所述的缺陷检测方法,其特征在于,所述向所述初始训练集中加入至少部分分类错误的样本,还包括:
根据所加入的分类错误的负样本的总量,从所述初始训练集以外的训练集样本中,按照预设比例选取相应数量的分类错误的正样本加入所述初始训练集中,若分类错误的样本中一分类正样本的数量不足,则以该分类下分类正确的正样本补充。
6.根据权利要求1所述的缺陷检测方法,其特征在于,所述从所述初始训练集中剔除部分分类正确的样本,包括:
从所述初始训练集的每一类样本中,筛选出分类正确且置信度大于预设值的样本,按照相同的预设比例将筛选出的样本部分剔除。
7.根据权利要求1-6任一项所述的缺陷检测方法,其特征在于,所述直至满足训练结束条件包括:
设置训练所述分类模型的最大训练次数,当训练次数达到所述最大训练次数时,停止训练。
8.根据权利要求1-6任一项所述的缺陷检测方法,其特征在于,所述方法还包括:
在每次更新所述初始训练集后,检验所述初始训练集中的负样本数量,若某一类负样本的数量超过负样本总量的预设比例,则剔除一部分该类负样本,使该类负样本数量不超过负样本数量总数的预设比例。
9.一种缺陷检测装置,其特征在于,所述缺陷检测装置包括处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如权利要求1~8之任一所述缺陷检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110340369.7A CN113052244B (zh) | 2021-03-30 | 2021-03-30 | 一种分类模型训练方法和一种分类模型训练装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110340369.7A CN113052244B (zh) | 2021-03-30 | 2021-03-30 | 一种分类模型训练方法和一种分类模型训练装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113052244A CN113052244A (zh) | 2021-06-29 |
CN113052244B true CN113052244B (zh) | 2023-05-26 |
Family
ID=76516486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110340369.7A Active CN113052244B (zh) | 2021-03-30 | 2021-03-30 | 一种分类模型训练方法和一种分类模型训练装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113052244B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114724226B (zh) * | 2022-04-25 | 2024-05-21 | 中国平安人寿保险股份有限公司 | 表情识别模型训练方法、电子设备、存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461120A (zh) * | 2020-04-01 | 2020-07-28 | 济南浪潮高新科技投资发展有限公司 | 一种基于区域的卷积神经网络物体表面缺陷检测方法 |
CN111798419A (zh) * | 2020-06-27 | 2020-10-20 | 上海工程技术大学 | 一种金属喷漆表面缺陷检测方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6112021A (en) * | 1997-12-19 | 2000-08-29 | Mitsubishi Electric Information Technology Center America, Inc, (Ita) | Markov model discriminator using negative examples |
CN101295305B (zh) * | 2007-04-25 | 2012-10-31 | 富士通株式会社 | 图像检索装置 |
CN106599938A (zh) * | 2016-12-30 | 2017-04-26 | 南京睿观信息科技有限公司 | 一种基于深度网络模型敏感旗帜内容的层次分类方法 |
CN107221320A (zh) * | 2017-05-19 | 2017-09-29 | 百度在线网络技术(北京)有限公司 | 训练声学特征提取模型的方法、装置、设备和计算机存储介质 |
CN110766062A (zh) * | 2019-10-15 | 2020-02-07 | 广州织点智能科技有限公司 | 一种商品识别模型训练方法、装置、电子设备及存储介质 |
CN111881956B (zh) * | 2020-07-15 | 2023-05-12 | 北京市商汤科技开发有限公司 | 网络训练方法及装置、目标检测方法及装置和电子设备 |
CN112434878B (zh) * | 2020-12-09 | 2022-09-20 | 同济大学 | 一种基于Cascade样本均衡的地震流体预测方法 |
-
2021
- 2021-03-30 CN CN202110340369.7A patent/CN113052244B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461120A (zh) * | 2020-04-01 | 2020-07-28 | 济南浪潮高新科技投资发展有限公司 | 一种基于区域的卷积神经网络物体表面缺陷检测方法 |
CN111798419A (zh) * | 2020-06-27 | 2020-10-20 | 上海工程技术大学 | 一种金属喷漆表面缺陷检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113052244A (zh) | 2021-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107273269B (zh) | 日志解析方法及装置 | |
WO2019051941A1 (zh) | 车型识别方法、装置、设备及计算机可读存储介质 | |
CN112634209A (zh) | 一种产品缺陷检测方法和装置 | |
CN111738097B (zh) | 一种目标分类方法、装置、电子设备和可读存储介质 | |
US11748975B2 (en) | Method and device for optimizing object-class model based on neural network | |
CN109145981B (zh) | 深度学习自动化模型训练方法及设备 | |
CN104881675A (zh) | 一种视频场景的识别方法和装置 | |
CN109582741B (zh) | 特征数据处理方法和装置 | |
CN113052244B (zh) | 一种分类模型训练方法和一种分类模型训练装置 | |
CN112419268A (zh) | 一种输电线路图像缺陷检测方法、装置、设备及介质 | |
CN111258905B (zh) | 缺陷定位方法、装置和电子设备及计算机可读存储介质 | |
CN115439718A (zh) | 一种结合监督学习和特征匹配技术的工业检测方法、系统、存储介质 | |
CN115902579A (zh) | 用于芯片分级的方法、装置、计算机设备及可读存储介质 | |
US11704534B2 (en) | Neural-network-based classification device and classification method | |
CN113870754B (zh) | 一种面板检测电子信号缺陷判定的方法和系统 | |
CN115147348B (zh) | 基于改进的YOLOv3的轮胎缺陷检测方法及系统 | |
CN113592859B (zh) | 一种基于深度学习的用于显示面板缺陷的分类方法 | |
CN114254588B (zh) | 数据标签处理方法和装置 | |
CN113344079B (zh) | 一种图像标签半自动标注方法、系统、终端及介质 | |
CN117523218A (zh) | 标签生成、图像分类模型的训练、图像分类方法及装置 | |
WO2021237682A1 (zh) | 显示面板的检测装置、检测方法、电子装置、可读介质 | |
CN112183523A (zh) | 一种文本检测方法和装置 | |
CN113723950B (zh) | 基于动态加权信息熵的欺诈交易识别方法、系统及装置 | |
TWI754304B (zh) | 缺陷分析方法及裝置、電子裝置及電腦可讀存儲介質 | |
CN117610943B (zh) | 一种信用主体信用评价风险模型的建模方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |