CN107992900B - 缺陷检测的样本获取方法、训练方法、装置、介质和设备 - Google Patents

缺陷检测的样本获取方法、训练方法、装置、介质和设备 Download PDF

Info

Publication number
CN107992900B
CN107992900B CN201711367414.8A CN201711367414A CN107992900B CN 107992900 B CN107992900 B CN 107992900B CN 201711367414 A CN201711367414 A CN 201711367414A CN 107992900 B CN107992900 B CN 107992900B
Authority
CN
China
Prior art keywords
defect
pictures
attribute information
picture
quasi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711367414.8A
Other languages
English (en)
Other versions
CN107992900A (zh
Inventor
田霖
王晓红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN SAPO PHOTOELECTRIC CO Ltd
Original Assignee
SHENZHEN SAPO PHOTOELECTRIC CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN SAPO PHOTOELECTRIC CO Ltd filed Critical SHENZHEN SAPO PHOTOELECTRIC CO Ltd
Priority to CN201711367414.8A priority Critical patent/CN107992900B/zh
Publication of CN107992900A publication Critical patent/CN107992900A/zh
Application granted granted Critical
Publication of CN107992900B publication Critical patent/CN107992900B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本发明涉及一种缺陷检测的样本获取方法、训练方法、装置、介质和设备;该方法包括:获取缺陷检测生成的图片及图片的缺陷类别和属性信息;根据所有图片的属性信息构建准训练样本;根据缺陷类别对图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集;根据缺陷类别集中图片的属性信息和准训练样本的属性信息进行匹配检测,生成缺陷类别集对应的、用于输入机器学习分类算法以获取分类特征的训练样本。如此,可充分利用缺陷检测的结果,对图片的分类标定工作量少,且不需要人工在线参与,可以支持离线处理,处理速度快;如此,训练样本的生成效率高,可提高获取用于优化分类器参数的分类特征的效率,从而分类器参数的优化效率高。

Description

缺陷检测的样本获取方法、训练方法、装置、介质和设备
技术领域
本发明涉及分类技术领域,特别是涉及一种缺陷检测的样本获取方法、训练方法、装置、介质和设备。
背景技术
一些产品在生产过程中,通常需要使用自动光学检测设备对产品进行缺陷检测以确保质量的稳定性,具体缺陷以图片格式保存到数据库中,并记录缺陷类别等信息。例如,在偏光片行业,普遍在线上使用自动光学检测设备对卷材进行实时缺陷检测。自动光学检测设备检出的缺陷,一部分为实际的“真”缺陷,一部分为对后续产品无影响的“假”缺陷;准确区分“真”、“假”缺陷以及对“真”缺陷分类,对于产线判定产品良率、推断缺陷发生未知并及时对不良缺陷进行处理有重要的指引作用。
为提高自动光学检测设备的缺陷检测准确度,一般需要从缺陷的产品提取不同类别的缺陷的分类特征以不断优化分类器参数。传统的方法是采用在线人工标定法,具体模式为:人工对自动光学检测设备检测出缺陷的产品进行类别标定,然后根据经验观察同一类别的相同点及不同类别之间的相异点得到分类特征,用于逐步迭代优化分类器参数。这种在线人工标定的处理方式依赖于人工操作,标定速度慢,使得分类器参数的优化效率低。
发明内容
基于此,有必要针对传统的分类器参数优化效率低的问题,提供一种可提高分类器参数优化效率的缺陷检测的样本获取方法、训练方法、装置、介质和设备。
一种缺陷检测的样本获取方法,包括:
获取缺陷检测生成的图片及所述图片的缺陷类别和属性信息;
根据所有图片的属性信息构建准训练样本;
根据所述缺陷类别对所述图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集;
根据所述缺陷类别集中图片的属性信息和所述准训练样本的属性信息进行匹配检测,生成所述缺陷类别集对应的、用于输入机器学习分类算法以获取分类特征的训练样本。
一种缺陷检测的样本获取装置,包括:
图片汇整模块,用于获取缺陷检测生成的图片及所述图片的缺陷类别和属性信息;
准训练样本生成模块,用于根据所有图片的属性信息构建准训练样本;
分类标定模块,用于根据所述缺陷类别对所述图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集;
匹配检测模块,用于根据所述缺陷类别集中图片的属性信息和所述准训练样本的属性信息进行匹配检测,生成所述缺陷类别集对应的、用于输入机器学习分类算法以获取分类特征的训练样本。
上述缺陷分类的样本获取方法和装置,通过根据获取图片的属性信息构建准训练样本,根据获取图片的缺陷类别对图片分类标定得到缺陷类别集,根据准训练样本和缺陷类别集进行匹配检测生成训练样本,实现训练样本的自动生成,生成的训练样本用于机器学习分类算法以得到用于优化分类器参数的分类特征。一方面,由于对图片的分类标定是基于缺陷检测生成的图片的缺陷类别,可充分利用缺陷检测的结果,对图片的分类标定工作量少,另一方面,训练样本自动生成,不需要人工在线参与,可以支持离线处理,处理速度快;如此,训练样本的生成效率高,可提高获取用于优化分类器参数的分类特征的效率,从而分类器参数的优化效率高。此外,生成的训练样本可应用于机器学习分类算法,分类特征获取速度快,从而分类器参数的优化效率高。
一种缺陷检测的样本训练方法,包括:
将上述缺陷检测的样本获取方法中的训练样本输入机器学习分类算法进行训练,得到所述训练样本的分类特征。
一种缺陷检测的样本训练装置,包括:
图片汇整模块,用于获取缺陷检测生成的图片及所述图片的缺陷类别和属性信息;
准训练样本生成模块,用于根据所有图片的属性信息构建准训练样本;
分类标定模块,用于根据所述缺陷类别对所述图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集;
匹配检测模块,用于根据所述缺陷类别集中图片的属性信息和所述准训练样本的属性信息进行匹配检测,生成所述缺陷类别集对应的、用于输入机器学习分类算法以获取分类特征的训练样本;
样本训练模块,用于将所述训练样本输入机器学习分类算法进行训练,得到所述训练样本的分类特征。
上述缺陷分类的样本训练方法和装置,基于上述缺陷分类的样本训练方法和装置实现,同样具备分类器参数的优化效率高的效果。
一种介质,存储有计算机程序,存储的计算机程序被处理器执行时实现上述缺陷分类的样本获取方法或缺陷分类的样本训练方法的步骤。
一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述缺陷分类的样本获取方法或缺陷分类的样本训练方法的步骤。
上述介质和设备,由于实现了上述缺陷分类的样本获取方法或缺陷分类的样本训练方法,同理具备分类器参数的优化效率高的效果。
附图说明
图1为一实施例中缺陷检测的样本获取方法的流程图;
图2为另一实施例中缺陷检测的样本获取方法的流程图;
图3为一实施例中解压压缩包得到图片文件夹和特征文本的示意图;
图4为一实施例中得到准训练样本的示意图;
图5为一实施例中得到匹配清单的示意图;
图6为一实施例中根据缺陷类别对图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集的具体流程图;
图7为人工核定的示意图;
图8为一实施例中缺陷检测的样本获取装置的结构图;
图9为一实施例中缺陷检测的样本训练方法的流程图;
图10为一实施例中缺陷检测的样本训练装置的结构图。
具体实施方式
参考图1,在一个实施例中,提供了一种缺陷检测的样本获取方法,包括如下步骤:
S110:获取缺陷检测生成的图片及图片的缺陷类别和属性信息。
自动光学检测设备对产品进行缺陷检测后,会生成具体缺陷的图片和图片的缺陷类别和属性信息。其中,属性信息可以包括图片ID(identification身份标识号码)和特征信息。缺陷类别用于指示图片的缺陷所属的类别。具体地,步骤S110可以是获取自动光学检测设备产生的图片及图片的缺陷类别和图片的属性信息。图片的数量具体是多个。
S130:根据所有图片的属性信息构建准训练样本。
准训练样本可以是文本的格式,例如,生成包括图片的属性信息的文本,得到准训练样本。可以理解,准训练样本也可以是其他格式。
S150:根据缺陷类别对图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集。
缺陷类别集的数量与获取的图片的缺陷类别的种类相同,一种缺陷类别对应一个缺陷类别集;缺陷类别集由相同缺陷类别的图片组成,即同一缺陷类别集中的图片之间的缺陷类别相同。
S170:根据缺陷类别集中图片的属性信息和准训练样本的属性信息进行匹配检测,生成缺陷类别集对应的、用于输入机器学习分类算法以获取分类特征的训练样本。
根据一个缺陷类别集和准训练样本进行匹配检测,对应生成一个训练样本。具体的,缺陷类别集的数量为多个时,步骤S170可以是分别根据各缺陷类别集和准训练样本进行匹配检测,得到各缺陷类别集对应的训练样本;步骤S170也可以是根据准训练样本和所有缺陷类别集中的部分缺陷类别集进行匹配检测,得到部分缺陷类别集对应的训练样本。
训练样本用于输入机器学习分类算法,将训练样本输入机器学习分类算法后可以输出训练样本的分类特征。其中,分类特征为训练样本对应缺陷类别集的缺陷类别的共有特征;分类特征用于优化自动光学检测设备的分类器参数,以提高缺陷分类的准确度。例如,图片的缺陷类别为A类,A类图片组成A类的缺陷类别集,根据准训练样本和A类的缺陷类别集生成的A类的训练样本,A类的训练样本输入机器学习分类算法后得到A类的分类特征,比如“有划痕”;A类的分类特征用于优化自动光学检测设备,使自动光学检测设备将具有“有划痕”这一特征的产品分类为A类缺陷类别。
上述缺陷分类的样本获取方法,通过根据获取图片的属性信息构建准训练样本,根据获取图片的缺陷类别对图片分类标定得到缺陷类别集,根据准训练样本和缺陷类别集进行匹配检测生成训练样本,实现训练样本的自动生成,生成的训练样本用于机器学习分类算法以得到用于优化分类器参数的分类特征。一方面,由于对图片的分类标定是基于缺陷检测生成的图片的缺陷类别,可充分利用缺陷检测的结果,对图片的分类标定工作量少,另一方面,训练样本自动生成,不需要人工在线参与,可以支持离线处理,处理速度快;如此,训练样本的生成效率高,可提高获取用于优化分类器参数的分类特征的效率,从而分类器参数的优化效率高。此外,生成的训练样本可应用于机器学习分类算法,分类特征获取速度快,从而也提高分类器参数的优化效率。
在一个实施例中,参考图2,步骤S110包括步骤S111和步骤S113。
S111:选择自动光学检测设备产生的压缩包并复制到预设存储位置。
其中,预设存储位置为预先设定的用于存储压缩包的位置。可选地,压缩包的数量可以是一个,也可以是多个。步骤S111可以包括:选择预设时段内产生的、数量不少于预设数量的压缩包。例如,预设时段可以是以当前时刻为结束点、时长固定的一段时间;预设时段也可以是上一次分类器参数调整之后的时刻到当前时刻的时间段。预设数量可以是30,选取至少30份压缩包,以保障足够的数据量。
S113:解压压缩包,生成存放图片的图片文件夹以及记录图片的缺陷类别和属性信息的特征文本。
自动光学检测设备通常以压缩包的格式定期保存缺陷检测生成的图片以及图片的缺陷类别和属性信息。通过选择自动光学检测设备产生的压缩包复制到预设存储位置,对压缩包进行解压,从而将图片、缺陷类别和属性信息汇整。
具体地,一个压缩包对应一个图片文件夹和一个特征文本,特征文本记录所对应图片文件夹内存放图片的缺陷类别和属性信息。可选地,一个图片文件夹内可以存放的图片数量可以有多个,对应地,特征文本内记录多个图片各自对应的缺陷类别和属性信息。
具体地,属性信息包括图片ID和特征信息,即特征文本内记录图片的缺陷类别、图片ID和特征信息。本实施例中,图片的命名与图片ID一致,便于对应关联。例如,参考图3,以3个压缩包为例,解压一个压缩包生成一个图片文件夹和一个特征文本。可以理解,压缩包个数不限于3,可以无限延展。
在一个实施例中,属性信息包括图片ID和特征信息。继续参考图2,步骤S130包括步骤S131和步骤S133。
S131:分别根据各图片的图片ID和特征信息生成图片对应的属性文本。
一个图片对应一个属性文本,属性文本记录图片的图片ID和特征信息。
S133:将各图片的属性文本合并得到准训练样本。
准训练样本的生成不使用图片的缺陷类别,仅抽取图片ID以及特征信息;将各图片的属性文本合并为一个文本得到准训练样本,准训练样本中的信息包含:“图片ID”以及“特征信息”两部分。
通过分别根据各图片的图片ID和特征信息生成属性文本,再合并得到准训练样本,各图片的属性文本生成操作可以支持并联实施,例如在不同电脑上分别根据不同图片的图片ID和特征信息生成属性文本,再合并,如此,可加快准训练样本的生成速度。
例如,参考图4,特征文本记录图片的缺陷类别、图片ID和特征信息;分别根据3个特征文本中的图片ID和特征信息生成属性文本,再将3个属性文本合并得到一个准训练样本。
在一个实施例中,继续参考图2,步骤S150包括步骤S151、步骤S153和步骤S155。
S151:获取缺陷类别对应的存储地址并作为缺陷类别所对应图片的待转移地址。
缺陷类别的种类和存储地址预先对应存储;相同种类的缺陷类别对应的存储地址相同,不同种类的缺陷类别对应的存储地址不同。具体地,缺陷类别对应的存储地址可以通过查找缺陷类别所属种类对应的存储地址得到。
S153:获取图片的当前地址,根据同一图片的当前地址和待转移地址生成匹配清单。
图片的当前地址是图片当前所在位置的地址。通过步骤S151和步骤S153完成对图片的类别匹配操作,得到匹配清单。具体地,匹配清单可以是文本的格式,采用文本的格式记录图片的当前地址和对应的待转移地址。
S155:根据匹配清单将图片从当前地址移动到对应的待转移地址,生成同一地址存放的图片所组成的缺陷类别集。
图片对应的缺陷类别的种类相同,则对应的待转移地址相同,从而将图片移动后,缺陷类别种类相同的图片存储在同一地址,组成一个缺陷类别集,完成对图片的分类标定。
在一个实施例中,属性信息包括图片ID和特征信息;图片存放在图片文件夹内。步骤S153包括:获取图片的图片文件夹的地址得到当前地址;根据图片文件夹的地址和图片ID生成对应图片的匹配文本;合并各图片的匹配文本,并记录各图片的匹配文本和对应的待转移地址得到匹配清单。通过分别根据各图片的图片文件夹的地址和图片ID生成匹配文本,再合并,可以支持并联实施,例如在不同电脑上分别根据不同图片的图片文件夹的地址和图片ID生成匹配文本,如此,可加快匹配清单的生成速度。
例如,参考图5,特征文本记录图片的缺陷类别、图片ID和特征信息;根据特征文本中的缺陷类别进行图片的类别匹配操作,3个特征文本的类别匹配操作分别对应为图5中的类别匹配1、类别匹配2和类别匹配3,分别得到3个匹配文本;将3个匹配文本合并得到一个匹配清单。图5中,原始图片地址根据匹配文本得到。
可以理解,在其他实施例中,也可以是采用其他方式对图片进行分类标定。例如,根据缺陷类别直接将图片进行分类,将同一缺陷类别的图片移动到相同位置,得到缺陷类别集。
在一个实施例中,参考图6,步骤S155包括步骤S1551和步骤S1553。
S1551:根据匹配清单将图片从当前地址移动到对应的待转移地址,生成同一地址存放的图片所组成的初始分类集。
初始分类集通过自动移动图片的操作得到,自动将图片移到待转移地址,相当于对图片进行自动标定。具体地,可以是移动到待转移地址对应的按照“缺陷类别”命名的缺陷类别文件夹中,以实现标定的目的。例如:缺陷A文件夹,移动到缺陷A文件夹内的图片均称为A类缺陷。
S1553:接收人工操作指令,根据人工操作指令移动初始分类集中的图片,得到缺陷类别集。
人工操作指令由用户输入,通过接收人工操作指令对初始分类集中的图片进行移动,实现对图片的人工核定,便于对步骤S1551中自动标定错误的图片进行调整,提高分类的准确性。比如,重新建了一个缺陷类别文件夹:D类文件夹,将原有的A/B/C类文件夹中的符合D类缺陷的图片人工转移到D类文件夹,如图7所示;或者要优化A类文件夹,则从原有A类文件夹中剔除非A类缺陷的图片,并从B/C类文件夹中将符合A类缺陷的图片人工转移至A类文件夹中。
通过结合步骤S1551的自动标定和步骤S1553的人工核定,可以使图片的分类标定的准确度高,缺陷类别集的准确度高,进而提高基于缺陷类别集生成的训练样本的准确度。
在一个实施例中,继续参考图2,步骤S170包括步骤S171和步骤S173。
S171:根据缺陷类别集的图片的属性信息查找与准训练样本的属性信息匹配的属性信息。
其中,属性信息匹配可以是属性信息完全一致,也可以是属性信息中包括的其中一种信息一致。
S173:若查找到匹配的属性信息,则将准训练样本中对应的属性信息标记为真缺陷,否则,将准训练样本中对应的属性信息标记为假缺陷,得到缺陷类别集所对应的、用于输入机器学习分类算法以获取分类特征的训练样本。
具体地,属性信息包括图片ID和特征信息。步骤S171包括:生成包括缺陷类别集中图片的图片ID的ID清单;在ID清单中查找与准训练样本中属性信息的图片ID一致的图片ID。对应地,步骤S173包括:若查找到一致的图片ID,则将准训练样本中对应的图片ID更改为“真”,否则,将准训练样本中对应的图片ID更改为“假”,将更改后的准训练样本作为训练样本。如此,生成训练样本的过程,就是将“准训练样本”中的“图片ID”替换为“类别”的过程,其中,“类别”分成两类:“真”和“假”,其实现类似于EXCEL中的vlookup函数功能。准训练样本由“图片ID”+“特征信息”两个部分组成,经过步骤S173转化,变为“类别”+“特征信息”两个部分,成为“训练样本”。
参考图8,在一个实施例中,提供了一种缺陷检测的样本获取装置,包括图片汇整模块110、准训练样本生成模块130、分类标定模块150和匹配检测模块170。
图片汇整模块110用于获取缺陷检测生成的图片及图片的缺陷类别和属性信息。
准训练样本生成模块130用于根据所有图片的属性信息构建准训练样本。
分类标定模块150用于根据缺陷类别对图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集。
匹配检测模块170用于根据缺陷类别集中图片的属性信息和准训练样本的属性信息进行匹配检测,生成缺陷类别集对应的、用于输入机器学习分类算法以获取分类特征的训练样本。
上述缺陷分类的样本获取装置,通过根据获取图片的属性信息构建准训练样本,根据获取图片的缺陷类别对图片分类标定得到缺陷类别集,根据准训练样本和缺陷类别集进行匹配检测生成训练样本,实现训练样本的自动生成,生成的训练样本用于机器学习分类算法以得到用于优化分类器参数的分类特征。一方面,由于对图片的分类标定是基于缺陷检测生成的图片的缺陷类别,可充分利用缺陷检测的结果,对图片的分类标定工作量少,另一方面,训练样本自动生成,不需要人工在线参与,可以支持离线处理,处理速度快;如此,训练样本的生成效率高,可提高获取用于优化分类器参数的分类特征的效率,从而分类器参数的优化效率高。此外,生成的训练样本可应用于机器学习分类算法,分类特征获取速度快,从而也提高分类器参数的优化效率。
在一个实施例中,图片汇整模块110选择自动光学检测设备产生的压缩包并复制到预设存储位置,解压压缩包,生成存放图片的图片文件夹以及记录图片的缺陷类别和属性信息的特征文本。通过选择自动光学检测设备产生的压缩包复制到预设存储位置,对压缩包进行解压,从而将图片、缺陷类别和属性信息汇整。
在一个实施例中,属性信息包括图片ID和特征信息。准训练样本生成模块130分别根据各图片的图片ID和特征信息生成图片对应的属性文本;将各图片的属性文本合并得到准训练样本。通过分别根据各图片的图片ID和特征信息生成属性文本,再合并得到准训练样本,各图片的属性文本生成操作可以支持并联实施,例如在不同电脑上分别根据不同图片的图片ID和特征信息生成属性文本,再合并,如此,可加快准训练样本的生成速度。
在一个实施例中,分类标定模块150包括第一单元(图未示)、第二单元(图未示)和第三单元(图未示)。第一单元获取缺陷类别对应的存储地址并作为缺陷类别所对应图片的待转移地址;第二单元获取图片的当前地址,根据同一图片的当前地址和待转移地址生成匹配清单;第三单元根据匹配清单将图片从当前地址移动到对应的待转移地址,生成同一地址存放的图片所组成的缺陷类别集。如此,将图片移动后,缺陷类别种类相同的图片存储在同一地址,组成一个缺陷类别集,完成对图片的分类标定。
在一个实施例中,属性信息包括图片ID和特征信息;图片存放在图片文件夹内。第二单元获取图片的图片文件夹的地址得到当前地址;根据图片文件夹的地址和图片ID生成对应图片的匹配文本;合并各图片的匹配文本,并记录各图片的匹配文本和对应的待转移地址得到匹配清单。通过分别根据各图片的图片文件夹的地址和图片ID生成匹配文本,再合并,可以支持并联实施,例如在不同电脑上分别根据不同图片的图片文件夹的地址和图片ID生成匹配文本,如此,可加快匹配清单的生成速度。
在一个实施例中,第三单元根据匹配清单将图片从当前地址移动到对应的待转移地址,生成同一地址存放的图片所组成的初始分类集;接收人工操作指令,根据人工操作指令移动初始分类集中的图片,得到缺陷类别集。通过结合自动标定和人工核定,可以使图片的分类标定的准确度高,缺陷类别集的准确度高,进而提高基于缺陷类别集生成的训练样本的准确度。
在一个实施例中,匹配检测模块170根据缺陷类别集的图片的属性信息查找与准训练样本的属性信息匹配的属性信息;若查找到匹配的属性信息,则将准训练样本中对应的属性信息标记为真缺陷,否则,将准训练样本中对应的属性信息标记为假缺陷,得到缺陷类别集所对应的、用于输入机器学习分类算法以获取分类特征的训练样本。
具体地,属性信息包括图片ID和特征信息。匹配检测模块170生成包括缺陷类别集中图片的图片ID的ID清单;在ID清单中查找与准训练样本中属性信息的图片ID一致的图片ID。匹配检测模块170在查找到一致的图片ID时,将准训练样本中对应的图片ID更改为“真”,否则,将准训练样本中对应的图片ID更改为“假”,将更改后的准训练样本作为训练样本。
在一个实施例中,参考图9,提供了一种缺陷检测的样本训练方法,包括如下步骤:
S110:获取缺陷检测生成的图片及图片的缺陷类别和属性信息。
S130:根据所有图片的属性信息构建准训练样本。
S150:根据缺陷类别对图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集。
S170:根据缺陷类别集中图片的属性信息和准训练样本的属性信息进行匹配检测,生成缺陷类别集对应的、用于输入机器学习分类算法以获取分类特征的训练样本。
S210:将训练样本输入机器学习分类算法进行训练,得到训练样本的分类特征。
其中,机器学习分类算法包括决策树算法、随机森林算法、支持向量机算法、朴素贝叶斯算法、人工神经网络算法、线性判别函数分类、逻辑回归算法等带监督学习的分类算法。
上述缺陷分类的样本训练方法,基于上述缺陷分类的样本训练方法实现,同样具备分类器参数的优化效率高的效果。而且,采用机器学习算法对训练样本进行训练以获取分类特征,不需要严重依赖经验,降低了工作难度。
在一个实施例中,参考图10,提供了一种缺陷检测的样本训练装置,包括图片汇整模块110、准训练样本生成模块130、分类标定模块150、匹配检测模块170和样本训练模块210。
图片汇整模块110用于获取缺陷检测生成的图片及图片的缺陷类别和属性信息。
准训练样本生成模块130用于根据所有图片的属性信息构建准训练样本。
分类标定模块150用于根据缺陷类别对图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集。
匹配检测模块170用于根据缺陷类别集中图片的属性信息和准训练样本的属性信息进行匹配检测,生成缺陷类别集对应的、用于输入机器学习分类算法以获取分类特征的训练样本。
样本训练模块210用于将训练样本输入机器学习分类算法进行训练,得到训练样本的分类特征。
上述缺陷分类的样本训练装置,基于上述缺陷分类的样本训练装置实现,同样具备分类器参数的优化效率高的效果。而且,采用机器学习算法对训练样本进行训练以获取分类特征,不需要严重依赖经验,降低了工作难度。
在一个实施例中,提供了一种介质,存储有计算机程序,存储的计算机程序被处理器执行时实现上述缺陷分类的样本获取方法或缺陷分类的样本训练方法的步骤。具体地,介质为计算机可读存储介质。
在一个实施例中,提供了一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述缺陷分类的样本获取方法或缺陷分类的样本训练方法的步骤。具体地,设备为计算机设备。
上述介质和设备,由于实现了上述缺陷分类的样本获取方法或缺陷分类的样本训练方法,同理具备分类器参数的优化效率高的效果。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种缺陷检测的样本获取方法,其特征在于,包括:
获取由自动光学检测设备缺陷检测生成的图片及所述图片的缺陷类别和属性信息;
根据所有图片的属性信息构建准训练样本;
根据所述缺陷类别对所述图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集;
根据所述缺陷类别集的图片的属性信息查找与所述准训练样本的属性信息匹配的属性信息;
若查找到匹配的属性信息,则将所述准训练样本中对应的属性信息标记为真缺陷,否则,将所述准训练样本中对应的属性信息标记为假缺陷,得到所述缺陷类别集所对应的、用于输入机器学习分类算法以获取分类特征的训练样本。
2.根据权利要求1所述的缺陷检测的样本获取方法,其特征在于,所述属性信息包括图片ID和特征信息;所述根据所有图片的属性信息构建准训练样本,包括:
分别根据各图片的图片ID和特征信息生成所述图片对应的属性文本;
将各图片的属性文本合并得到所述准训练样本。
3.根据权利要求2所述的缺陷检测的样本获取方法,其特征在于,所述根据所述缺陷类别对所述图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集,包括:
获取所述缺陷类别对应的存储地址并作为所述缺陷类别所对应图片的待转移地址;
获取所述图片的当前地址,根据同一图片的当前地址和待转移地址生成所述匹配清单;
根据所述匹配清单将所述图片从当前地址移动到对应的待转移地址,生成同一地址存放的图片所组成的缺陷类别集。
4.根据权利要求3所述的缺陷检测的样本获取方法,其特征在于,所述图片存放在图片文件夹内;所述获取所述图片的当前地址,根据同一图片的当前地址和待转移地址生成所述匹配清单的步骤包括:
获取所述图片的图片文件夹的地址作为当前地址;
根据所述图片文件夹的地址和所述图片ID生成对应图片的匹配文本;
合并各所述图片的匹配文本,并记录各所述图片的匹配文本和对应的待转移地址得到匹配清单。
5.根据权利要求3所述的缺陷检测的样本获取方法,其特征在于,所述根据所述匹配清单将所述图片从当前地址移动到对应的待转移地址,生成同一地址存放的图片所组成的缺陷类别集,包括:
根据所述匹配清单将所述图片从当前地址移动到对应的待转移地址,生成同一地址存放的图片所组成的初始分类集;
接收人工操作指令,根据所述人工操作指令移动所述初始分类集中的图片,得到所述缺陷类别集。
6.一种缺陷检测的样本获取装置,其特征在于,包括:
图片汇整模块,用于获取缺陷检测生成的图片及所述图片的缺陷类别和属性信息;
准训练样本生成模块,用于根据所有图片的属性信息构建准训练样本;
分类标定模块,用于根据所述缺陷类别对所述图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集;
匹配检测模块,用于根据所述缺陷类别集的图片的属性信息查找与所述准训练样本的属性信息匹配的属性信息;
若查找到匹配的属性信息,则将所述准训练样本中对应的属性信息标记为真缺陷,否则,将所述准训练样本中对应的属性信息标记为假缺陷,得到所述缺陷类别集所对应的、用于输入机器学习分类算法以获取分类特征的训练样本。
7.一种缺陷检测的样本训练方法,其特征在于,包括:
将权利要求1-5中任一项所述的训练样本输入机器学习分类算法进行训练,得到所述训练样本的分类特征。
8.一种缺陷检测的样本训练装置,其特征在于,包括:
图片汇整模块,用于获取缺陷检测生成的图片及所述图片的缺陷类别和属性信息;
准训练样本生成模块,用于根据所有图片的属性信息构建准训练样本;
分类标定模块,用于根据所述缺陷类别对所述图片进行分类标定,得到相同缺陷类别的图片所组成的缺陷类别集;
匹配检测模块,用于根据所述缺陷类别集的图片的属性信息查找与所述准训练样本的属性信息匹配的属性信息;若查找到匹配的属性信息,则将所述准训练样本中对应的属性信息标记为真缺陷,否则,将所述准训练样本中对应的属性信息标记为假缺陷,得到所述缺陷类别集所对应的、用于输入机器学习分类算法以获取分类特征的训练样本;
样本训练模块,用于将所述训练样本输入机器学习分类算法进行训练,得到所述训练样本的分类特征。
9.一种介质,存储有计算机程序,其特征在于,存储的计算机程序被处理器执行时实现如权利要求1-5中任一项所述方法或实现如权利要求7所述方法的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-5中任一项所述方法或实现如权利要求7所述方法的步骤。
CN201711367414.8A 2017-12-18 2017-12-18 缺陷检测的样本获取方法、训练方法、装置、介质和设备 Active CN107992900B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711367414.8A CN107992900B (zh) 2017-12-18 2017-12-18 缺陷检测的样本获取方法、训练方法、装置、介质和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711367414.8A CN107992900B (zh) 2017-12-18 2017-12-18 缺陷检测的样本获取方法、训练方法、装置、介质和设备

Publications (2)

Publication Number Publication Date
CN107992900A CN107992900A (zh) 2018-05-04
CN107992900B true CN107992900B (zh) 2020-09-11

Family

ID=62037757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711367414.8A Active CN107992900B (zh) 2017-12-18 2017-12-18 缺陷检测的样本获取方法、训练方法、装置、介质和设备

Country Status (1)

Country Link
CN (1) CN107992900B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108931529B (zh) * 2018-05-10 2020-12-22 深圳市盛波光电科技有限公司 一种连续生产卷状材料的良率预估方法
TWI703514B (zh) * 2018-05-24 2020-09-01 牧德科技股份有限公司 人工智慧複檢系統及其方法
CN110633725B (zh) * 2018-06-25 2023-08-04 富士通株式会社 训练分类模型的方法和装置以及分类方法和装置
CN110930350A (zh) * 2018-09-19 2020-03-27 鸿富锦精密电子(天津)有限公司 机器学习方法及应用机器学习方法的自动光学检测设备
CN109406529B (zh) * 2018-09-28 2021-09-14 武汉精立电子技术有限公司 一种aoi缺陷检测系统的性能调节方法
CN109166123A (zh) * 2018-10-15 2019-01-08 广东电网有限责任公司 缺陷图像命名方法及装置
TWI714923B (zh) * 2018-12-06 2021-01-01 住華科技股份有限公司 自動光學檢測方法及應用其之自動光學檢測系統
CN112699906B (zh) * 2019-10-22 2023-09-22 杭州海康威视数字技术股份有限公司 获取训练数据的方法、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103399875A (zh) * 2013-07-12 2013-11-20 深圳市金立通信设备有限公司 一种文件管理的方法及装置
CN104133875A (zh) * 2014-07-24 2014-11-05 北京中视广信科技有限公司 一种基于人脸的视频标注方法和视频检索方法
CN104809437A (zh) * 2015-04-28 2015-07-29 无锡赛睿科技有限公司 一种基于实时视频的车辆检测与跟踪方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103399875A (zh) * 2013-07-12 2013-11-20 深圳市金立通信设备有限公司 一种文件管理的方法及装置
CN104133875A (zh) * 2014-07-24 2014-11-05 北京中视广信科技有限公司 一种基于人脸的视频标注方法和视频检索方法
CN104809437A (zh) * 2015-04-28 2015-07-29 无锡赛睿科技有限公司 一种基于实时视频的车辆检测与跟踪方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于知识图谱的海量数据错误标签的纠正;刘艺;《中国优秀硕士学位论文全文数据库——信息科技辑》;20150715(第7期);该论文第2-6页 *

Also Published As

Publication number Publication date
CN107992900A (zh) 2018-05-04

Similar Documents

Publication Publication Date Title
CN107992900B (zh) 缺陷检测的样本获取方法、训练方法、装置、介质和设备
TWI576708B (zh) 自動缺陷分類的分類器準備與維持
TWI585397B (zh) 用於自動缺陷分類之不明缺陷拒絕率之最佳化
CN110991657A (zh) 一种基于机器学习的异常样本检测方法
CN107798047B (zh) 重复工单检测方法、装置、服务器和介质
JP4490876B2 (ja) コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類プログラムおよびコンテンツ分類プログラムを記録した記録媒体
JP6636883B2 (ja) 評価装置、評価方法、および評価プログラム
CN112037222B (zh) 一种神经网络模型的自动更新方法及系统
CN106959998B (zh) 一种试题推荐方法及装置
US11263258B2 (en) Information processing method, information processing apparatus, and non-transitory computer-readable storage medium for storing information processing program of scoring with respect to combination of imaging method and trained model
CN107798457B (zh) 投资组合方案推荐方法、装置、计算机设备和存储介质
CN109685756A (zh) 影像特征自动辨识装置、系统及方法
CN107330076A (zh) 一种网络舆情信息展示系统及方法
CN114092935A (zh) 一种基于卷积神经网络的纺织品纤维识别方法
US20230297886A1 (en) Cluster targeting for use in machine learning
CN112668365A (zh) 一种物料入库识别方法、装置、设备及存储介质
CN108074240B (zh) 识别方法、识别装置、计算机可读存储介质及程序产品
CN115829925A (zh) 外观缺陷检测方法、装置、计算机设备及存储介质
Kusa et al. Vombat: A tool for visualising evaluation measure behaviour in high-recall search tasks
CN113516328B (zh) 数据处理方法、服务提供方法、装置、设备和存储介质
CN113900935A (zh) 一种缺陷自动识别方法、装置、计算机设备及存储介质
CN113808116A (zh) 基于图像识别的智能检测方法、系统及产品检测系统
CN112906805A (zh) 图像训练样本筛选和任务模型训练方法、装置及电子设备
JP2020101900A (ja) 画像検査装置、画像検査のための学習方法および画像検査プログラム
US20240013369A1 (en) Image defect detecting system, generation method of image defect detecting system and non-transitory computer readable medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant