CN118071732A - 一种基于上下文感知的小样本玻璃气泡缺陷检测装置及方法 - Google Patents
一种基于上下文感知的小样本玻璃气泡缺陷检测装置及方法 Download PDFInfo
- Publication number
- CN118071732A CN118071732A CN202410387275.9A CN202410387275A CN118071732A CN 118071732 A CN118071732 A CN 118071732A CN 202410387275 A CN202410387275 A CN 202410387275A CN 118071732 A CN118071732 A CN 118071732A
- Authority
- CN
- China
- Prior art keywords
- image
- defect detection
- glass
- defect
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007547 defect Effects 0.000 title claims abstract description 224
- 238000001514 detection method Methods 0.000 title claims abstract description 152
- 239000011521 glass Substances 0.000 title claims abstract description 144
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000000605 extraction Methods 0.000 claims abstract description 51
- 238000012549 training Methods 0.000 claims description 65
- 238000002372 labelling Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 3
- 239000013307 optical fiber Substances 0.000 claims description 3
- 230000001373 regressive effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000013527 convolutional neural network Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/766—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Quality & Reliability (AREA)
- Image Processing (AREA)
Abstract
本发明提供一种基于上下文感知的小样本玻璃气泡缺陷检测装置及方法,其中所述方法包括以下步骤:获取待检测玻璃气泡缺陷图像;将所述待检测玻璃图像输入预先训练的特征提取模型,得到与所述待检测玻璃气泡缺陷图像对应的图像特征;将所得到的图像特征输入预先训练的用于小样本的玻璃气泡缺陷检测模型,得到与待检测玻璃图像对应的玻璃气泡缺陷检测结果,其中,玻璃气泡缺陷检测结果用于表征待检测玻璃气泡缺陷图像中是否存在气泡缺陷;本发明可以有效的解决小样本缺陷检测任务中由于目标域的缺陷图像样本量过少导致缺陷检测模型难以对目标域的新类样本有效的识别,我们通过将方法集成到我们的装置中,实现方法的即插即用,提高模型的应用效率。
Description
技术领域
本发明涉及计算机技术领域,具体地,涉及一种基于上下文感知的小样本玻璃气泡缺陷检测装置及方法。
背景技术
随着深度学习发展,传统的目标检测模型已经实现了良好性能。但是,这些良好模型性能是依赖于大量的标注数据,而在工业上这些大量的标记的数据往往是难以获取的,这就导致传统的目标检测对工业品进行缺陷检测的过程,往往不能实现较好的性能。
一般而言,小样本学习方法是解决这种问题的有效方法。但是,小样本学习的难点在于:在训练样本严重不足的情况下,传统的模型优化方法难以被有效用于模型的优化,也就影响了人工智能技术的发展与实际应用。针对这一问题,国内大量工作在迁移学习过程中的优化模型框架下对小样本学习问题进行了研究,包括度量学习,迁移学习,基于模型优化,基于GAN的图像生成网络,和基于数据增强的小样本学习方法。
尽管迁移学习可以使传统的目标检测方法在小样本学习过程中更多的关注模型对小样本新任务快速迁移和泛化能力。但是,如何提高对小样本的新类的有效识别,也是本领域的重要研究课题之一。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于上下文感知的小样本玻璃气泡缺陷检测装置及方法,本发明可以有效的解决小样本缺陷检测任务中由于目标域的缺陷图像样本量过少导致缺陷检测模型难以对目标域的新类样本有效的识别,我们通过将方法集成到我们的装置中,实现方法的即插即用,提高模型的应用效率。
本发明的目的是这样实现的:
第一方面,本发明提供了一种用于玻璃气泡缺陷检测的方法,其包括以下步骤:获取待检测玻璃气泡缺陷图像,将所述待检测玻璃图像输入预先训练的特征提取模型,得到与所述待检测玻璃气泡缺陷图像对应的图像特征,其中,所述特征提取模型用于提取待检测玻璃气泡缺陷图像的特征;将所得到的图像特征输入预先训练的用于小样本的玻璃气泡缺陷检测模型,得到与待检测玻璃图像对应的玻璃气泡缺陷检测结果,其中,玻璃气泡缺陷检测结果用于表征待检测玻璃气泡缺陷图像中是否存在气泡缺陷,用于小样本的玻璃气泡缺陷检测模型用于表征图像特征和玻璃气泡缺陷检测结果之间的对应关系。
进一步地,所述特征提取模型是通过如下第一步训练步骤训练得到的:获取大量其他类别的玻璃缺陷检测图像集合,其中,每个训练样本包括样本玻璃缺陷图像和用于指示该样本玻璃缺陷图像中的缺陷类别以及缺陷所在位置的标注框的标注信息;对于所述玻璃缺陷检测图像集合中玻璃缺陷图像,执行以下第一调参步骤:将该玻璃缺陷图像输入初始特征提取模型,得到与该玻璃缺陷图像对应的图像特征;将所得到的图像特征输入初始缺陷检测模型,其中初始缺陷检测模型包括分类器和回归器;基于所得到的检测结果与其对应的标注信息之间的距离,调整所述的初始特征提取模型和所述的初始缺陷检测模型的参数;将所述的初始特征模型确定为所述的特征提取模型。
进一步地,所述第一调参步骤还包括:将所得到的玻璃缺陷图像对应的图像特征,分别输入到初始缺陷检测模型中的分类器和回归器中,分别可以得到一个得分向量和多个生成锚框,然后计算得分向量与输入图像类别真值的之间的距离,以及多个生成锚框与输入图像标注框之间的交并比;基于类别之间的距离已经锚框与标注框之间的交并比,调整所述初始特征提取模型、所述初始分类器和所述初始定位器的参数。
进一步地,对于所述玻璃缺陷检测图像集合中的玻璃缺陷图像,在执行第一调参步骤之前,所述第一训练步骤还包括:确定所述初始特征提取模型和初始缺陷检测模型的结构信息,以及初始化初始特征提取模型的模型参数和初始缺陷检测模型的网络参数。
进一步地,所述的初始缺陷检测模型是通过如下第二训练步骤训练得到的:
获取玻璃气泡缺陷图像训练样本集合,其中,每个训练样本包括样本玻璃气泡缺陷图像和用于指示该样本玻璃缺陷图像中的缺陷类别以及缺陷所在位置的标注框的标注信息;确定缺陷检测模型的结构信息,初始化缺陷检测模型的模型参数;对于所述训练样本集合中的训练样本,执行以下第二调参步骤:将该训练样本中的样本玻璃气泡缺陷图像输入特征提取模型,得到与该训练样本对应的图像特征;将所得到的图像特征输入初始缺陷检测模型,得到与所得到的图像特征对应的缺陷检测结果;基于所得到的缺陷检测结果与该训练样本中的标注信息之间的差异,调整初始缺陷检测模型的模型参数;将所述的缺陷检测模型确定为所述缺陷检测模型。
进一步地,所述特征提取模型为卷积神经网络。
第二方面,本发明提供了一种基于上下文感知的小样本玻璃气泡缺陷检测装置,该装置包括:获取单元,用于获取待检测玻璃气泡缺陷图像;特征提取单元,用于将待检测玻璃气泡缺陷图像输入预先训练的特征提取模型,得到与待检测玻璃气泡缺陷图像对应的图像特征,其中,特征提取模型用于提取待检测玻璃气泡缺陷图像的特征;玻璃气泡缺陷检测单元,用于将所得到的图像特征输入预先训练的玻璃气泡缺陷检测模型,得到与待检测玻璃气泡缺陷图像对应的缺陷检测结果,其中,缺陷检测结果用于表征待检测玻璃气泡缺陷图像中的缺陷是否是气泡缺陷,缺陷检测模型用于表征图像特征和缺陷检测结果之间的对应关系;边缘计算盒子,用于集成部署特征提取单元、玻璃气泡缺陷检测单元;计算机可读存储介质,用于存储与待检测玻璃气泡缺陷图像相对应的检测结果;获取单元通过WiFi连接、光纤和电缆的连接方式将获取的待检测玻璃气泡缺陷图像传输入边缘计算盒子中,边缘计算盒子中集成部署的特征提取单元与玻璃气泡缺陷检测单元先后提取待检测玻璃气泡缺陷图像的特征,以及根据这个特征进行检测得到与所述待检测玻璃气泡缺陷图像对应的缺陷检测结果,然后边缘计算盒子通过线缆的方式将检测结果输入计算可读存储介质,用于存储与待检测玻璃气泡缺陷图像对应的检测结果。
进一步地,所述边缘计算盒子包括:一个或多个处理器;一个内置网卡;存储装置,用于存储一个或多个程序。
进一步地,所述计算机可读介质上存储有计算机程序。
进一步地,所述缺陷检测模型包括全连接层和分类器。
与现有技术相比,本发明具有以下有益效果:
本发明提供的小样本玻璃气泡缺陷检测装置和方法,通过提取待检测玻璃图像的图像特征,然后将所得到的图像特征输入预先训练的缺陷检测模型,得到与待检测玻璃图像对应的玻璃检测结果。这样的办法有利于解决目前带有标注信息的缺陷数据不够情况,导致模型泛化能力不行,出现误检和漏检的情况。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明一种基于上下文感知的小样本玻璃气泡缺陷检测装置可以应用于其中的示例性系统架构图;
图2是本发明一种基于上下文感知的小样本玻璃气泡缺陷检测方法用于检测缺陷的方法的流程图;
图3是本发明一种基于上下文感知的小样本玻璃气泡缺陷检测方法的系统框架图;
图4是本发明一种基于上下文感知的小样本玻璃气泡缺陷检测方法中特征提取器采用的模型结构信息图;
图5是本发明一种基于上下文感知的小样本玻璃气泡缺陷检测方法中稀疏上下文transformer的结构图;
图6是本发明一种基于上下文感知的小样本玻璃气泡缺陷检测方法中用于训练特征提取模型的第一训练步骤的流程图;
图7是本发明一种基于上下文感知的小样本玻璃气泡缺陷检测方法中用于训练缺陷检测模型的第二训练步骤的流程图;
图8是本发明一种基于上下文感知的小样本玻璃气泡缺陷检测方法中所采用的电子设备的计算机系统的结构示意图。
图中:
101是视频采集设备;102是边缘计算盒子;103是终端设备;
301是特征提取模型,302是第一阶段的初始化缺陷检测模型,3021是回归器,3022是分类器,303是稀疏上下文transformer模块,304是第二阶段的气泡缺陷检测模型,3041是回归器,3042是分类器;
501是上下文信息的构建,502是稀疏上下文transformer,5021是稀疏的上下文关系的构建,5022是上下文的融合;
801是CPU,802是ROM,803是RAM,804是总线,805是I/O,806是存储部分,807是通信部分,808是驱动器,809是可拆卸介质,810是云端超算。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如图1所示,系统的架构100可以包括视频采集设备101、边缘计算盒子102和终端设备103,视频采集设备101和边缘计算盒子102之间以及边缘计算盒子102和终端设备103之间的连接方式包括无线通信或光纤电缆等等。
用户可以使用视频采集设备101采集需要的检测的玻璃图像,并将这些采集的玻璃图像通过一定的通信方式传输给边缘计算盒子102,然后通过边缘计算盒子102中部署的玻璃气泡缺陷检测的多模态小样本方法,而在终端103中可以接收到边缘计算盒子的处理结果。
边缘计算盒子102是一种可以提供计算机算力的和存储空间的设备,主要用来部署玻璃气泡缺陷检测算法和临时存储相关的待检测的玻璃图像和已完成检测的玻璃图像。
继续参考图2,其示出了根据本申请的用于玻璃气泡缺陷检测的方法的一个实施例的流程200,可以具有一定数目的计算机存储介质,视频采集设备和边缘计算盒子。该用于检测缺陷的方法,包括以下步骤:
步骤201,获取待检测的玻璃图像
在本实施例中,用于检测缺陷的方法的执行主体(例如图1所示的边缘计算机盒子)可以获取待检测缺陷图像。
这里,上述待检测玻璃图像可以是与上述执行主体(例如图1所示的边缘计算盒子)通信连接的视频采集设备(例如图1所示的视频采集设备101)通过有线连接方式或无线连接方式上传至上述执行主体中的。这时,与上述执行主体通信连接的视频采集设备(一般是监控摄像头)。可以获取待检测玻璃图像,并将拍摄得到的玻璃图像发送给上述执行主体。这样,上述执行主体可以将从上述视频采集设备接收到的图像作为待检测玻璃图像。需要指出的是,上述无线连接方式可以WiFi连接、光纤和电缆以及其他现在已知或将来开发的无线连接方式。
步骤202,将待检测图像输入预先训练的特征提取模型中,得到与待检测玻璃图像对应视觉特征。
在本实施例中,上述执行主体(例如图1所示的边缘计算盒子)可以将步骤201所获取的待检测图像输入预先训练的特征提取模型,得到与待检测玻璃图像对应的多模态特征融合
这里,预先训练的特征提取模型是我们设计的用于提取图像特征的模型。这里的图像特征也可以是各种特征,包括但不限于颜色特征、纹理特征、二维形状特征、二维空间关系特征、三维形状特征、三维空间关系特征、缺陷形状特征等等。
在本实施例的一些可选的实现方式中,整个缺陷检测方法的整个系统框架如图3所示,主要分为两阶段内容。在第一训练阶段,我们首先训练出一个初始化的特征提取模型和缺陷检测模型。然后在第二训练阶段中加入我们设计的稀疏上下文transformer模块,构成一个新的分类器,从而构建一个新的缺陷检测模型。这里,我们设计的稀疏上下文transformer模块如图5所示主要有501上下文字段,502稀疏关系探索,503上下文融合构成的。,在这里我们为了鼓励模型更好的关注于玻璃气泡的特征信息,我们在第二训练阶段在玻璃气泡缺陷样本集合上训练过程中加入我们稀疏上下文transformer,可以更好帮助模型结合与任务相关的上下文字段,并抑制与任务无关的上下文字段。有效的帮助我们小样本目标检测中出现的目标混淆问题,从而提高模型的泛化性,从而进一步提高模型的性能。稀疏上下文transformer模块具体计算过程如下所示:
C=λM*+Q
R=sign(A),
W=softmax(R)ψη(C)
其中,M*和Q是图5中的所示上下文两个部分,分别表示为多尺度融合特征图和一组prior boxes,图5中一系列ψx是图5中所示全连接层,sign()是注意力稀疏层,P表示每个prior box,C表示上下文字段,A表示为每个prior box与上下文字段之间的注意力权重矩阵,R表示稀疏化注意力权重矩阵。W,Θ,分别表示与任务相关的上下文字段,多尺度共享参数矩阵,以及最终的预测结果。
在本实施例的一些可选的实现方式中,上述特征提取模型可以是通过如下第一训练步骤训练得到的。请参考图6,图6示出了根据本申请的用于训练特征提取模型的第一训练步骤的一个实施例的流程600,该第一训练步骤可以包括以下步骤601到步骤602:
步骤601获取大量已知类别的图像集合
这里,第一训练步骤的执行主体可以与用于检测缺陷的方法的执行主体相同或者不同。如果相同,则第一训练步骤的执行主体可以在训练得到特征提取模型后将训练好的特征提取模型的模型结构信息和模型参数的参数值存储在本地。如果不同,则第一训练步骤的执行主体可以在训练得到特征提取模型后将训练好的特征提取模型的模型结构信息和模型参数的参数值发送给用于检测缺陷的方法的执行主体。
步骤602对于大量其他类别的玻璃缺陷集合中的图像,执行第一调参步骤
将该玻璃缺陷图像输入初始特征提取模型,得到与该玻璃缺陷图像对应的图像特征;将所得到的图像特征输入初始检测模型,其中初始检测模型中是分类器和回归器构成的;基于的所得到的检测结果和原始输入图像之间的距离,调整所述的初始特征提取模型和所述的初始检测模型的参数。基于所得到的检测结果与其对应的输入图像的标注信息之间的距离,实际上这个距离,就是我们的检测结果与真实的准确结果之间的偏差,然后模型根据这个偏差自动进行反向传播对模型的参数进行调整,从而让这两者之间的距离越来越小。
在本实施例的一些可选的实现方式中,上述缺陷检测模型可以是通过第二训练步骤训练得到的,如图7所示,图7示出了根据本申请的用于训练缺陷检测模型的第二训练步骤的流程700,该第二训练步骤可以包括以下步骤701到步骤703:
步骤701,获取玻璃气泡缺陷图像训练样本集合,其中,每个训练样本包括样本玻璃缺陷图像和用于指示该样本玻璃缺陷图像中的缺陷类别以及缺陷所在位置的标注框的标注信息。
这里,第二训练步骤的执行主体可以与用于检测缺陷的方法的执行主体相同或者不同。如果相同,则第二训练步骤的执行主体可以在训练得到缺陷检测模型后将训练好的缺陷检测模型的模型结构信息和模型参数的参数值存储在本地。如果不同,则第二训练步骤的执行主体可以在训练得到缺陷检测模型后将训练好的缺陷检测模型的模型结构信息和模型参数的参数值发送给用于检测缺陷的方法的执行主体。
步骤702,确定初始化缺陷检测模型的模型结构信息,以及初始化缺陷检测模型参数
在这里,使用的初始化网络模型的视觉特征提取器是第一训练中训练完成视觉特征提取器,初始的文本特征提取器也是第一训练的视觉文本信息的全连接层。
步骤703,对于训练样本集合中的训练样本,执行第二调参步骤。
这里,第二训练步骤的执行主体可以对于步骤701中所获取的训练样本集合中的训练样本,执行第二调参步骤,其中,上述第二调参步骤可以包括如下子步骤7031到子步骤7033:
子步骤7031,将该训练样本中的样本玻璃图像输入特征提取模型,得到与该训练样本对应的图像特征。
子步骤7032,将所得到的图像特征分别输入到预先训练的缺陷检测模型和稀疏上下文transformer模块中。
子步骤7033,将融入上下文信息的特征表示输入到缺陷检测模型中的分类器中,构成新的缺陷检测模型。
子步骤7034,基于检测结果与该训练样本中的标注信息之间的差异,调整初始检测模型的参数。
经过步骤703,初始缺陷检测模型的模型参数得到了优化。
步骤704,将初始化的缺陷检测模型确定为缺陷检测模型。
本申请的上述实例提供的用于检测缺陷的方法通过提取待检测的玻璃图像的特征,然后将所得到的图像特征输入预先训练的缺陷检测模型中。得到与待检测玻璃图像对应的缺陷检测结果。本申请实例的方法可以有效地提高小样本检测方法对目标域的特征上下文感知能力,进而解决小样本目标检测方法由于样本量偏低导致目标混淆的问题。此外,本申请的实例中设计稀疏上下文transformer可以有效提高模型上下文字段的利用效率,同时避免其他的上下文字段的影响。让本申请的方法进一步从有限样本上学习到有效的特征分布,从而提高方法在小样本上的检测精度。
下面参考图8,其示出了适于用来实现本申请实施例的电子设备的计算机系统800的结构示意图。图8示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(CPU,Central Processing Unit)801,其可以根据存储在只读存储器(ROM,Read Only Memory)802中的程序或者从存储部分608加载到随机访问存储器(RAM,Random Access Memory)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU801、ROM802以及RAM803通过总线804彼此相连。输入/输出(I/O,Input/Output)接口805也连接至总线804。以下部件连接至I/O接口805:包括硬盘等的存储部分806;以及包括诸如LAN(局域网,Local Area Network)卡、调制解调器等的网络接口卡的通信部分807。通信部分807经由诸如因特网的网络执行通信处理。驱动器808也根据需要连接至I/O接口805。可拆卸介质809,诸如摄像头,NVR设备等边缘信息采集设备,根据需要安装在驱动器808上,以便于可以其将边缘检测的到玻璃图像通过805的I/O接口传入到总线804上,通过中央处理单元801中的一个或者多个处理器执行时,通过将可拆卸介质采集的玻璃缺陷图像处理传入集成部署于806存储部分的特征提取模型和缺陷检测模型中,然后程序通过807的通信设备调用我们810云端超算的强大计算能力,通过结合810的云端超算强大计算能力,可以极大的缩短我们的推理时间,最终我们将推理缺陷检测结果存储在存储部分806。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种基于上下文感知的小样本玻璃气泡缺陷检测装置,其特征在于,包括:
获取单元,用于获取待检测玻璃气泡缺陷图像;
特征提取单元,用于将待检测玻璃气泡缺陷图像输入预先训练的特征提取模型,得到与待检测玻璃气泡缺陷图像对应的图像特征,其中,特征提取模型用于提取待检测玻璃气泡缺陷图像的特征;
玻璃气泡缺陷检测单元,用于将所得到的图像特征输入预先训练的玻璃气泡缺陷检测模型,得到与待检测玻璃气泡缺陷图像对应的缺陷检测结果,其中,缺陷检测结果用于表征待检测玻璃气泡缺陷图像中的缺陷是否是气泡缺陷,缺陷检测模型用于表征图像特征和缺陷检测结果之间的对应关系;
边缘计算盒子,用于集成部署特征提取单元、玻璃气泡缺陷检测单元;
计算机可读存储介质,用于存储与待检测玻璃气泡缺陷图像相对应的检测结果;
获取单元通过WiFi连接、光纤和电缆的连接方式将获取的待检测玻璃气泡缺陷图像传输入边缘计算盒子中,边缘计算盒子中集成部署的特征提取单元与玻璃气泡缺陷检测单元先后提取待检测玻璃气泡缺陷图像的特征,以及根据这个特征进行检测得到与所述待检测玻璃气泡缺陷图像对应的缺陷检测结果,然后边缘计算盒子通过线缆的方式将检测结果输入计算可读存储介质,用于存储与待检测玻璃气泡缺陷图像对应的检测结果。
2.根据权利要求1所述的一种基于上下文感知的小样本玻璃气泡缺陷检测装置,其特征在于,所述边缘计算盒子包括:
一个或多个处理器;
一个内置网卡;
存储装置,用于存储一个或多个程序。
3.根据权利要求1所述的一种基于上下文感知的小样本玻璃气泡缺陷检测装置,其特征在于:所述计算机可读介质上存储有计算机程序。
4.根据权利要求1所述的一种基于上下文感知的小样本玻璃气泡缺陷检测装置,其特征在于:所述缺陷检测模型包括全连接层和分类器。
5.一种基于上下文感知的小样本玻璃气泡缺陷检测方法,其特征在于,包括以下步骤:
获取待检测玻璃气泡缺陷图像;
将所述待检测玻璃图像输入预先训练的特征提取模型,得到与所述待检测玻璃气泡缺陷图像对应的图像特征,其中,所述特征提取模型用于提取待检测玻璃气泡缺陷图像的特征;
将所得到的图像特征输入预先训练的用于小样本的玻璃气泡缺陷检测模型,得到与待检测玻璃图像对应的玻璃气泡缺陷检测结果,其中,玻璃气泡缺陷检测结果用于表征待检测玻璃气泡缺陷图像中是否存在气泡缺陷,用于小样本的玻璃气泡缺陷检测模型用于表征图像特征和玻璃气泡缺陷检测结果之间的对应关系。
6.根据权利要求5所述的一种基于上下文感知的小样本玻璃气泡缺陷检测方法,其特征在于:所述特征提取模型是通过如下第一步训练步骤训练得到的:
获取大量其他类别的玻璃缺陷检测图像集合,其中,每个训练样本包括样本玻璃缺陷图像和用于指示该样本玻璃缺陷图像中的缺陷类别以及缺陷所在位置的标注框的标注信息;
对于所述玻璃缺陷检测图像集合中玻璃缺陷图像,执行以下第一调参步骤:将该玻璃缺陷图像输入初始特征提取模型,得到与该玻璃缺陷图像对应的图像特征;将所得到的图像特征输入初始缺陷检测模型,其中初始缺陷检测模型包括分类器和回归器;基于所得到的检测结果与其对应的标注信息之间的距离,调整所述的初始特征提取模型和所述的初始缺陷检测模型的参数;
将所述的初始特征模型确定为所述的特征提取模型。
7.根据权利要求6所述的一种基于上下文感知的小样本玻璃气泡缺陷检测方法,其特征在于:所述第一调参步骤还包括:
将所得到的玻璃缺陷图像对应的图像特征,分别输入到初始缺陷检测模型中的分类器和回归器中,分别可以得到一个得分向量和多个生成锚框,然后计算得分向量与输入图像类别真值的之间的距离,以及多个生成锚框与输入图像标注框之间的交并比;基于类别之间的距离已经锚框与标注框之间的交并比,调整所述初始特征提取模型、所述初始分类器和所述初始定位器的参数。
8.根据权利要求6所述一种基于上下文感知的小样本玻璃气泡缺陷检测方法,其特征在于:对于所述玻璃缺陷检测图像集合中的玻璃缺陷图像,在执行第一调参步骤之前,所述第一训练步骤还包括:
确定所述初始特征提取模型和初始缺陷检测模型的结构信息,以及初始化初始特征提取模型的模型参数和初始缺陷检测模型的网络参数。
9.根据权利要求6-8任一所述的一种基于上下文感知的小样本玻璃气泡缺陷检测方法,其特征在于:所述的初始缺陷检测模型是通过如下第二训练步骤训练得到的:
获取玻璃气泡缺陷图像训练样本集合,其中,每个训练样本包括样本玻璃气泡缺陷图像和用于指示该样本玻璃缺陷图像中的缺陷类别以及缺陷所在位置的标注框的标注信息;
确定缺陷检测模型的结构信息,初始化缺陷检测模型的模型参数;
对于所述训练样本集合中的训练样本,执行以下第二调参步骤:将该训练样本中的样本玻璃气泡缺陷图像输入特征提取模型,得到与该训练样本对应的图像特征;将所得到的图像特征输入初始缺陷检测模型,得到与所得到的图像特征对应的缺陷检测结果;基于所得到的缺陷检测结果与该训练样本中的标注信息之间的差异,调整初始缺陷检测模型的模型参数;
将所述的缺陷检测模型确定为所述缺陷检测模型。
10.根据权利要求5所述的一种基于上下文感知的小样本玻璃气泡缺陷检测方法,其特征在于:所述特征提取模型为卷积神经网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410387275.9A CN118071732A (zh) | 2024-04-01 | 2024-04-01 | 一种基于上下文感知的小样本玻璃气泡缺陷检测装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410387275.9A CN118071732A (zh) | 2024-04-01 | 2024-04-01 | 一种基于上下文感知的小样本玻璃气泡缺陷检测装置及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118071732A true CN118071732A (zh) | 2024-05-24 |
Family
ID=91105847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410387275.9A Pending CN118071732A (zh) | 2024-04-01 | 2024-04-01 | 一种基于上下文感知的小样本玻璃气泡缺陷检测装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118071732A (zh) |
-
2024
- 2024-04-01 CN CN202410387275.9A patent/CN118071732A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110378222B (zh) | 一种输电线路防震锤目标检测与缺陷识别方法及装置 | |
CN114049356B (zh) | 一种结构表观裂缝检测方法、装置及系统 | |
CN115861462B (zh) | 图像生成模型的训练方法、装置、电子设备及存储介质 | |
CN113487610B (zh) | 疱疹图像识别方法、装置、计算机设备和存储介质 | |
CN112446292B (zh) | 一种2d图像显著目标检测方法及系统 | |
CN115861210B (zh) | 一种基于孪生网络的变电站设备异常检测方法和系统 | |
CN113052295A (zh) | 一种神经网络的训练方法、物体检测方法、装置及设备 | |
CN114332075A (zh) | 基于轻量化深度学习模型的结构缺陷快速识别与分类方法 | |
CN116052097A (zh) | 一种地图要素检测方法、装置、电子设备和存储介质 | |
CN117372983B (zh) | 一种低算力的自动驾驶实时多任务感知方法及装置 | |
CN118097268A (zh) | 一种基于监控场景的长尾目标检测方法 | |
CN116805387B (zh) | 基于知识蒸馏的模型训练方法、质检方法和相关设备 | |
CN113792807A (zh) | 皮肤病分类模型训练方法、系统、介质和电子设备 | |
CN109598712A (zh) | 塑料泡沫餐盒的质量检测方法、装置、服务器及存储介质 | |
CN116580232A (zh) | 一种图像自动标注方法、系统及电子设备 | |
CN116958041A (zh) | 一种产品缺陷检测方法、装置、电子设备和存储介质 | |
CN116123040A (zh) | 一种基于多模态数据融合的风机叶片状态检测方法及系统 | |
CN118071732A (zh) | 一种基于上下文感知的小样本玻璃气泡缺陷检测装置及方法 | |
CN114005017A (zh) | 目标检测方法、装置、电子设备及存储介质 | |
Norelyaqine et al. | Deep learning for building extraction from high-resolution remote sensing images | |
CN118379586B (zh) | 关键点预测模型的训练方法、装置、设备、介质及产品 | |
CN118467778B (zh) | 视频信息摘要生成方法、装置、电子装置和存储介质 | |
Du et al. | Improving the Performance of Human Part Segmentation Based on Swin Transformer | |
CN118379586A (zh) | 关键点预测模型的训练方法、装置、设备、介质及产品 | |
CN118628721A (zh) | 用于对遥感影像进行多尺度目标检测的方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |