CN115035315A - 一种基于注意力机制的瓷砖色差分级检测方法及系统 - Google Patents

一种基于注意力机制的瓷砖色差分级检测方法及系统 Download PDF

Info

Publication number
CN115035315A
CN115035315A CN202210693187.2A CN202210693187A CN115035315A CN 115035315 A CN115035315 A CN 115035315A CN 202210693187 A CN202210693187 A CN 202210693187A CN 115035315 A CN115035315 A CN 115035315A
Authority
CN
China
Prior art keywords
information
module
detection
feature
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210693187.2A
Other languages
English (en)
Other versions
CN115035315B (zh
Inventor
朱文博
王权
罗陆锋
张云志
卢清华
王恺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan University
Original Assignee
Foshan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan University filed Critical Foshan University
Priority to CN202210693187.2A priority Critical patent/CN115035315B/zh
Publication of CN115035315A publication Critical patent/CN115035315A/zh
Application granted granted Critical
Publication of CN115035315B publication Critical patent/CN115035315B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于注意力机制的瓷砖色差分级检测方法及系统,该方法包括:获取待检测图像并将待检测图像输入至目标检测模型;引入改进注意力模块,基于MobileNetv3对待检测图像进行特征提取;基于空间金字塔池化结构对特征信息进行最大池化;基于路径聚合网络对特征信息和池化信息进行处理,基于YOLOv4检测头对特征层进行结果预测,得到检测结果。该系统包括:图像获取模块、特征提取模块、池化模块、输出模块和检测模块。本发明针对弱纹理瓷砖颜色和纹理在一定范围内随机变化的特点,对注意力机制进行改进,并应用于视觉检测技术中。本发明可广泛应用于图像分类检测领域。

Description

一种基于注意力机制的瓷砖色差分级检测方法及系统
技术领域
本发明涉及图像分类检测领域,尤其涉及一种基于注意力机制的瓷砖色差分级检测方法及系统。
背景技术
由于弱纹理瓷砖颜色和纹理分布复杂,导致局部颜色出现失真、特征边缘模糊等情形,因此在弱纹理瓷砖色差分级检测方法中仍以人工检测方法为主,还包括有基于图像处理和机器学习的方法、基于直方图的方法、基于小波的方法等。人工检测方法工作强度大、易受到主观因素影响,且人工劳动成本高。本专利可提供一种有效的自动化弱纹理瓷砖色差分级检测方法,降低人工成本;传统的方法存在稳定性低、计算成本高的局限性,无法有效应用于颜色和纹理复杂的弱纹理瓷砖。本专利所使用的视觉检测技术稳定性强,采用轻量化模型有效降低计算成本;现有方法均未针对弱纹理瓷砖特征提出有效的解决思路。
发明内容
为了解决上述技术问题,本发明的目的是提供一种基于注意力机制的瓷砖色差分级检测方法及系统,针对弱纹理瓷砖颜色和纹理在一定范围内随机变化的特点,对注意力机制进行改进,并应用于视觉检测技术中。
本发明所采用的第一技术方案是:一种基于注意力机制的瓷砖色差分级检测方法,包括以下步骤:
获取待检测图像并将待检测图像输入至目标检测模型;
引入改进注意力模块,基于MobileNetv3对待检测图像进行特征提取,得到特征信息;
基于空间金字塔池化结构对特征信息进行最大池化,得到池化信息;
基于路径聚合网络对特征信息和池化信息进行处理,得到特征层;
基于YOLOv4检测头对特征层进行结果预测,得到检测结果。
进一步,所述目标检测模型是以YOLOv4网络为基础,将引入改进注意力模块的MobileNetv3替换主干提取网络,结合空间金字塔池化结构和路径聚合网络构建得到的。
进一步,所述引入改进注意力模块,基于MobileNetv3对待检测图像进行特征提取,得到特征信息这一步骤,其具体包括:
引入改进注意力模块替换MobileNetv3中的SE模块,得到优化的轻量级网络;
基于改进注意力模块对特征张量进行处理;
沿水平坐标和垂直坐标对通道进行编码并聚合特征,得到感知特征映射;
对位置信息进行交互,结合感知特征映射生成带有通道信息的位置空间注意信息并加权至输入张量,得到特征信息。
进一步,沿水平坐标和垂直坐标对通道进行编码的公式表示如下:
Figure BDA0003701155440000021
Figure BDA0003701155440000022
上式中,
Figure BDA0003701155440000023
表示竖直方向上池化后的特征张量,
Figure BDA0003701155440000024
表示表示水平方向上池化后的特征张量,w表示输入的特征张量的宽,h表示输入的特征张量的高,c表示输入的特征张量的通道数,xc(h,i)、xc(j,w)表示输入的特征张量的权值。
进一步,所述特征信息表示如下:
Figure BDA0003701155440000025
上式中,yc(i,j)表示经过注意力机制加权后的特征张量中的权值,xc(i,j)表示输入的特征张量中的权值,gh(i)表示竖直方向上经过注意力机制提取特征后的特征张量的权值,gw(j)表示水平方向上经过注意力机制提取特征后的特征张量的权值。
进一步,还包括对目标检测模型进行预训练,具体步骤如下:
获取瓷砖数据集并进行标注,得到标注后的数据集;
将标注后的数据集划分为训练集和验证集;
基于训练集对目标检测模型进行训练,根据输出结果和标注对目标检测模型进行参数调整,得到调整后的目标检测模型;
基于验证集对调整后的目标检测进行验证,判断到准确率大于预设阈值,输出训练完成的目标检测模型。
进一步,所述基于YOLOv4检测头对特征层进行结果预测,得到检测结果这一步骤,其具体包括:
基于YOLOv4检测头对特征层进行结果预测,生成先验框;
对先验框进行判断并对先验证进行非极大抑制处理和调整处理,生成预测框,得到检测结果。
本发明所采用的第二技术方案是:一种基于注意力机制的瓷砖色差分级检测系统,包括:
图像获取模块,用于获取待检测图像并将待检测图像输入至目标检测模型;
特征提取模块,用于引入改进注意力模块,基于MobileNetv3对待检测图像进行特征提取,得到特征信息;
池化模块,基于空间金字塔池化结构对特征信息进行最大池化,得到池化信息;
输出模块,基于路径聚合网络对特征信息和池化信息进行处理,得到特征层;
检测模块,基于YOLOv4检测头对特征层进行结果预测,得到检测结果。
本发明方法及系统的有益效果是:本发明通过应用机器学习的检测方法以降低人工成本,进一步使用轻量化模型MobileNetv3能够有效降低计算成本,另外,针对弱纹理瓷砖颜色和纹理在一定范围内随机变化的特点,对注意力机制进行改进,并应用于视觉检测技术中,能够提高检测精度。
附图说明
图1是本发明一种基于注意力机制的瓷砖色差分级检测方法的步骤流程图;
图2是本发明一种基于注意力机制的瓷砖色差分级检测系统的结构框图;
图3是本发明具体实施例改进注意力机制模块的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
如图1所示,本发明提供了一种基于注意力机制的瓷砖色差分级检测方法,该方法包括以下步骤:
S1、获取待检测图像并将待检测图像输入至目标检测模型;
具体地,目标检测模型是以YOLOv4网络为基础,将引入改进注意力模块的MobileNetv3替换主干提取网络,结合空间金字塔池化结构和路径聚合网络构建得到的。YOLOv4属于一阶段检测算法,其原理是先将待测图片分割成不同大小的网格,每个网格负责不同的区域,如果待检测目标的中心落在某个网格中,则由该网格负责检测目标,网络结构主要包括主干提取网络(CSPDarknet53)、空间金字塔池化结构(SPP)、路径聚合网络(PANet)。
S2、引入改进注意力模块,基于MobileNetv3对待检测图像进行特征提取,得到特征信息;
S2.1、引入改进注意力模块替换MobileNetv3中的SE模块,得到优化的轻量级网络;
具体地,YOLO4可以准确地定位到弱纹理瓷砖,但在数据集数量较少时,训练时容易出现过拟合情况,对于最终训练效果有较大影响。因此本专利使用轻量级网络MobileNetv3替换原主干网络CSPDarknet53,在数据集数量较少时可以有效增强模型的训练效果和性能。完整的MobilenetV3网络由多个模块组成。MobileNetv3结合了MobileNetv1的深度可分离卷积、MobileNetv2的Inverted Residuals和Linear Bottleneck、SE模块,利用NAS(神经结构搜索)来搜索网络的配置和参数,在数据量不足的情况下依旧可以较好地获取到特征信息,有效地实现识别目标。
S2.2、基于改进注意力模块对特征张量进行处理;
S2.3、沿水平坐标和垂直坐标对通道进行编码并聚合特征,得到感知特征映射;
S2.4、对位置信息进行交互,结合感知特征映射生成带有通道信息的位置空间注意信息并加权至输入张量,得到特征信息。
本专利利用ECA中的不降维交互策略和快速1D卷积策略对CA进行改进,并提出了CSAB,其结构图如图3所示。在图中可见,主干网络中输出的特征张量作为CSAB的输入,经过CSAB进行加权后可得到突出重点信息的变换张量。
如图3中,CSAB注意块可以看作是一个计算单元,旨在提高移动网络中学习特征的表达能力。它可以取任何中间特征张量F作为输入和输出一个具有增广表示法的变换张量与张量F的大小相同。在通道注意力机制中,通常采用全局池化的方法对空间信息进行全局编码,但将全局空间信息压缩到通道描述符中,难以保存位置信息,而位置信息是视觉任务中获取空间结构的关键。改进后的CSAB保留了CA模块中的位置信息,即将通道注意中所表述的全局池化进行分解成一对1维特征编码操作。具体来说,给定输入X,然后使用池化内核的两个空间范围(H,1)或(1,W)分别沿着水平坐标和垂直坐标对每个通道进行编码。因此,第c个通道在高度h处的输出可以表示为
Figure BDA0003701155440000041
类似地,第c个通道在宽度w处的输出可以写成
Figure BDA0003701155440000042
上述两种转换分别沿着两个空间方向聚合特征,生成一对方向感知特征映射。这两种转换还可以让我们的注意力块捕捉一个空间方向上的长期依赖关系,并在另一个空间方向上保持精确的位置信息,这有助于网络更准确地定位感兴趣的对象。
CSAB未对位置信息进行池化,而是进行了对同一个通道的信息进行信息的交互,让一个通道中信息的邻居参与到这个信息的预测中,即是对位置信息进行信息交互。通过使用快速1维卷积操作的卷积函数F2可以很好地实现位置信息的交互,其在一个通道上的输出为
fi=δ(F1(Zi))
上式中,δ为非线性激活函数,f∈RC×(H+W)是对空间信息进行水平方向和垂直方向编码的中间特征映射。通过快速1维卷积操作进行同个通道的信息交互后,为避免降维后再升维操作,因此采用卷积核中的维度与通道的维度数相同的方法,并输出通道数为1的空间位置信息,获取到具有通道信息的空间注意信息。为了减少模型的复杂性,加入了适当的减少比率(如16)来减少通道数量,仅是进行降维操作可以有效减少模型复杂性,并减少了升维导致的不必要计算,从而产生f∈RC/r×(H+W)的特征映射,最后将信息输入到卷积函数F1中,获取到通道注意的信息和实现位置信息间的信息交互,产生仅有一个维度的位置空间信息,可以写成
g=σ(F1(f))
上式中,σ为sigmoid函数,可以把所得的特征信息分成独立的张量f∈R1×H和f∈R1 ×W,把输出表示成gh和gw,并分别用作空间注意权重,即可得到不同空间方向带有通道信息的位置空间注意信息,加权到输入张量F中,输出可以写成
Figure BDA0003701155440000051
最终,改进后的CSAB不仅仅考虑了有位置信息的空间注意,更考虑到了通道注意,通过卷积操作有效地将通道注意融入到空间注意中,可以更准确地定位到感兴趣的对象的位置,帮助模型更高效地完成弱纹理瓷砖色差分级检测任务。
S3、基于空间金字塔池化结构对特征信息进行最大池化,得到池化信息;
具体地,SPP结构的作用是对特征层进行四个不同尺寸的最大池化,池化核大小分别为1×1、5×5、9×9、13×13,经过SPP处理后可以得到更大的感受野。
S4、基于路径聚合网络对特征信息和池化信息进行处理,得到特征层;
S5、基于YOLOv4检测头对特征层进行结果预测,得到检测结果。
S5.1、基于YOLOv4检测头对特征层进行结果预测,生成先验框;
S5.2、对先验框进行判断并对先验证进行非极大抑制处理和调整处理,生成预测框,得到检测结果。
进一步作为本方法的优选实施例,还包括对目标检测模型进行预训练,具体步骤如下:
获取瓷砖数据集并进行标注,得到标注后的数据集;
将标注后的数据集划分为训练集和验证集;
基于训练集对目标检测模型进行训练,根据输出结果和标注对目标检测模型进行参数调整,得到调整后的目标检测模型;
基于验证集对调整后的目标检测进行验证,判断到准确率大于预设阈值,输出训练完成的目标检测模型。
如图2所示,一基于注意力机制的瓷砖色差分级检测系统,包括:
图像获取模块,用于获取待检测图像并将待检测图像输入至目标检测模型;
特征提取模块,用于引入改进注意力模块,基于MobileNetv3对待检测图像进行特征提取,得到特征信息;
池化模块,基于空间金字塔池化结构对特征信息进行最大池化,得到池化信息;
输出模块,基于路径聚合网络对特征信息和池化信息进行处理,得到特征层;
检测模块,基于YOLOv4检测头对特征层进行结果预测,得到检测结果。
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
一种注意力机制的瓷砖色差分级检测装置:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如上所述一种注意力机制的瓷砖色差分级检测方法。
上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
一种存储介质,其中存储有处理器可执行的指令,其特征在于:所述处理器可执行的指令在由处理器执行时用于实现如上所述一种注意力机制的瓷砖色差分级检测方法。
上述方法实施例中的内容均适用于本存储介质实施例中,本存储介质实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (8)

1.一种基于注意力机制的瓷砖色差分级检测方法,其特征在于,包括以下步骤:
获取待检测图像并将待检测图像输入至目标检测模型;
引入改进注意力模块,基于MobileNetv3对待检测图像进行特征提取,得到特征信息;
基于空间金字塔池化结构对特征信息进行最大池化,得到池化信息;
基于路径聚合网络对特征信息和池化信息进行处理,得到特征层;
基于YOLOv4检测头对特征层进行结果预测,得到检测结果。
2.根据权利要求1所述一种基于注意力机制的瓷砖色差分级检测方法,其特征在于,所述目标检测模型是以YOLOv4网络为基础,将引入改进注意力模块的MobileNetv3替换主干提取网络,结合空间金字塔池化结构和路径聚合网络构建得到的。
3.根据权利要求2所述一种基于注意力机制的瓷砖色差分级检测方法,其特征在于,所述引入改进注意力模块,基于MobileNetv3对待检测图像进行特征提取,得到特征信息这一步骤,其具体包括:
引入改进注意力模块替换MobileNetv3中的SE模块,得到优化的轻量级网络;
基于改进注意力模块对特征张量进行处理;
沿水平坐标和垂直坐标对通道进行编码并聚合特征,得到感知特征映射;
对位置信息进行交互,结合感知特征映射生成带有通道信息的位置空间注意信息并加权至输入张量,得到特征信息。
4.根据权利要求3所述一种基于注意力机制的瓷砖色差分级检测方法,其特征在于,沿水平坐标和垂直坐标对通道进行编码的公式表示如下:
Figure FDA0003701155430000011
Figure FDA0003701155430000012
上式中,
Figure FDA0003701155430000013
表示竖直方向上池化后的特征张量,
Figure FDA0003701155430000014
表示表示水平方向上池化后的特征张量,w表示输入的特征张量的宽,h表示输入的特征张量的高,c表示输入的特征张量的通道数,xc(h,i)、xc(j,w)表示输入的特征张量的权值。
5.根据权利要求4所述一种基于注意力机制的瓷砖色差分级检测方法,其特征在于,所述特征信息表示如下:
Figure FDA0003701155430000015
上式中,yc(i,j)表示经过注意力机制加权后的特征张量中的权值,xc(i,j)表示输入的特征张量中的权值,gh(i)表示竖直方向上经过注意力机制提取特征后的特征张量的权值,gw(j)表示水平方向上经过注意力机制提取特征后的特征张量的权值。
6.根据权利要求1所述一种基于注意力机制的瓷砖色差分级检测方法,其特征在于,还包括对目标检测模型进行预训练,具体步骤如下:
获取瓷砖数据集并进行标注,得到标注后的数据集;
将标注后的数据集划分为训练集和验证集;
基于训练集对目标检测模型进行训练,根据输出结果和标注对目标检测模型进行参数调整,得到调整后的目标检测模型;
基于验证集对调整后的目标检测进行验证,判断到准确率大于预设阈值,输出训练完成的目标检测模型。
7.根据权利要求1所述一种基于注意力机制的瓷砖色差分级检测方法,其特征在于,所述基于YOLOv4检测头对特征层进行结果预测,得到检测结果这一步骤,其具体包括:
基于YOLOv4检测头对特征层进行结果预测,生成先验框;
对先验框进行判断并对先验证进行非极大抑制处理和调整处理,生成预测框,得到检测结果。
8.一种基于注意力机制的瓷砖色差分级检测系统,其特征在于,包括:
图像获取模块,用于获取待检测图像并将待检测图像输入至目标检测模型;
特征提取模块,用于引入改进注意力模块,基于MobileNetv3对待检测图像进行特征提取,得到特征信息;
池化模块,基于空间金字塔池化结构对特征信息进行最大池化,得到池化信息;
输出模块,基于路径聚合网络对特征信息和池化信息进行处理,得到特征层;
检测模块,基于YOLOv4检测头对特征层进行结果预测,得到检测结果。
CN202210693187.2A 2022-06-17 2022-06-17 一种基于注意力机制的瓷砖色差分级检测方法及系统 Active CN115035315B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210693187.2A CN115035315B (zh) 2022-06-17 2022-06-17 一种基于注意力机制的瓷砖色差分级检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210693187.2A CN115035315B (zh) 2022-06-17 2022-06-17 一种基于注意力机制的瓷砖色差分级检测方法及系统

Publications (2)

Publication Number Publication Date
CN115035315A true CN115035315A (zh) 2022-09-09
CN115035315B CN115035315B (zh) 2023-07-07

Family

ID=83125157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210693187.2A Active CN115035315B (zh) 2022-06-17 2022-06-17 一种基于注意力机制的瓷砖色差分级检测方法及系统

Country Status (1)

Country Link
CN (1) CN115035315B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113971783A (zh) * 2021-10-17 2022-01-25 河南工业大学 一种基于yolov5算法的管制刀具检测模型
CN114120019A (zh) * 2021-11-08 2022-03-01 贵州大学 一种轻量化的目标检测方法
CN114612471A (zh) * 2022-05-10 2022-06-10 佛山市阿瑞斯数字设备有限公司 一种复杂纹理瓷砖表面缺陷检测方法
CN114612980A (zh) * 2022-03-11 2022-06-10 长沙理工大学 基于多方位交融注意力的变形人脸检测

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113971783A (zh) * 2021-10-17 2022-01-25 河南工业大学 一种基于yolov5算法的管制刀具检测模型
CN114120019A (zh) * 2021-11-08 2022-03-01 贵州大学 一种轻量化的目标检测方法
CN114612980A (zh) * 2022-03-11 2022-06-10 长沙理工大学 基于多方位交融注意力的变形人脸检测
CN114612471A (zh) * 2022-05-10 2022-06-10 佛山市阿瑞斯数字设备有限公司 一种复杂纹理瓷砖表面缺陷检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王文倩: "基于注意力机制的细粒度图像分类及其应用研究" *

Also Published As

Publication number Publication date
CN115035315B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
CN112052886B (zh) 基于卷积神经网络的人体动作姿态智能估计方法及装置
CN111340738B (zh) 一种基于多尺度渐进融合的图像去雨方法
CN105138973B (zh) 人脸认证的方法和装置
CN112837344B (zh) 一种基于条件对抗生成孪生网络的目标跟踪方法
CN104462494B (zh) 一种基于无监督特征学习的遥感图像检索方法及系统
CN108154133B (zh) 基于非对称联合学习的人脸画像-照片识别方法
CN114972107A (zh) 基于多尺度堆叠式注意力网络的低照度图像增强方法
CN110827312A (zh) 一种基于协同视觉注意力神经网络的学习方法
CN114943893B (zh) 一种土地覆盖分类的特征增强方法
CN112183742A (zh) 基于渐进式量化和Hessian信息的神经网络混合量化方法
CN110503157B (zh) 基于细粒度图像的多任务卷积神经网络的图像隐写分析方法
CN112257727A (zh) 一种基于深度学习自适应可变形卷积的特征图像提取方法
CN110222217B (zh) 一种基于分段加权的鞋印图像检索方法
CN114299305B (zh) 聚合密集和注意力多尺度特征的显著性目标检测算法
CN110135435B (zh) 一种基于广度学习系统的显著性检测方法及装置
CN114897884A (zh) 基于多尺度边缘特征融合的无参考屏幕内容图像质量评估方法
CN114882278A (zh) 一种基于注意力机制和迁移学习的轮胎花纹分类方法和装置
CN113205102B (zh) 一种基于忆阻神经网络的车辆标志识别方法
Wu et al. Fish Target Detection in Underwater Blurred Scenes Based on Improved YOLOv5
CN117152823A (zh) 一种基于动态空洞卷积金字塔注意力的多任务年龄估计方法
CN115953330B (zh) 虚拟场景图像的纹理优化方法、装置、设备和存储介质
CN116434064A (zh) 一种基于SK-UNet深度学习网络的遥感影像大豆种植区域提取方法
CN115861595B (zh) 一种基于深度学习的多尺度域自适应异源图像匹配方法
CN115035315A (zh) 一种基于注意力机制的瓷砖色差分级检测方法及系统
CN112991257B (zh) 基于半监督孪生网络的异质遥感图像变化快速检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant