CN113658180B - 一种基于空间上下文引导的表面缺陷区域分割方法和装置 - Google Patents

一种基于空间上下文引导的表面缺陷区域分割方法和装置 Download PDF

Info

Publication number
CN113658180B
CN113658180B CN202111218023.6A CN202111218023A CN113658180B CN 113658180 B CN113658180 B CN 113658180B CN 202111218023 A CN202111218023 A CN 202111218023A CN 113658180 B CN113658180 B CN 113658180B
Authority
CN
China
Prior art keywords
feature
spatial context
multiplied
target image
scale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111218023.6A
Other languages
English (en)
Other versions
CN113658180A (zh
Inventor
弭宝瞳
梁循
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jushi Intelligent Technology Co ltd
Original Assignee
Beijing Jushi Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jushi Intelligent Technology Co ltd filed Critical Beijing Jushi Intelligent Technology Co ltd
Priority to CN202111218023.6A priority Critical patent/CN113658180B/zh
Publication of CN113658180A publication Critical patent/CN113658180A/zh
Application granted granted Critical
Publication of CN113658180B publication Critical patent/CN113658180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Abstract

本发明涉及一种基于空间上下文引导的表面缺陷区域分割方法和装置,该方法包括:采集目标图像,并利用编码器从目标图像中提取第一特征;利用预设的空间上下文关系建模模块从第一特征中提取空间上下文关系的特征,并利用空间上下文关系的特征生成空间上下文引导的特征;基于空间上下文引导的特征,利用解码器预测目标图像中的缺陷区域。本申请提供的技术方案,可以有效地提取空间上下文信息,并利用空间上下文信息预测目标图像中的缺陷区域,从而得到更高精确度的缺陷区域分割结果。

Description

一种基于空间上下文引导的表面缺陷区域分割方法和装置
技术领域
本发明属于缺陷检测技术领域,具体涉及一种基于空间上下文引导的表面缺陷区域分割方法和装置。
背景技术
当前工业应用环境下,表面缺陷区域分割多采用基于深度神经网络的深度学习方法。当前代表性方法采用类似U-Net的编码器-解码器网络结构,编码器提取多层级的不同类型特征,解码器融合多层级的多尺度特征,从而定位并分割出缺陷区域。
由于当前工业应用场景下,背景噪声干扰严重,缺陷区域形状等外观特征多样,造成待测试图像的缺陷类内差异大且类间差异小的问题。当前代表性方法采用的传统卷积模块只能提取局部感受野内信息,无法建模全局像素之间空间位置、语义类别等关系,使得现有方法无法利用全局的空间位置、语义类别关系,导致难以获得高精度的缺陷区域分割结果。
发明内容
有鉴于此,本发明的目的在于克服现有技术的不足,提供一种基于空间上下文引导的表面缺陷区域分割方法和装置,以解决现有技术中无法获得高精度的缺陷区域分割结果的问题。
根据本申请实施例的第一方面,提供一种基于空间上下文引导的表面缺陷区域分割方法,所述方法包括:
采集目标图像,并利用编码器从所述目标图像中提取第一特征;
利用预设的空间上下文关系建模模块从所述第一特征中提取空间上下文关系的特征,并利用所述空间上下文关系的特征生成空间上下文引导的特征;
基于所述空间上下文引导的特征,利用解码器预测所述目标图像中的缺陷区域。
进一步的,所述利用编码器从所述目标图像中提取第一特征,包括:
利用编码器对所述目标图像进行第一预设层级的卷积和下采样,得到所述第一特征;
其中,所述第一特征的尺度为H×W×C,H为高,W为宽,C为通道数。
进一步的,所述利用预设的空间上下文关系建模模块从所述第一特征中提取空间上下文关系的特征,包括:
通过通道注意力机制对每个通道的第一特征分配权重,得到第二特征;
利用
Figure DEST_PATH_IMAGE001
的卷积核和C的卷积核分别对所述第二特征进行特征变换,得到第三特征和第四特征,其中,所述第三特征的尺度为H×W×(k×k),所述第四特征的尺度为H×W×C,H为高,W为宽,C为通道数,k为正整数;
通过Reshape方法将所述第三特征和第四特征分别从三维特征变换成二维特征,得到第五特征和第六特征,其中,所述第五特征的尺度为(k×k)×(H×W),所述第六特征的尺度为(H×W)×C;
将所述第五特征和第六特征以矩阵方式相乘,得到第七特征,所述第七特征为所述空间上下文关系的特征,其中,所述第七特征的尺度为(k×k)×C。
进一步的,所述利用所述空间上下文关系的特征生成空间上下文引导的特征,包括:
通过Reshape方法将将所述空间上下文关系的特征从二维特征变换成三维特征,得到空间上下文可感知的卷积核,其中,所述空间上下文可感知的卷积核的尺度为k×k×C;
将所述空间上下文可感知的卷积核进行深度可分离卷积处理,沿通道维度,作用于所述第一特征,得到权重核,其中,所述权重核的尺度为H×W×C;
令所述权重核与所述第一特征进行Element-wise乘积,得到所述空间上下文引导的特征,其中所述空间上下文引导的特征的尺度为H×W×C。
进一步的,所述基于所述空间上下文引导的特征,利用解码器预测所述目标图像中的缺陷区域,包括:
所述解码器对所述空间上下文引导的特征进行第二预设层级的卷积和上采样,得到预测的所述目标图像中的缺陷区域。
进一步的,所述方法还包括:
训练所述解码器,以使所述解码器预测所述目标图像中的缺陷区域。
进一步的,所述训练所述解码器,包括:
利用历史的空间上下文引导的特征和历史的目标图像中的缺陷区域构建训练样本集;
将所述训练样本集分为训练集和验证集;
利用所述训练集对所述编码器进行训练,直至当利用验证集对所述编码器进行验证时,验证结果的准确率大于等于准确率阈值,训练结束,得到训练后的编码器。
根据本申请实施例的第二方面,提供一种基于空间上下文引导的表面缺陷区域分割装置,所述装置包括:
采集模块,用于采集目标图像,并利用编码器从所述目标图像中提取第一特征;
生成模块,用于利用预设的空间上下文关系建模模块从所述第一特征中提取空间上下文关系的特征,并利用所述空间上下文关系的特征生成空间上下文引导的特征;
预测模块,用于基于所述空间上下文引导的特征,利用解码器预测所述目标图像中的缺陷区域。
进一步的,所述采集模块,具体用于:
利用编码器对所述目标图像进行第一预设层级的卷积和下采样,得到所述第一特征;
其中,所述第一特征的尺度为H×W×C,H为高,W为宽,C为通道数。
进一步的,所述生成模块,具体用于:
通过通道注意力机制对每个通道的第一特征分配权重,得到第二特征;
利用
Figure 595968DEST_PATH_IMAGE001
的卷积核和C的卷积核分别对所述第二特征进行特征变换,得到第三特征和第四特征,其中,所述第三特征的尺度为H×W×(k×k),所述第四特征的尺度为H×W×C,H为高,W为宽,C为通道数,k为正整数;
通过Reshape方法将所述第三特征和第四特征分别从三维特征变换成二维特征,得到第五特征和第六特征,其中,所述第五特征的尺度为(k×k)×(H×W),所述第六特征的尺度为(H×W)×C;
将所述第五特征和第六特征以矩阵方式相乘,得到第七特征,所述第七特征为所述空间上下文关系的特征,其中,所述第七特征的尺度为(k×k)×C。
进一步的,所述生成模块,还具体用于:
通过Reshape方法将将所述空间上下文关系的特征从二维特征变换成三维特征,得到空间上下文可感知的卷积核,其中,所述空间上下文可感知的卷积核的尺度为k×k×C;
将所述空间上下文可感知的卷积核进行深度可分离卷积处理,沿通道维度,作用于所述第一特征,得到权重核,其中,所述权重核的尺度为H×W×C;
令所述权重核与所述第一特征进行Element-wise乘积,得到所述空间上下文引导的特征,其中所述空间上下文引导的特征的尺度为H×W×C。
进一步的,所述预测模块,具体用于:
所述解码器对所述空间上下文引导的特征进行第二预设层级的卷积和上采样,得到预测的所述目标图像中的缺陷区域。
进一步的,所述装置还包括:
训练模块,用于训练所述解码器,以使所述解码器预测所述目标图像中的缺陷区域。
进一步的,所述训练模块,具体用于:
利用历史的空间上下文引导的特征和历史的目标图像中的缺陷区域构建训练样本集;
将所述训练样本集分为训练集和验证集;
利用所述训练集对所述编码器进行训练,直至当利用验证集对所述编码器进行验证时,验证结果的准确率大于等于准确率阈值,训练结束,得到训练后的编码器。
本发明采用以上技术方案,能够达到的有益效果包括:通过采集目标图像,并利用编码器从目标图像中提取第一特征,利用预设的空间上下文关系建模模块从第一特征中提取空间上下文关系的特征,并利用空间上下文关系的特征生成空间上下文引导的特征,基于空间上下文引导的特征,利用解码器预测目标图像中的缺陷区域,可以有效地提取空间上下文信息,并利用空间上下文信息预测目标图像中的缺陷区域,从而得到更高精确度的缺陷区域分割结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种基于空间上下文引导的表面缺陷区域分割方法的流程图;
图2是根据一示例性实施例示出的一种基于空间上下文引导的表面缺陷区域分割方法中获取空间上下文引导的特征的示意图;
图3是根据一示例性实施例示出的是一种基于空间上下文引导的表面缺陷区域分割装置的结构框图;
图2中,CAM-通道注意力机制。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
图1是根据一示例性实施例示出的一种基于空间上下文引导的表面缺陷区域分割方法的流程图,如图1所示,该方法可以但不限于用于终端中,包括以下步骤:
步骤101:采集目标图像,并利用编码器从目标图像中提取第一特征;
步骤102:利用预设的空间上下文关系建模模块从第一特征中提取空间上下文关系的特征,并利用空间上下文关系的特征生成空间上下文引导的特征;
步骤103:基于空间上下文引导的特征,利用解码器预测目标图像中的缺陷区域。
可以理解的是,本发明实施例采集的目标图像,一般为工业背景下,利用金属材料制成的工件的表面图像,例如,钢板的表面图像等,从而可以用本实施例提供的方法检测出钢板表面的缺陷区域。
需要说明的是,本发明实施例涉及的编码器-解码器,可以但不限于为U-Net的编码器-解码器。
本发明实施例提供的一种基于空间上下文引导的表面缺陷区域分割方法,通过采集目标图像,并利用编码器从目标图像中提取第一特征,利用预设的空间上下文关系建模模块从第一特征中提取空间上下文关系的特征,并利用空间上下文关系的特征生成空间上下文引导的特征,基于空间上下文引导的特征,利用解码器预测目标图像中的缺陷区域,可以有效地提取空间上下文信息,并利用空间上下文信息预测目标图像中的缺陷区域,从而得到更高精确度的缺陷区域分割结果。
进一步的,步骤101中利用编码器从目标图像中提取第一特征,包括:
利用编码器对目标图像进行第一预设层级的卷积和下采样,得到第一特征;
其中,第一特征的尺度为H×W×C,H为高,W为宽,C为通道数。
需要说明的是,本发明实施例对“第一预设层级”不做限定,可以由本领域技术人员根据实验数据等进行选择,一些实施例中,第一预设层级可以但不限于为5层或50层等,例如,利用编码器对目标图像进行50层级的卷积。
可以理解的是,利用编码器对目标图像进行第一预设层级的卷积和下采样的本质是,要对目标图像进行逐层级的特征变换,从而在编码器的最深层输出第一特征。
需要说明的是,本发明实施例中涉及的编码器内置有深度神经网络,本发明实施例涉及的“利用编码器对目标图像进行第一预设层级的卷积和下采样,得到第一特征”方式,是本领域技术人员所熟知的,因此,其具体实现方式不做过多描述。
进一步的,如图2所示,步骤102中利用预设的空间上下文关系建模模块从第一特征中提取空间上下文关系的特征,包括:
步骤1021:通过通道注意力机制对每个通道的第一特征分配权重,得到第二特征,有助于在通道维度关注更有效的特征;
可以理解的是,通道注意力机制的作用是分配每个通道不同的权重,让网络关注重要的特征,抑制不重要的特征。基本思想就是,让通道注意力机制中内置的神经网络自动判断哪个通道重要或不重要,然后分配合适的权重。一些实施例中,也不仅限于特征加权,也可以进行特征的软阈值化,例如,如果特征不重要,可以把阈值τ训练得很大,那么所有输出特征就变成了0。
步骤1022:利用
Figure 551417DEST_PATH_IMAGE001
的卷积核和C的卷积核分别对第二特征进行特征变换,得到第三特征和第四特征,其中,第三特征的尺度为H×W×(k×k),第四特征的尺度为H×W×C,H为高,W为宽,C为通道数,k为正整数;
需要说明的是,本发明实施例对“k”不做限定,可以由本领域技术人员根据实验数据等进行选择,一些实施例中,
Figure 874951DEST_PATH_IMAGE003
的卷积核可以但不限于为3×3的卷积核或5×5的卷积核。
步骤1023:通过Reshape方法将第三特征和第四特征分别从三维特征变换成二维特征,得到第五特征和第六特征,其中,第五特征的尺度为(k×k)×(H×W),第六特征的尺度为(H×W)×C;
步骤1024:将第五特征和第六特征以矩阵方式相乘,得到第七特征,第七特征为空间上下文关系的特征,其中,第七特征的尺度为(k×k)×C。
需要说明的是,通过将第五特征和第六特征以矩阵方式相乘,得到空间上下文关系的特征后,从而将特征的每一个位置,能和其他的每一个位置“相互作用”,从而显示特征中任意像素之间的关系,有效地提取空间上下文关系。所以,空间上下文关系即目标图像中像素和像素之间的关系。
进一步的,如图2所示,步骤102中利用空间上下文关系的特征生成空间上下文引导的特征,包括:
步骤1025:通过Reshape方法将将空间上下文关系的特征从二维特征变换成三维特征,得到空间上下文可感知的卷积核,其中,空间上下文可感知的卷积核的尺度为k×k×C;
步骤1026:将空间上下文可感知的卷积核进行深度可分离卷积处理,沿通道维度,作用于第一特征,得到权重核,其中,权重核的尺度为H×W×C;
步骤1027:令权重核与第一特征进行Element-wise乘积,得到空间上下文引导的特征,其中空间上下文引导的特征的尺度为H×W×C;
可以理解的是,Element-wise乘积即逐像素乘积,可以强化每个像素之间的关系。
需要说明的是,本发明实施例中涉及的“利用Reshape方法对特征的维度进行变换”、“深度可分离卷积处理”和“Element-wise乘积”的方式,是本领域技术人员所熟知的,因此,其具体实现方式不做过多描述。
可以理解的是,通过上述方法可以显示目标图像中任意像素间的空间位置、语义类别之间的关系,可以有效地提取空间上下文信息。
进一步的,步骤103,包括:
解码器对空间上下文引导的特征进行第二预设层级的卷积和上采样,得到预测的目标图像中的缺陷区域。
需要说明的是,本发明实施例对“第二预设层级”不做限定,可以由本领域技术人员根据实验数据等进行选择,一些实施例中,第二预设层级可以但不限于为5层或50层等,例如,利用解码器对空间上下文引导的特征进行50层级的卷积。
可以理解的是,解码器对空间上下文引导的特征进行第二预设层级的卷积和上采样时,融合编码器的多层级、多尺度特征,从而得到和第一特征同样尺度的融合后特征,然后便可以对缺陷区域进行更精细化的预测。
需要说明的是,本发明实施例中涉及的“解码器”的方式,是本领域技术人员所熟知的,因此,其具体实现方式不做过多描述。
例如,步骤a:采集钢板表面的图像为目标图像,利用编码器对目标图像进行第一预设层级的卷积和下采样,得到第一特征;
步骤 b:通过通道注意力机制对每个通道的第一特征分配权重,得到第二特征;
步骤c:利用3×3的卷积核和C的卷积核分别对第二特征进行特征变换,得到第三特征和第四特征,其中,第三特征的尺度为H×W×(3×3),第四特征的尺度为H×W×C,H为高,W为宽,C为通道数;
步骤d:通过Reshape方法将第三特征和第四特征分别从三维特征变换成二维特征,得到第五特征和第六特征,其中,第五特征的尺度为(3×3)×(H×W),第六特征的尺度为(H×W)×C;
步骤e:将第五特征和第六特征以矩阵方式相乘,得到第七特征,第七特征为空间上下文关系的特征,其中,第七特征的尺度为(3×3)×C。
步骤f:通过Reshape方法将将空间上下文关系的特征从二维特征变换成三维特征,得到空间上下文可感知的卷积核,其中,空间上下文可感知的卷积核的尺度为3×3×C;
步骤g:将空间上下文可感知的卷积核进行深度可分离卷积处理,沿通道维度,作用于第一特征,得到权重核,其中,权重核的尺度为H×W×C;
步骤h:令权重核与第一特征进行Element-wise乘积,得到空间上下文引导的特征,其中空间上下文引导的特征的尺度为H×W×C;
步骤i:解码器对空间上下文引导的特征进行第二预设层级的卷积和上采样,并融合编码器的多层级、多尺度特征,得到和第一特征同样尺度的融合后特征,利用该融合后的特征得到预测的目标图像中的缺陷区域。
进一步的,该方法还包括:
训练解码器,以使解码器预测目标图像中的缺陷区域。
具体的,训练解码器,包括:
利用历史的空间上下文引导的特征和历史的目标图像中的缺陷区域构建训练样本集;
将训练样本集分为训练集和验证集;
利用训练集对编码器进行训练,直至当利用验证集对编码器进行验证时,验证结果的准确率大于等于准确率阈值,训练结束,得到训练后的编码器。
本发明实施例提供的一种基于空间上下文引导的表面缺陷区域分割方法,通过采集目标图像,并利用编码器从目标图像中提取第一特征,利用预设的空间上下文关系建模模块从第一特征中提取空间上下文关系的特征,并利用空间上下文关系的特征生成空间上下文引导的特征,基于空间上下文引导的特征,利用解码器预测目标图像中的缺陷区域,可以有效地提取空间上下文信息,并利用空间上下文信息预测目标图像中的缺陷区域,从而得到更高精确度的缺陷区域分割结果。
为配合实现上述的一种基于空间上下文引导的表面缺陷区域分割方法,本发明实施例提供一种基于空间上下文引导的表面缺陷区域分割装置,参照图3,该装置包括:
采集模块,用于采集目标图像,并利用编码器从目标图像中提取第一特征;
生成模块,用于利用预设的空间上下文关系建模模块从第一特征中提取空间上下文关系的特征,并利用空间上下文关系的特征生成空间上下文引导的特征;
预测模块,用于基于空间上下文引导的特征,利用解码器预测目标图像中的缺陷区域。
进一步的,采集模块,具体用于:
利用编码器对目标图像进行第一预设层级的卷积和下采样,得到第一特征;
其中,第一特征的尺度为H×W×C,H为高,W为宽,C为通道数。
进一步的,生成模块,具体用于:
通过通道注意力机制对每个通道的第一特征分配权重,得到第二特征;
利用
Figure 166999DEST_PATH_IMAGE004
的卷积核和C的卷积核分别对第二特征进行特征变换,得到第三特征和第四特征,其中,第三特征的尺度为H×W×(k×k),第四特征的尺度为H×W×C,H为高,W为宽,C为通道数,k为正整数;
通过Reshape方法将第三特征和第四特征分别从三维特征变换成二维特征,得到第五特征和第六特征,其中,第五特征的尺度为(k×k)×(H×W),第六特征的尺度为(H×W)×C;
将第五特征和第六特征以矩阵方式相乘,得到第七特征,第七特征为空间上下文关系的特征,其中,第七特征的尺度为(k×k)×C。
进一步的,生成模块,还具体用于:
通过Reshape方法将将空间上下文关系的特征从二维特征变换成三维特征,得到空间上下文可感知的卷积核,其中,空间上下文可感知的卷积核的尺度为k×k×C;
将空间上下文可感知的卷积核进行深度可分离卷积处理,沿通道维度,作用于第一特征,得到权重核,其中,权重核的尺度为H×W×C;
令权重核与第一特征进行Element-wise乘积,得到空间上下文引导的特征,其中空间上下文引导的特征的尺度为H×W×C。
进一步的,预测模块,具体用于:
解码器对空间上下文引导的特征进行第二预设层级的卷积和上采样,得到预测的目标图像中的缺陷区域。
进一步的,该装置还包括:
训练模块,用于训练解码器,以使解码器预测目标图像中的缺陷区域。
进一步的,训练模块,具体用于:
利用历史的空间上下文引导的特征和历史的目标图像中的缺陷区域构建训练样本集;
将训练样本集分为训练集和验证集;
利用训练集对编码器进行训练,直至当利用验证集对编码器进行验证时,验证结果的准确率大于等于准确率阈值,训练结束,得到训练后的编码器。
本发明实施例提供的一种基于空间上下文引导的表面缺陷区域分割装置,通过采集模块采集目标图像,并利用编码器从目标图像中提取第一特征,生成模块利用预设的空间上下文关系建模模块从第一特征中提取空间上下文关系的特征,并利用空间上下文关系的特征生成空间上下文引导的特征,预测模块基于空间上下文引导的特征,利用解码器预测目标图像中的缺陷区域,可以有效地提取空间上下文信息,并利用空间上下文信息预测目标图像中的缺陷区域,从而得到更高精确度的缺陷区域分割结果。
可以理解的是,上述提供的装置实施例与上述的方法实施例对应,相应的具体内容可以相互参考,在此不再赘述。
本发明实施例还提供一种基于空间上下文引导的表面缺陷区域分割设备,包括:
存储器,其上存储有可执行程序;
处理器,用于执行所述存储器中的可执行程序,以实现上述实施例提供的一种基于空间上下文引导的表面缺陷区域分割方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令方法的制造品,该指令方法实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (7)

1.一种基于空间上下文引导的表面缺陷区域分割方法,其特征在于,所述方法包括:
采集目标图像,并利用编码器从所述目标图像中提取第一特征;
利用预设的空间上下文关系建模模块从所述第一特征中提取空间上下文关系的特征,并利用所述空间上下文关系的特征生成空间上下文引导的特征;
基于所述空间上下文引导的特征,利用解码器预测所述目标图像中的缺陷区域;
所述利用预设的空间上下文关系建模模块从所述第一特征中提取空间上下文关系的特征,包括:
通过通道注意力机制对每个通道的第一特征分配权重,得到第二特征;
利用
Figure 248998DEST_PATH_IMAGE001
的卷积核和C的卷积核分别对所述第二特征进行特征变换,得到第三特征和第四特征,其中,所述第三特征的尺度为H×W×(k×k),所述第四特征的尺度为H×W×C,H为高,W为宽,C为通道数,k为正整数;
通过Reshape方法将所述第三特征和第四特征分别从三维特征变换成二维特征,得到第五特征和第六特征,其中,所述第五特征的尺度为(k×k)×(H×W),所述第六特征的尺度为(H×W)×C;
将所述第五特征和第六特征以矩阵方式相乘,得到第七特征,所述第七特征为所述空间上下文关系的特征,其中,所述第七特征的尺度为(k×k)×C。
2.根据权利要求1所述的方法,其特征在于,所述利用编码器从所述目标图像中提取第一特征,包括:
利用编码器对所述目标图像进行第一预设层级的卷积和下采样,得到所述第一特征;
其中,所述第一特征的尺度为H×W×C,H为高,W为宽,C为通道数。
3.根据权利要求1所述的方法,其特征在于,所述利用所述空间上下文关系的特征生成空间上下文引导的特征,包括:
通过Reshape方法将所述空间上下文关系的特征从二维特征变换成三维特征,得到空间上下文可感知的卷积核,其中,所述空间上下文可感知的卷积核的尺度为k×k×C;
将所述空间上下文可感知的卷积核进行深度可分离卷积处理,沿通道维度,作用于所述第一特征,得到权重核,其中,所述权重核的尺度为H×W×C;
令所述权重核与所述第一特征进行Element-wise乘积,得到所述空间上下文引导的特征,其中所述空间上下文引导的特征的尺度为H×W×C。
4.根据权利要求1所述的方法,其特征在于,所述基于所述空间上下文引导的特征,利用解码器预测所述目标图像中的缺陷区域,包括:
所述解码器对所述空间上下文引导的特征进行第二预设层级的卷积和上采样,得到预测的所述目标图像中的缺陷区域。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
训练所述解码器,以使所述解码器预测所述目标图像中的缺陷区域。
6.根据权利要求5所述的方法,其特征在于,所述训练所述解码器,包括:
利用历史的空间上下文引导的特征和历史的目标图像中的缺陷区域构建训练样本集;
将所述训练样本集分为训练集和验证集;
利用所述训练集对所述编码器进行训练,直至当利用验证集对所述编码器进行验证时,验证结果的准确率大于等于准确率阈值,训练结束,得到训练后的编码器。
7.一种基于空间上下文引导的表面缺陷区域分割装置,其特征在于,所述装置包括:
采集模块,用于采集目标图像,并利用编码器从所述目标图像中提取第一特征;
生成模块,用于利用预设的空间上下文关系建模模块从所述第一特征中提取空间上下文关系的特征,并利用所述空间上下文关系的特征生成空间上下文引导的特征;
预测模块,用于基于所述空间上下文引导的特征,利用解码器预测所述目标图像中的缺陷区域;
所述生成模块,具体用于:
通过通道注意力机制对每个通道的第一特征分配权重,得到第二特征;
利用
Figure 706524DEST_PATH_IMAGE001
的卷积核和C的卷积核分别对所述第二特征进行特征变换,得到第三特征和第四特征,其中,所述第三特征的尺度为H×W×(k×k),所述第四特征的尺度为H×W×C,H为高,W为宽,C为通道数,k为正整数;
通过Reshape方法将所述第三特征和第四特征分别从三维特征变换成二维特征,得到第五特征和第六特征,其中,所述第五特征的尺度为(k×k)×(H×W),所述第六特征的尺度为(H×W)×C;
将所述第五特征和第六特征以矩阵方式相乘,得到第七特征,所述第七特征为所述空间上下文关系的特征,其中,所述第七特征的尺度为(k×k)×C。
CN202111218023.6A 2021-10-20 2021-10-20 一种基于空间上下文引导的表面缺陷区域分割方法和装置 Active CN113658180B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111218023.6A CN113658180B (zh) 2021-10-20 2021-10-20 一种基于空间上下文引导的表面缺陷区域分割方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111218023.6A CN113658180B (zh) 2021-10-20 2021-10-20 一种基于空间上下文引导的表面缺陷区域分割方法和装置

Publications (2)

Publication Number Publication Date
CN113658180A CN113658180A (zh) 2021-11-16
CN113658180B true CN113658180B (zh) 2022-03-04

Family

ID=78494693

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111218023.6A Active CN113658180B (zh) 2021-10-20 2021-10-20 一种基于空间上下文引导的表面缺陷区域分割方法和装置

Country Status (1)

Country Link
CN (1) CN113658180B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114419078B (zh) * 2022-04-01 2022-06-24 北京矩视智能科技有限公司 基于卷积神经网络的表面缺陷区域分割方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109242033B (zh) * 2018-09-21 2021-08-20 长鑫存储技术有限公司 晶片缺陷模式分类方法及装置、存储介质、电子设备
CN109598728B (zh) * 2018-11-30 2019-12-27 腾讯科技(深圳)有限公司 图像分割方法、装置、诊断系统及存储介质
CN110689083B (zh) * 2019-09-30 2022-04-12 苏州大学 一种上下文金字塔融合网络及图像分割方法
CN111179229B (zh) * 2019-12-17 2023-10-20 中信重工机械股份有限公司 一种基于深度学习的工业ct缺陷检测方法
CN111626300B (zh) * 2020-05-07 2022-08-26 南京邮电大学 基于上下文感知的图像语义分割模型的图像分割方法及建模方法
CN112132784A (zh) * 2020-08-22 2020-12-25 安徽大学 一种基于小样本深度卷积神经网络用于工业磁瓦缺陷图像分类和分割的方法
CN113129288A (zh) * 2021-04-22 2021-07-16 安徽大学 一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置

Also Published As

Publication number Publication date
CN113658180A (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
Albahli et al. Melanoma lesion detection and segmentation using YOLOv4-DarkNet and active contour
CN111047551B (zh) 一种基于U-net改进算法的遥感影像变化检测方法及系统
CN108416266B (zh) 一种利用光流提取运动目标的视频行为快速识别方法
CN109815865B (zh) 一种基于虚拟水尺的水位识别方法及系统
CN112784685B (zh) 基于多尺度引导注意力机制网络的人群计数方法及系统
CN108108751A (zh) 一种基于卷积多特征和深度随机森林的场景识别方法
CN104866868A (zh) 基于深度神经网络的金属币识别方法和装置
AU2020272936B2 (en) Methods and systems for crack detection using a fully convolutional network
CN109300151A (zh) 图像处理方法和装置、电子设备
CN106023148A (zh) 一种序列聚焦观测模式下恒星像点位置提取方法
Pirzada et al. Analysis of edge detection algorithms for feature extraction in satellite images
CN113658180B (zh) 一种基于空间上下文引导的表面缺陷区域分割方法和装置
CN115410081A (zh) 一种多尺度聚合的云和云阴影辨识方法、系统、设备及存储介质
CN116805387B (zh) 基于知识蒸馏的模型训练方法、质检方法和相关设备
Asano Texture analysis using morphological pattern spectrum and optimization of structuring elements
CN116310832A (zh) 遥感图像处理方法、装置、设备、介质及产品
CN116403062A (zh) 一种点云目标检测方法、系统、设备及介质
CN116612272A (zh) 一种图像处理智能数字化的检测系统及其检测方法
CN114511911A (zh) 一种人脸识别方法、装置以及设备
CN112560719B (zh) 基于多尺度卷积-多核池化的高分辨率影像水体提取方法
CN114820755A (zh) 一种深度图估计方法及系统
CN112116561B (zh) 基于图像处理融合网络权值的电网传输线检测方法及装置
CN114972882A (zh) 基于多注意力机制的磨损表面损伤深度估计方法及系统
CN114240804A (zh) 一种抠图数据生成方法、装置、计算机设备及存储介质
CN111027670B (zh) 特征图处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant