CN113129288A - 一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置 - Google Patents

一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置 Download PDF

Info

Publication number
CN113129288A
CN113129288A CN202110437743.5A CN202110437743A CN113129288A CN 113129288 A CN113129288 A CN 113129288A CN 202110437743 A CN202110437743 A CN 202110437743A CN 113129288 A CN113129288 A CN 113129288A
Authority
CN
China
Prior art keywords
module
conveyor
defect
feature map
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110437743.5A
Other languages
English (en)
Inventor
陈鹏
张汉
张德祥
章军
王兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Original Assignee
Anhui University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University filed Critical Anhui University
Priority to CN202110437743.5A priority Critical patent/CN113129288A/zh
Publication of CN113129288A publication Critical patent/CN113129288A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65GTRANSPORT OR STORAGE DEVICES, e.g. CONVEYORS FOR LOADING OR TIPPING, SHOP CONVEYOR SYSTEMS OR PNEUMATIC TUBE CONVEYORS
    • B65G37/00Combinations of mechanical conveyors of the same kind, or of different kinds, of interest apart from their application in particular machines or use in particular manufacturing processes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Image Analysis (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)

Abstract

本发明涉及工业缺陷检测技术领域,具体是一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置,所述第一输送机的一侧设置有图像采集模块、且第一输送机的出料端与图像采集模块之间通过第二滑板相连。本发明采用图像语义分割技术对药片表面缺陷检测进行检测,能通过预训练好的深度学习模型分割出污点、缺损缺陷区域并随之统计缺陷区域像素个数,依据设定的阈值实现药片的准确分类,自动处理装置能够将待检药片传输至检测区域,经相机拍摄图像后根据实时检测模块的分类结果对药片进行分类处理,该装置能够实现药片的多角度、实时、自动化检测,提高了工作效率,降低了成本。

Description

一种基于深度学习图像语义分割的药片表面缺陷检测方法及 其自动化处理装置
技术领域
本发明涉及工业缺陷检测技术领域,具体是一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置。
背景技术
药片在生产过程中常伴有表面缺损和污点情况,不仅影响出厂质量,对病人服用的药量和安全也会产生消极影响。因此,生产后对其进行缺陷检测尤为必要。目前,工厂流水线常用两种检测方法。一种是人工检测法,人工挑选由于受工人注意力和主观判断等因素很容易出现漏检、误检等现象;此外,药片检测是种高度重复性工作,人工检测法也会造成成本高、效率低等缺点。另一种是基于模式识别的传统机器视觉方法,机器视觉技术通过提取药片的形状、颜色等特征判断药片是否合格。与人工检测法相比,机器视觉检测不受工人自身因素影响,在检测精度上有一定的提升,并且能够实现自动化生产,但机器视觉检测方法需要根据药片的缺陷类型设计不同的算法,因而检测过程复杂,并且此方法因很难对药片进行全面检测而出现漏检现象。
随着深度学习的快速发展,基于卷积神经网络的检测技术在缺陷检测领域受到了广泛关注。本文提出了一种基于图像语义分割的药片表面缺陷检测方法及其自动化处理装置实现药片的实时、全方位且高精度检测。
发明内容
本发明的目的在于提供一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于深度学习图像语义分割的药片自动化处理装置,包括第一输送机,所述第一输送机的一侧设置有图像采集模块、且第一输送机的出料端与图像采集模块之间通过第二滑板相连,所述图像采集模块的另一侧设置有第二输送机,且图像采集模块的出料端通过第一滑板与第二输送机的起始端相连,所述图像采集模块与控制系统电性相连,所述第二输送机的一端设置有自动包装机,且第二输送机的前侧设置有回收处理箱,所述第二输送机的后侧对应回收处理箱的位置处安装有导向机构;
所述图像采集模块包括与地面相固定的安装板,所述安装板的前侧固定有两端分别连接第一滑板和第二滑板的支撑板,且安装板的前侧位于支撑板的上下两侧处错序分布有两个挡光板,所述安装板的前侧对应两个所述挡光板的位置处均安装有相机,所述相机的检测端安装有光源,所述支撑板的上下侧对应挡光板的位置处均安装有光电开关。
作为本发明更进一步的方案:所述导向机构包括安装于第二输送机一侧的伺服电机,所述伺服电机的传动端固定有导向板,所述导向板的下表面与第二输送机的上表面贴合。
作为本发明更进一步的方案:所述第二滑板与第一滑板和水平角度均呈30°夹角。
作为本发明更进一步的方案:所述控制系统包括缺陷分割模块和阈值分类模块,所述缺陷分割模块利用语义分割技术对相机拍摄的药片图像进行像素分类,其包含主干网络模块、局部注意力模块、全局注意力模块以及数据相关上采样模块,所述阈值分类模块是对缺陷分割模块分割的缺陷区域进行像素统计,根据设定的阈值进行分类,像素个数大于设定的阈值时视为有缺陷产品,反之则认为是合格产品。
作为本发明更进一步的方案:所述主干网络模块以修改的ResNet-50作为主干网络,为了保留更多的细节信息同时减少计算量,只使用残差网络的前三个分块,并将第三个分块的步长设置为1;
所述局部注意力模块是一种反对称金字塔结构,分编码、解码两个阶段,编码阶段下采样局部特征图,并在相应的下采样之后采用相同尺寸的卷积核进一步特征提取,解码阶段在上采样时对称的与下采样相同尺寸的特征图进行融合从而实现多尺寸的特征融合;
所述全局注意力模块捕获具有像素依赖关系的全局信息,其输出特征图中的每一个像素是输入特征图上的相应像素与其特征图上所有像素的加权和,且权重由两个像素的相关性决定而与距离无关,越相似的特征权重越大。
作为本发明更进一步的方案:所述光源采用球状分布式对称无影灯,球状分布式对称无影灯采用特制漫射板将光射到不同方向,形成渐变球状分布,确保整个球面目标坡度的反光强度都一致,所述支撑板采用高透明无反光材质玻璃,所述挡光板采用单一背景色,所述相机采用CCD相机并连接有变焦镜头。
作为本发明更进一步的方案:一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置,包含以下检测步骤:
S1、药片生产后直接放在第一输送机上,经第一输送机传送一定距离后通过第二滑板进入图像采集模块中的支撑板上表面,药片进入采集区域后通过光电开关和相机分别拍摄得到被测药片的“前内侧、上内侧、后内侧、前外侧、上外侧、后外侧”图像,拍摄后的图像传输至控制系统中;
S2、控制系统接收图像后针对具有污点、缺损的图像并通过LabelMe工具制作标签,将采集到的药片图像随机分成训练集和验证集,对训练集进行数据增强是为了扩充训练数据,在训练模型时使用验证集评估模型的优劣,保存最优模型进行实际药片的缺陷分割,对分割后的药片采用阈值分类法判断药片是否合格;
S3、正常图像采用修改的ResNet-50作为主干网络,使用残差网络的前三个分块,并将第三个分块的步长设置为1,这样得到的特征图尺寸是输入图像的1/8,局部和全局注意力两个并行模块分别对特征进一步提取,并将各自提取的特征相加进行融合,采用数据相关的上采样策略恢复最终征图至输入大小以实现像素分类;
结合1×1卷积和自适应最大池化下采样高分辨特征图与注意力模块融合的特征图进行特征聚合,分割出缺陷区域后进行缺陷区域像素统计,根据设定的阈值进行分类,像素个数大于设定的阈值时视为有缺陷产品,反之则认为是合格产品;
S4、检测后的药片从第一滑板上滑落至第二输送机,由第二输送机输送,合格后的药品直接输送至自动包装机中进行包装,不合格药片输送至导向机构位置时,控制系统根据检测结果控制伺服电机运作,伺服电机运作后带动导向板转动,药片根据导向板的方向滑落至回收处理箱中进行后期处理。
作为本发明更进一步的方案:所述S3中局部和全局注意力模块的特征提取、融合方法分别如下:
局部注意力模块:局部注意力模块是种反对称金字塔结构,对残差网路提取的特征图运用1×1卷积以调节通道数,编码阶段通过不同尺寸的卷积核下采样局部特征图,并在相应的下采样之后采用相同尺寸的卷积核进一步特征提取,字塔分为三级,即i取值为1,2,3,并且分别对应7×7、5×5、3×3的卷积核,前者缩小特征图的大小,而后者保持不变;
解码阶段在上采样时对称的与下采样相同尺寸的特征图进行融合。
全局注意力模块:第一阶段,经残差网络的特征提取,首先对输入特征图x∈RH×W×C引入1×1卷积降低通道数以缩减计算量并随之转换为多通道向量
Figure BDA0003033724950000041
N=H×W,随后对转置后的A和B执行矩阵乘法,最后通过softmax归一化得到注意力图D∈RN×N,Dij表示输入特征图上i位置与j位置像素点的相关性,在训练时越相似的特征Dij越大;
第二阶段,对注意力图D进行转置然后与特征向量C执行矩阵乘法,随后经过1×1卷积得恢复特征图尺寸,并且在第三阶段对特征图E和输入特征图x执行像素级相加,经过全局注意力后,输出特征图y的维度和输入x相同,并且输出特征图y中的每一个像素是输入特征图上的相应像素与其特征图上所有像素的加权和,且权重由两个像素的相关性决定,由此捕获了具有像素依赖关系的全局信息;
作为本发明更进一步的方案:所述S3中像素分类的具体方法如下:
将最终下采样融合的特征图上采样至输入尺寸,标签中的像素是非独立分布的,像素间包含着结构信息,因此我们可以将标签
Figure BDA0003033724950000042
近乎无损压缩到
Figure BDA0003033724950000043
后再解压至L1,然后将解压过程中学习的重建矩阵W用于上采样,L2与最终聚合特征图维度相同;
将标签L1压缩到L2可分为4个阶段,首先将L1分块成H2×W2个r×r子窗口,
Figure BDA0003033724950000044
然后将每个子窗口转化为向量
Figure BDA0003033724950000045
{0,1}表示标签经过one-hot编码处理,N1=r×r×C1,接着将向量V压缩成
Figure BDA0003033724950000046
最后水平、垂直压缩其他子窗口;
采用线性压缩方法:Z=PV,
Figure BDA0003033724950000047
其中,
Figure BDA0003033724950000048
用于压缩V至Z,
Figure BDA0003033724950000049
是解压重建矩阵,
Figure BDA0003033724950000051
是V的重建向量,在训练时,利用梯度下降法最小化
Figure BDA0003033724950000052
和V的误差。
与现有技术相比,本发明的有益效果是:本发明采用图像语义分割技术对药片表面缺陷检测进行检测,能通过预训练好的深度学习模型分割出污点、缺损缺陷区域并随之统计缺陷区域像素个数,依据设定的阈值实现药片的准确分类。
自动处理装置能够将待检药片传输至检测区域,经相机拍摄图像后根据实时检测模块的分类结果对药片进行分类处理,该装置能够实现药片的多角度、实时、自动化检测,提高了工作效率,降低了成本。
附图说明
图1为一种基于深度学习图像语义分割的药片自动化处理装置的结构示意图;
图2为一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置中检测方法的流程图;
图3为一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置中语义分割总体的结构示意图;
图4为一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置中语义分割局部注意力模块的结构示意图;
图5为一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置中语义全局注意力模块的结构示意图;
图6为一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置中r=2时L1压缩至特征图尺寸L2的过程;
图7为一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置中验证集图像的分割及检测结果。
图中:1、第一输送机;2、支撑板;3、挡光板;4、光源;5、第一滑板;6、回收处理箱;7、自动包装机;8、伺服电机;9、控制系统;10、光电开关;11、安装板;12、相机;13、第二滑板;14、导向板;15、第二输送机。
具体实施方式
请参阅图1~7,本发明实施例中,一种基于深度学习图像语义分割的药片自动化处理装置,包括第一输送机1,第一输送机1的一侧设置有图像采集模块、且第一输送机1的出料端与图像采集模块之间通过第二滑板13相连,图像采集模块的另一侧设置有第二输送机15,且图像采集模块的出料端通过第一滑板5与第二输送机15的起始端相连,图像采集模块与控制系统9电性相连,第二输送机15的一端设置有自动包装机7,且第二输送机15的前侧设置有回收处理箱6,第二输送机15的后侧对应回收处理箱6的位置处安装有导向机构;
图像采集模块包括与地面相固定的安装板11,安装板11的前侧固定有两端分别连接第一滑板5和第二滑板13的支撑板2,且安装板11的前侧位于支撑板2的上下两侧处错序分布有两个挡光板3,安装板11的前侧对应两个挡光板3的位置处均安装有相机12,相机12的检测端安装有光源4,支撑板2的上下侧对应挡光板3的位置处均安装有光电开关10。
进一步的,导向机构包括安装于第二输送机15一侧的伺服电机8,伺服电机8的传动端固定有导向板14,导向板14的下表面与第二输送机15的上表面贴合。
进一步的,第二滑板13与第一滑板5和水平角度均呈30°夹角。
进一步的,控制系统9包括缺陷分割模块和阈值分类模块,缺陷分割模块利用语义分割技术对相机拍摄的药片图像进行像素分类,其包含主干网络模块、局部注意力模块、全局注意力模块以及数据相关上采样模块,阈值分类模块是对缺陷分割模块分割的缺陷区域进行像素统计,根据设定的阈值进行分类,像素个数大于设定的阈值时视为有缺陷产品,反之则认为是合格产品。
进一步的,主干网络模块以修改的ResNet-50作为主干网络,为了保留更多的细节信息同时减少计算量,只使用残差网络的前三个分块,并将第三个分块的步长设置为1;
局部注意力模块是一种反对称金字塔结构,分编码、解码两个阶段,编码阶段下采样局部特征图,并在相应的下采样之后采用相同尺寸的卷积核进一步特征提取,解码阶段在上采样时对称的与下采样相同尺寸的特征图进行融合从而实现多尺寸的特征融合;
全局注意力模块捕获具有像素依赖关系的全局信息,其输出特征图中的每一个像素是输入特征图上的相应像素与其特征图上所有像素的加权和,且权重由两个像素的相关性决定而与距离无关,越相似的特征权重越大。
进一步的,光源4采用球状分布式对称无影灯,球状分布式对称无影灯采用特制漫射板将光射到不同方向,形成渐变球状分布,确保整个球面目标坡度的反光强度都一致,为避免复杂的生产环境影响拍摄的图片质量,支撑板2采用高透明无反光材质玻璃,挡光板3采用单一背景色利于图像分割,相机12采用CCD相机并连接有变焦镜头,因拍摄药片表面为弧形,拍摄时需要整个视野的光照均匀,并能够检测到药片表面的污点及缺损。
进一步的,一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置,包含以下检测步骤:
S1、药片生产后直接放在第一输送机1上,经第一输送机1传送一定距离后通过第二滑板13进入图像采集模块中的支撑板2上表面,药片进入采集区域后通过光电开关10和相机12分别拍摄得到被测药片的“前内侧、上内侧、后内侧、前外侧、上外侧、后外侧”图像,拍摄后的图像传输至控制系统9中;
S2、控制系统9接收图像后针对具有污点、缺损的图像并通过LabelMe工具制作标签,将采集到的药片图像随机分成训练集和验证集,对训练集进行数据增强是为了扩充训练数据,在训练模型时使用验证集评估模型的优劣,保存最优模型进行实际药片的缺陷分割,对分割后的药片采用阈值分类法判断药片是否合格;
S3、正常图像采用修改的ResNet-50作为主干网络,使用残差网络的前三个分块,并将第三个分块的步长设置为1,这样得到的特征图尺寸是输入图像的1/8,局部和全局注意力两个并行模块分别对特征进一步提取,并将各自提取的特征相加进行融合,采用数据相关的上采样策略恢复最终征图至输入大小以实现像素分类;
结合1×1卷积和自适应最大池化下采样高分辨特征图与注意力模块融合的特征图进行特征聚合,分割出缺陷区域后进行缺陷区域像素统计,根据设定的阈值进行分类,像素个数大于设定的阈值时视为有缺陷产品,反之则认为是合格产品;
S4、检测后的药片从第一滑板5上滑落至第二输送机15,由第二输送机15输送,合格后的药品直接输送至自动包装机7中进行包装,不合格药片输送至导向机构位置时,控制系统9根据检测结果控制伺服电机8运作,伺服电机8运作后带动导向板14转动,药片根据导向板14的方向滑落至回收处理箱6中进行后期处理。
进一步的,S3中局部和全局注意力模块的特征提取、融合方法分别如下:
局部注意力模块:局部注意力模块是种反对称金字塔结构,对残差网路提取的特征图运用1×1卷积以调节通道数,编码阶段通过不同尺寸的卷积核下采样局部特征图,并在相应的下采样之后采用相同尺寸的卷积核进一步特征提取,字塔分为三级,即i取值为1,2,3,并且分别对应7×7、5×5、3×3的卷积核,前者缩小特征图的大小,而后者保持不变;
解码阶段在上采样时对称的与下采样相同尺寸的特征图进行融合,这种局部注意力的设计不仅可以处理目标尺寸不一的问题,而且将提取的丰富局部信息进行后期融合,大大改善了分割效果,同样,特征图的分辨率和通道数较小因此不会带来计算上的压力。
全局注意力模块:第一阶段,经残差网络的特征提取,首先对输入特征图x∈RH×W×C引入1×1卷积降低通道数以缩减计算量并随之转换为多通道向量
Figure BDA0003033724950000081
N=H×W,随后对转置后的A和B执行矩阵乘法,最后通过softmax归一化得到注意力图D∈RN×N,Dij表示输入特征图上i位置与j位置像素点的相关性,在训练时越相似的特征Dij越大;
第二阶段,对注意力图D进行转置然后与特征向量C执行矩阵乘法,随后经过1×1卷积得恢复特征图尺寸,并且在第三阶段对特征图E和输入特征图x执行像素级相加,经过全局注意力后,输出特征图y的维度和输入x相同,并且输出特征图y中的每一个像素是输入特征图上的相应像素与其特征图上所有像素的加权和,且权重由两个像素的相关性决定,由此捕获了具有像素依赖关系的全局信息;
进一步的,S3中像素分类的具体方法如下:
将最终下采样融合的特征图上采样至输入尺寸,标签中的像素是非独立分布的,像素间包含着结构信息,因此我们可以将标签
Figure BDA0003033724950000091
近乎无损压缩到
Figure BDA0003033724950000092
后再解压至L1,然后将解压过程中学习的重建矩阵W用于上采样,L2与最终聚合特征图维度相同;
将标签L1压缩到L2可分为4个阶段,首先将L1分块成H2×W2个r×r子窗口,
Figure BDA0003033724950000093
然后将每个子窗口转化为向量
Figure BDA0003033724950000094
{0,1}表示标签经过one-hot编码处理,N1=r×r×C1,接着将向量V压缩成
Figure BDA0003033724950000095
最后水平、垂直压缩其他子窗口;
采用线性压缩方法:Z=PV,
Figure BDA0003033724950000096
其中,
Figure BDA0003033724950000097
用于压缩V至Z,
Figure BDA0003033724950000098
是解压重建矩阵,
Figure BDA0003033724950000099
是V的重建向量,在训练时,利用梯度下降法最小化
Figure BDA00030337249500000910
和V的误差。
测试例:
通过相机拍摄得到1914张图片,因为拍摄的每张图片中最多只包含一种缺陷,所以我们将缺陷检测分成两类,即训练两个模型分别检测污点和缺损缺陷,污点数据集968张,缺损数据集946张,两种数据集均有632×320、300×300、429×320三种尺寸且都有高质量的像素标签,我们将两个数据集随机分成75%的训练集和25%的验证集,训练模型时,通过实验精调,污点数据集初始学习率设置为0.3,缺损数据集为0.5,污点数据集训练80个周期且在区间[20,40,50,70]衰减,衰减因子为0.5,缺损数据集训练30个周期且每隔10个周期衰减一半,污点和缺损批量设为6,动量和衰减因子分别设为0.95和0.0001,对于数据增强,我们在污点数据集上随机旋转200和0.5-2.0倍缩放进行消融实验,且两种数据集均采用随机梯度下降算法作为优化器训练网络,针对污点数据集的极度不平衡特点使用泛化的Dice Loss(GDL)损失函数,而缺损数据集采用交叉熵损失函数,在阈值分类标准上,设置阈值标准为50,即当统计的污点或缺损像素点个数大于50时视为不合格产品,反之则认为是合格产品;
具体的,当采用数据相关上采样方法时,得到了95.42%的平均交并比结果,相较于双线性插值法有了1.40%的提升。
进一步的,如图7污点分割结果可视化可见,污点只占整张图片的极小部分,训练时也因此加大特征的学习难度,由此,我们引入处理样本不平衡的Focal Loss和GDL损失函数,实验结果表明使用GDL优于Focal Loss且较交叉熵损失函数有了2.37%的改善。
进一步的,以语义分割最常用的像素准确率(PA%)和平均交并比(MIoU%)作为分割评价指标,几种常用分割方法的实验结果如表1所示,HALCON在此数据集上取得了93.10%的平均交并比结果,此结果优于FCN-16s、DeepLab V3+和DANet三种常用模型,同时,本模型平均交并比结果比HALCON还要高出3.29%,由此说明提出的模型在污点数据集上能够得到很好的分割效果;
Figure BDA0003033724950000101
进一步的,在缺损数据集上进行实验,同样,我们将像素准确率(PA%)和平均交并比((MIoU%)作为评价指标评估分割效果,实验结果如表2所示,本模型在像素准确率、特别是平均交并比都取得了很大的提升,在药片缺损数据集上有着先进的分割能力;
Figure BDA0003033724950000102
进一步的,如图7所示,利用训练的模型对验证集图像的分割及检测结果,此结果也是对实时缺陷检测的模拟,在对验证集的缺陷分类中我们得到了100%的缺陷分类结果;由检测图像标签及分割结果可见,不管是缺陷面积较小的污点数据集还是缺陷类型复杂的缺损数据集上我们的网络都得到了很好的分割效果,我们设定污点和缺损缺陷分类阈值为50,由分类结果可知,网络准确的对缺陷进行了分类;分类阈值可根据实际对污点和缺损的定义自行设定,也可以设定污点和缺损不同的阈值;此外,我们的网络不局限于药片的检测,对于药片也能进行准确检测,实现了药品检测自动化装置的最大会利用。
综上所述:采用图像语义分割技术对药片表面缺陷检测进行检测,能通过预训练好的深度学习模型分割出污点、缺损缺陷区域并随之统计缺陷区域像素个数,依据设定的阈值实现药片的准确分类。
自动处理装置能够将待检药片传输至检测区域,经相机拍摄图像后根据实时检测模块的分类结果对药片进行分类处理,该装置能够实现药片的多角度、实时、自动化检测,提高了工作效率,降低了成本。
以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种基于深度学习图像语义分割的药片自动化处理装置,包括第一输送机(1),其特征在于,所述第一输送机(1)的一侧设置有图像采集模块、且第一输送机(1)的出料端与图像采集模块之间通过第二滑板(13)相连,所述图像采集模块的另一侧设置有第二输送机(15),且图像采集模块的出料端通过第一滑板(5)与第二输送机(15)的起始端相连,所述图像采集模块与控制系统(9)电性相连,所述第二输送机(15)的一端设置有自动包装机(7),且第二输送机(15)的前侧设置有回收处理箱(6),所述第二输送机(15)的后侧对应回收处理箱(6)的位置处安装有导向机构;
所述图像采集模块包括与地面相固定的安装板(11),所述安装板(11)的前侧固定有两端分别连接第一滑板(5)和第二滑板(13)的支撑板(2),且安装板(11)的前侧位于支撑板(2)的上下两侧处错序分布有两个挡光板(3),所述安装板(11)的前侧对应两个所述挡光板(3)的位置处均安装有相机(12),所述相机(12)的检测端安装有光源(4),所述支撑板(2)的上下侧对应挡光板(3)的位置处均安装有光电开关(10)。
2.根据权利要求1所述的一种基于深度学习图像语义分割的药片自动化处理装置,其特征在于,所述导向机构包括安装于第二输送机(15)一侧的伺服电机(8),所述伺服电机(8)的传动端固定有导向板(14),所述导向板(14)的下表面与第二输送机(15)的上表面贴合。
3.根据权利要求1所述的一种基于深度学习图像语义分割的药片自动化处理装置,其特征在于,所述第二滑板(13)与第一滑板(5)和水平角度均呈30°夹角。
4.根据权利要求1所述的一种基于深度学习图像语义分割的药片自动化处理装置,其特征在于,所述控制系统(9)包括缺陷分割模块和阈值分类模块,所述缺陷分割模块利用语义分割技术对相机拍摄的药片图像进行像素分类,其包含主干网络模块、局部注意力模块、全局注意力模块以及数据相关上采样模块,所述阈值分类模块是对缺陷分割模块分割的缺陷区域进行像素统计,根据设定的阈值进行分类,像素个数大于设定的阈值时视为有缺陷产品,反之则认为是合格产品。
5.根据权利要求4所述的一种基于深度学习图像语义分割的药片自动化处理装置,其特征在于,所述主干网络模块以修改的ResNet-50作为主干网络,为了保留更多的细节信息同时减少计算量,只使用残差网络的前三个分块,并将第三个分块的步长设置为1;
所述局部注意力模块是一种反对称金字塔结构,分编码、解码两个阶段,编码阶段下采样局部特征图,并在相应的下采样之后采用相同尺寸的卷积核进一步特征提取,解码阶段在上采样时对称的与下采样相同尺寸的特征图进行融合从而实现多尺寸的特征融合;
所述全局注意力模块捕获具有像素依赖关系的全局信息,其输出特征图中的每一个像素是输入特征图上的相应像素与其特征图上所有像素的加权和,且权重由两个像素的相关性决定而与距离无关,越相似的特征权重越大。
6.根据权利要求1所述的一种基于深度学习图像语义分割的药片自动化处理装置,其特征在于,所述光源(4)采用球状分布式对称无影灯,球状分布式对称无影灯采用特制漫射板将光射到不同方向,形成渐变球状分布,确保整个球面目标坡度的反光强度都一致,所述支撑板(2)采用高透明无反光材质玻璃,所述挡光板(3)采用单一背景色,所述相机(12)采用CCD相机并连接有变焦镜头。
7.根据权利要求1-6其中任一项所述的一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置,其特征在于,包含以下检测步骤:
S1、药片生产后直接放在第一输送机(1)上,经第一输送机(1)传送一定距离后通过第二滑板(13)进入图像采集模块中的支撑板(2)上表面,药片进入采集区域后通过光电开关(10)和相机(12)分别拍摄得到被测药片的“前内侧、上内侧、后内侧、前外侧、上外侧、后外侧”图像,拍摄后的图像传输至控制系统(9)中;
S2、控制系统(9)接收图像后针对具有污点、缺损的图像并通过LabelMe工具制作标签,将采集到的药片图像随机分成训练集和验证集,对训练集进行数据增强是为了扩充训练数据,在训练模型时使用验证集评估模型的优劣,保存最优模型进行实际药片的缺陷分割,对分割后的药片采用阈值分类法判断药片是否合格;
S3、正常图像采用修改的ResNet-50作为主干网络,使用残差网络的前三个分块,并将第三个分块的步长设置为1,这样得到的特征图尺寸是输入图像的1/8,局部和全局注意力两个并行模块分别对特征进一步提取,并将各自提取的特征相加进行融合,采用数据相关的上采样策略恢复最终征图至输入大小以实现像素分类;
结合1×1卷积和自适应最大池化下采样高分辨特征图与注意力模块融合的特征图进行特征聚合,分割出缺陷区域后进行缺陷区域像素统计,根据设定的阈值进行分类,像素个数大于设定的阈值时视为有缺陷产品,反之则认为是合格产品;
S4、检测后的药片从第一滑板(5)上滑落至第二输送机(15),由第二输送机(15)输送,合格后的药品直接输送至自动包装机(7)中进行包装,不合格药片输送至导向机构位置时,控制系统(9)根据检测结果控制伺服电机(8)运作,伺服电机(8)运作后带动导向板(14)转动,药片根据导向板(14)的方向滑落至回收处理箱(6)中进行后期处理。
8.根据权利要求7所述的一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置,其特征在于,所述S3中局部和全局注意力模块的特征提取、融合方法分别如下:
局部注意力模块:局部注意力模块是种反对称金字塔结构,对残差网路提取的特征图运用1×1卷积以调节通道数,编码阶段通过不同尺寸的卷积核下采样局部特征图,并在相应的下采样之后采用相同尺寸的卷积核进一步特征提取,字塔分为三级,即i取值为1,2,3,并且分别对应7×7、5×5、3×3的卷积核,前者缩小特征图的大小,而后者保持不变;
解码阶段在上采样时对称的与下采样相同尺寸的特征图进行融合。
全局注意力模块:第一阶段,经残差网络的特征提取,首先对输入特征图x∈RH×W×C引入1×1卷积降低通道数以缩减计算量并随之转换为多通道向量
Figure FDA0003033724940000031
N=H×W,随后对转置后的A和B执行矩阵乘法,最后通过softmax归一化得到注意力图D∈RN×N,Dij表示输入特征图上i位置与j位置像素点的相关性,在训练时越相似的特征Dij越大;
第二阶段,对注意力图D进行转置然后与特征向量C执行矩阵乘法,随后经过1×1 卷积得恢复特征图尺寸,并且在第三阶段对特征图E和输入特征图x执行像素级相加,经过全局注意力后,输出特征图y的维度和输入x相同,并且输出特征图y中的每一个像素是输入特征图上的相应像素与其特征图上所有像素的加权和,且权重由两个像素的相关性决定,由此捕获了具有像素依赖关系的全局信息。
9.根据权利要求7所述的一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置,其特征在于,所述S3中像素分类的具体方法如下:
将最终下采样融合的特征图上采样至输入尺寸,标签中的像素是非独立分布的,像素间包含着结构信息,因此我们可以将标签
Figure FDA0003033724940000041
近乎无损压缩到
Figure FDA0003033724940000042
后再解压至L1,然后将解压过程中学习的重建矩阵W用于上采样,L2与最终聚合特征图维度相同;
将标签L1压缩到L2可分为4个阶段,首先将L1分块成H2×W2个r×r子窗口,
Figure FDA0003033724940000043
然后将每个子窗口转化为向量
Figure FDA0003033724940000044
{0,1}表示标签经过one-hot编码处理,N1=r×r×C1,接着将向量V压缩成
Figure FDA0003033724940000045
最后水平、垂直压缩其他子窗口;
采用线性压缩方法:Z=PV,
Figure FDA0003033724940000046
其中,
Figure FDA0003033724940000047
用于压缩V至Z,
Figure FDA0003033724940000048
是解压重建矩阵,
Figure FDA0003033724940000049
是V的重建向量,在训练时,利用梯度下降法最小化
Figure FDA00030337249400000410
和V的误差。
CN202110437743.5A 2021-04-22 2021-04-22 一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置 Pending CN113129288A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110437743.5A CN113129288A (zh) 2021-04-22 2021-04-22 一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110437743.5A CN113129288A (zh) 2021-04-22 2021-04-22 一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置

Publications (1)

Publication Number Publication Date
CN113129288A true CN113129288A (zh) 2021-07-16

Family

ID=76779242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110437743.5A Pending CN113129288A (zh) 2021-04-22 2021-04-22 一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置

Country Status (1)

Country Link
CN (1) CN113129288A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113469997A (zh) * 2021-07-19 2021-10-01 京东科技控股股份有限公司 平面玻璃的检测方法、装置、设备和介质
CN113538429A (zh) * 2021-09-16 2021-10-22 海门市创睿机械有限公司 基于图像处理的机械零件表面缺陷检测方法
CN113658180A (zh) * 2021-10-20 2021-11-16 北京矩视智能科技有限公司 一种基于空间上下文引导的表面缺陷区域分割方法和装置
CN113824827A (zh) * 2021-09-20 2021-12-21 苏州凯仕弘科技有限公司 一种手机屏幕视觉检测系统
CN114037674A (zh) * 2021-11-04 2022-02-11 天津大学 一种基于语义上下文的工业缺陷图像分割检测方法及装置
CN114841986A (zh) * 2022-05-24 2022-08-02 亳州学院 一种基于机器视觉的中药饮片质量监测分析系统
CN115147375A (zh) * 2022-07-04 2022-10-04 河海大学 基于多尺度注意力的混凝土表面缺陷特征检测方法
CN114037674B (zh) * 2021-11-04 2024-04-26 天津大学 一种基于语义上下文的工业缺陷图像分割检测方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102507598A (zh) * 2011-11-02 2012-06-20 苏州科技学院 一种高速无序胶囊缺陷检测系统
CN102556437A (zh) * 2010-12-29 2012-07-11 吴士敏 离线式全自动泡罩包装质量检测系统及其方法
CN105866135A (zh) * 2016-03-22 2016-08-17 中和汇阔科技(北京)有限公司 一种片状物料检测系统
CN106802304A (zh) * 2015-11-26 2017-06-06 Ckd株式会社 外观检查装置
CN110013967A (zh) * 2019-04-16 2019-07-16 浙江理工大学 一种胶囊瑕疵抛丸全检装置
CN110570396A (zh) * 2019-08-07 2019-12-13 华中科技大学 一种基于深度学习的工业产品缺陷检测方法
CN111179229A (zh) * 2019-12-17 2020-05-19 中信重工机械股份有限公司 一种基于深度学习的工业ct缺陷检测方法
CN111282842A (zh) * 2020-03-20 2020-06-16 无锡传奇科技有限公司 一种全自动药片检测设备
CN211914625U (zh) * 2020-03-20 2020-11-13 无锡传奇科技有限公司 一种用于药片检测机的检测系统
CN211914640U (zh) * 2020-03-20 2020-11-13 无锡传奇科技有限公司 一种全自动药片检测设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102556437A (zh) * 2010-12-29 2012-07-11 吴士敏 离线式全自动泡罩包装质量检测系统及其方法
CN102507598A (zh) * 2011-11-02 2012-06-20 苏州科技学院 一种高速无序胶囊缺陷检测系统
CN106802304A (zh) * 2015-11-26 2017-06-06 Ckd株式会社 外观检查装置
CN105866135A (zh) * 2016-03-22 2016-08-17 中和汇阔科技(北京)有限公司 一种片状物料检测系统
CN110013967A (zh) * 2019-04-16 2019-07-16 浙江理工大学 一种胶囊瑕疵抛丸全检装置
CN110570396A (zh) * 2019-08-07 2019-12-13 华中科技大学 一种基于深度学习的工业产品缺陷检测方法
CN111179229A (zh) * 2019-12-17 2020-05-19 中信重工机械股份有限公司 一种基于深度学习的工业ct缺陷检测方法
CN111282842A (zh) * 2020-03-20 2020-06-16 无锡传奇科技有限公司 一种全自动药片检测设备
CN211914625U (zh) * 2020-03-20 2020-11-13 无锡传奇科技有限公司 一种用于药片检测机的检测系统
CN211914640U (zh) * 2020-03-20 2020-11-13 无锡传奇科技有限公司 一种全自动药片检测设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张汉 等: "并行注意力机制在图像语义分割中的应用", 《计算机工程与应用》 *
胡安翔: "基于机器视觉的缺陷药片检测关键技术研究", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 *
高体红 等: "药片视觉系统中图像处理单元设计与验证", 《计算机仿真》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113469997A (zh) * 2021-07-19 2021-10-01 京东科技控股股份有限公司 平面玻璃的检测方法、装置、设备和介质
CN113469997B (zh) * 2021-07-19 2024-02-09 京东科技控股股份有限公司 平面玻璃的检测方法、装置、设备和介质
CN113538429A (zh) * 2021-09-16 2021-10-22 海门市创睿机械有限公司 基于图像处理的机械零件表面缺陷检测方法
CN113538429B (zh) * 2021-09-16 2021-11-26 海门市创睿机械有限公司 基于图像处理的机械零件表面缺陷检测方法
CN113824827A (zh) * 2021-09-20 2021-12-21 苏州凯仕弘科技有限公司 一种手机屏幕视觉检测系统
CN113658180A (zh) * 2021-10-20 2021-11-16 北京矩视智能科技有限公司 一种基于空间上下文引导的表面缺陷区域分割方法和装置
CN114037674A (zh) * 2021-11-04 2022-02-11 天津大学 一种基于语义上下文的工业缺陷图像分割检测方法及装置
CN114037674B (zh) * 2021-11-04 2024-04-26 天津大学 一种基于语义上下文的工业缺陷图像分割检测方法及装置
CN114841986A (zh) * 2022-05-24 2022-08-02 亳州学院 一种基于机器视觉的中药饮片质量监测分析系统
CN114841986B (zh) * 2022-05-24 2022-11-11 亳州学院 一种基于机器视觉的中药饮片质量监测分析系统
CN115147375A (zh) * 2022-07-04 2022-10-04 河海大学 基于多尺度注意力的混凝土表面缺陷特征检测方法

Similar Documents

Publication Publication Date Title
CN113129288A (zh) 一种基于深度学习图像语义分割的药片表面缺陷检测方法及其自动化处理装置
CN111179253B (zh) 一种产品缺陷检测方法、装置与系统
EP1278043B1 (en) Shearographic imaging machine
CN109325915B (zh) 一种用于低分辨率监控视频的超分辨率重建方法
CN116051549B (zh) 一种太阳能电池片缺陷分割方法、系统、介质及设备
CN108287162A (zh) 一种食品安全智能检测的方法
CN111353544A (zh) 一种基于改进的Mixed Pooling-YOLOV3目标检测方法
CN115830004A (zh) 表面缺陷检测方法、装置、计算机设备和存储介质
CN111612789A (zh) 一种基于改进的U-net网络的缺陷检测方法
CN111738338B (zh) 基于级联膨胀fcn网络应用于马达线圈的缺陷检测方法
CN116071315A (zh) 一种基于机器视觉的产品可视缺陷检测方法及系统
CN115239642A (zh) 一种输电线路中小金具缺陷的检测方法、检测装置和设备
CN116883801A (zh) 基于注意力机制与多尺度特征融合的YOLOv8目标检测方法
CN114549489A (zh) 一种面向雕花口红质检的实例分割缺陷检测方法
CN112446376A (zh) 一种工业图像智能分割压缩方法
CN111862059A (zh) 一种基于深度学习多层特征融合的布匹缺陷检测方法
Chen et al. Real-time defect detection of TFT-LCD displays using a lightweight network architecture
CN115330729A (zh) 一种多尺度特征融合注意力的轻量带钢表面缺陷检测方法
CN116091763A (zh) 苹果叶部病害图像语义分割系统及分割方法、设备和介质
CN115861160A (zh) 一种手机电源接口表面缺陷检测方法、装置和存储介质
CN111402223B (zh) 一种利用变电站视频图像的变电站缺陷问题检测方法
CN114266751A (zh) 基于ai技术的产品包装袋打码缺陷检测方法及系统
CN113034432A (zh) 一种产品缺陷检测方法、系统、装置及存储介质
CN112730437A (zh) 基于深度可分离卷积神经网络的喷丝板表面缺陷检测方法、装置、存储介质及设备
CN117115118A (zh) 一种基于trcu算法的运输流矿石粗颗粒分布检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210716

RJ01 Rejection of invention patent application after publication