CN112330682A - 一种基于深度卷积神经网络的工业ct图像分割方法 - Google Patents

一种基于深度卷积神经网络的工业ct图像分割方法 Download PDF

Info

Publication number
CN112330682A
CN112330682A CN202011239518.2A CN202011239518A CN112330682A CN 112330682 A CN112330682 A CN 112330682A CN 202011239518 A CN202011239518 A CN 202011239518A CN 112330682 A CN112330682 A CN 112330682A
Authority
CN
China
Prior art keywords
image
industrial
neural network
training
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011239518.2A
Other languages
English (en)
Other versions
CN112330682B (zh
Inventor
罗志勇
唐文平
郑佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202011239518.2A priority Critical patent/CN112330682B/zh
Publication of CN112330682A publication Critical patent/CN112330682A/zh
Application granted granted Critical
Publication of CN112330682B publication Critical patent/CN112330682B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明请求保护一种基于深度卷积神经网络的工业CT图像分割方法,其包括以下步骤:步骤1、工业CT图像数据集的构建步骤,得到训练集、验证集和测试集;步骤2、制作标注样本;步骤3、设计基于深度卷积神经网络的工业CT图像分割的网络结构;步骤4,设计损失函数:使用一种改进的基于Dice系数和二分类交叉熵的损失函数作为的新的目标函数在训练期间来进行优化;步骤5,训练模型,采用tensorflow深度学习框架进行模型训练,模型训练预先采用Adam优化器不断优化步骤4中的自定义损失函数;步骤6,后处理步骤:采用全连接条件随机场对神经网络的分割结果进一步细化处理,不断优化分割结果。本发明分割效率高、精度高而且具有一定的通用性。

Description

一种基于深度卷积神经网络的工业CT图像分割方法
技术领域
本发明属于工业CT图像处理领域,涉及一种基于深度卷积神经网络的工业CT图像分割方法。
背景技术
工业CT(ComputedTomography)检测是一种十分重要的多类型材料工业无损检测手段,可同时完成复杂外形、内部型腔、内部缺陷和微小孔的检测。工业CT能够可视化地显示被检测目标内部及外部结构,同时可精确定位和测量目标尺寸、形状和轮廓误差等,并能通过二维和三维图像显示检测结果并生成量化报告。作为工业CT检测中的重要一环,工业CT图像分割技术具有广泛的应用价值,工业CT图像的分割精度直接影响到工业CT检测最终精度。目前工业CT图像分割方法主要可以分为基于模板的图像分割、基于阈值的图像分割、基于边缘的图像分割等。由于工业CT图像存在噪声种类繁多、噪声分布无规律以及灰度不均等问题,传统的工业CT图像分割算法的检测结果往往受噪声、伪影严重,因此检测精确度不足,已经无法满足高精度工业CT图像检测要求,且传统检测算法存在通用性不足的问题。
近年来,随着深度学习技术的兴起,计算机视觉技术取得了很多突破性的进展,深度卷积神经网络已经在图像分类、目标检测、语义分割、目标追踪和超分辨率等问题上表现出优良的性能。而在整个发展过程中,卷积神经网络(CNN)起着关键性作用,这一成功要归功于卷积神经网络在不依赖手工提取特征的情况下,能够学习原始输入数据的层次表示。由于传统的工业CT图像分割方法受限于手工提取特征的方式导致其具有通用性差,检测精度低,开发成本高而限制了其发展。针对此问题,深度学习是良好的解决途径,深度卷积神经网络具有数据驱动和特征自动学习的优势,能够获得很好的学习能力和特征表达能力,可以提取图像的深层次特征,从而大大提高检测准确率且鲁棒性强。然而,目前关于基于深度卷积神经网络的工业CT图像分割方法的研究特别少。因此,提出一种基于深度卷积神经网络的工业CT图像分割方法具有重大意义。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种具有分割效率高、精度高而且具有一定的通用性的基于深度卷积神经网络的工业CT图像分割方法。本发明的技术方案如下:
一种基于深度卷积神经网络的工业CT图像分割方法,其包括以下步骤:
步骤1、工业CT图像数据集的构建步骤,得到训练集、验证集和测试集;
步骤2、制作标注样本,对步骤1中到的训练集和验证集进行图像标注;
步骤3、设计基于深度卷积神经网络的工业CT图像分割的网络结构,网络总体结构是编码器-解码器的结构,编码器主要用来从原始输入图像中自动提取特征并学习,而解码器负责将编码特征上采样到和输入图像具有相同分辨率的特征图以实现像素级的分类,最终实现工业CT图像的分割;
步骤4,设计损失函数:使用一种改进的基于Dice系数和二分类交叉熵的损失函数作为的新的目标函数在训练期间来进行优化;
步骤5,训练模型,采用tensorflow深度学习框架进行模型训练,模型训练预先采用Adam优化器不断优化步骤4中的自定义损失函数;
步骤6,后处理步骤:采用全连接条件随机场对神经网络的分割结果进一步细化处理,不断优化分割结果。
进一步的,所述步骤1工业CT数据集的构建,主要步骤包括:
1)采集图像,对图像进行一个初步的预处理操作;所述预处理操作包括图像灰度化、图像滤波、图像锐化、图像数据归一化;
2)数据增强步骤;
3)数据集划分,将步骤2)中通过数据增强后所得到的数据集进行shuffle操作后,按训练集、验证集和测试集8:1:1的比例进行划分。
进一步的,所述数据增强步骤具体包括:
为了扩充数据集以实现模型充分学习和模型泛化,通过生成对抗网络GAN对工业CT图像数据集进行扩充;此外,通过Imgaug库对训练样本数据集进行扩充,包括平移、镜像、旋转、高斯模糊和弹性变换,为了后续卷积神经网络能够进行充分的特征提取,对数据集进行随机缩放以便神经网络可以学习到不同尺度的特征。
进一步的,所述步骤2具体包括:
对步骤1得到的训练集和验证集进行图像标注,使用标注工具Labelme或者Photoshop对图像进行逐像素标注,对标签进行二值化操作,将图像中的对象对应的标签像素值置1,将图像中的背景部分对应的标签像素置0。
进一步的,所述步骤3基于深度卷积神经网络的工业CT图像分割的网络结构具体为:
1)编码器部分主要是以改进的深度残差网络ResNet-101作为backbone进行特征提取,第一组卷积,卷积核的大小为7*7,卷积核的个数是64个,在卷积层后添加一个批量归一化层和非线性激活函数Leaky-Relu,紧接着是平均池化层,核的尺寸为3*3,步长为2;第二组卷积包括3个残差块,每个残差块由有3个卷积组成,三个卷积核尺寸分别为1*1、3*3和1*1,对应的卷积核个数分别为64、64和256;第三组卷积包括包含4个残差块,每个残差块由有3个卷积组成,三个卷积核尺寸分别为1*1、3*3和1*1,对应的卷积核个数分别为128、128和512;第四组卷积包括包含23个残差块,每个残差块由有3个卷积组成,三个卷积核尺寸分别为1*1、3*3和1*1,对应的卷积核个数分别为256、256和1024。第五组卷积包括包含3个残差块,每个残差块由有3个卷积组成,三个卷积核尺寸分别为1*1、3*3和1*1,对应的卷积核个数分别为512、512和2048;
2)在解码阶段,将底层信息和深层次的信息进行高度融合,然后通过转置卷积不断学习进行上采样操作将特征图恢复到原始图像大小进而对每一个像素进行分类,解码器的最后一层为sigmoid层,sigmoid函数为
Figure BDA0002767892490000031
它将神经网络的输出归一化到0到1,当输出大于0.5时为前景,当输出小于0.5时,则为背景。
进一步的,所述步骤4的设计损失函数具体包括:设计一种基于Dice系数和二分类交叉熵损失函数相结合作为的新的目标函数在训练期间来不断进行优化,Dice系数函数表达式为
Figure BDA0002767892490000041
二分类交叉熵的损失函数表达式为
Figure BDA0002767892490000042
新的目标函数为:
Figure BDA0002767892490000043
式中,Yi
Figure BDA0002767892490000044
分别代表第i张图像展平后神经网络预测的概率和展平后真实标签,N代表批量大小。二分类交叉熵损失函数对每个类别具有相同的关注度,这就会很容易受到类别不均衡的情况。与一般的只用交叉熵损失函数相比,Dice系数能够关注真实值和预测值的重合部分,这就能够使得在类别不均衡的情况下模型也能表现很好,适合处理前景和背景像数量严重不均衡的情况。
进一步的,所述步骤5具体包括:
训练模型,采用tensorflow深度学习框架进行模型训练,模型训练预先采用Adam优化器不断优化(4)中的自定义损失函数,初始学习率为0.001,然后再使用SGD优化器不断优化(4)中的自定义损失函数,采用动态学习率机制进行训练,在验证集上指定10个epoch损失函数没有下降时,自动降低学习率使目标值达到最优;此外,设定early stopping监督机制,当5个epoch后,模型在验证集上的精度没有得到改善时,自动停止训练。
进一步的,所述步骤6采用全连接条件随机场对神经网络的分割结果进一步细化处理,不断优化分割结果,具体包括:
构建如下能量函数:
Figure BDA0002767892490000045
式中,x代表像素的标签,Ψi(xi)是一元势能函数,它的函数表达式为Ψi(xi)=-logP(xi),其中P(xi)是深度卷积神经网络输出的第i个像素类别对应的标签预测概率,Ψij(xi,xj)是双边势能函数,函数表达式如下:
Figure BDA0002767892490000051
式中当xi=xj时,μ(xi,xj)=1,否则为0。第一个核函数依赖于像素的位置和像素的颜色强度,第二个核函数只依赖于像素的位置。σα,σβ,σγ是控制两个高斯核的尺度,ω1和ω2是两个高斯核的权重。
通过迭代推理,条件随机场模型能够将位置相邻和颜色特征相似的像素归为一类从而优化对象边缘的分割效果,最终完成工业CT图像的进一步细化分割。
本发明的优点及有益效果如下:
本发明提供了一种基于深度卷积神经网络的工业CT图像分割方法,设计了一种基于编码器-解码器结构的工业CT分割网络模型,可以快速准确地进行分割。针对工业CT扫描昂贵导致图像样本数量不足的问题,利用生成对抗网络进行数据增强扩充训练样本集,从而提升模型的学习和泛化能力;针对分割时类别不均衡问题,通过设计一种基于Dice系数和交叉熵的损失函数相结合的新的损失函数来解决训练过程中类别不均衡问题。与传统的分割方法相比,本发明方法能够克服手工提取特征的方式,工作量大且复杂,人为主观因素的干扰引起的问题,具有分割效率高、精度高而且具有一定的通用性。
附图说明
图1是本发明提供优选实施例方法的一种基于深度卷积神经网络的工业CT图像分割方法的流程图;
图2是本发明方法的工业CT图像数据集的构建流程图;
图3是本发明方法的图像分割的编码器-解码器网络模型结构图;
图4是本发明方法的用于特征提取的ResNet-101网络结构图;
图5是本发明方法的对神经网络粗分割的后处理流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
如图1所示,本发明实施例提供了一种基于深度卷积神经网络的工业CT图像分割方法,包括以下步骤:
步骤1,工业CT图像数据集的构建,构建的具体流程如图2所示;
1.1、采集图像,对图像进行一个初步的预处理操作,主要包括图像灰度化、图像滤波、图像锐化、图像数据归一化;
1.2、数据增强,由于工业CT扫描价格非常昂贵,因此所得到的工业CT图像数据集有限,为了扩充数据集以实现模型充分学习和模型泛化,通过生成对抗网络(GAN)对工业CT图像数据集进行扩充。此外,通过Imgaug库对训练样本数据集进行扩充,包括平移、镜像、旋转、高斯模糊和弹性变换等,此外,为了后续卷积神经网络进行充分的特征提取,对数据集进行随机缩放以便神经网络可以学习到不同尺度的特征;
1.3、数据集划分,将1.2中得到的数据集进行shuffle操作后,按训练集、验证集和测试集8:1:1的比例进行划分;
步骤2,制作标注样本,对步骤1中到的训练集和验证集进行图像标注,使用标注工具Labelme或者Photoshop对图像进行标注,对标签进行二值化操作,将图像中的对象对应的标签像素值置1,将图像中的背景部分对应的标签像素置0;
步骤3,设计基于深度卷积神经网络的工业CT图像分割的网络结构,网络总体结构是编码器-解码器的结构,如图3所示。编码器主要用来从原始输入图像中自动提取特征并学习,而解码器负责将编码特征上采样到和输入图像分辨率相同以实现像素级的分类,最终实现工业CT图像的分割。网络的具体结构为:
3.1、编码器部分主要是以改进的深度残差网络ResNet-101作为backbone进行特征提取,ResNet-101的结构如图4所示。第一组卷积,卷积核的大小为7*7,卷积核的个数是64个,在卷积层后添加一个批量归一化层和改进的非线性激活函数Leaky-Relu,紧接着是平均池化层,核的尺寸为3*3,步长为2。第二组卷积包括3个残差块,每个残差块由有3个卷积组成,三个卷积核尺寸分别为1*1、3*3和1*1,对应的卷积核个数分别为64、64和256。第三组卷积包括包含4个残差块,每个残差块由有3个卷积组成,三个卷积核尺寸分别为1*1、3*3和1*1,对应的卷积核个数分别为128、128和512。第四组卷积包括包含23个残差块,每个残差块由有3个卷积组成,三个卷积核尺寸分别为1*1、3*3和1*1,对应的卷积核个数分别为256、256和1024。第五组卷积包括包含3个残差块,每个残差块由有3个卷积组成,三个卷积核尺寸分别为1*1、3*3和1*1,对应的卷积核个数分别为512、512和2048。
3.2、在解码阶段,将底层信息和深层次的信息进行高度融合,然后通过转置卷积不断学习进行上采样操作将特征图恢复到原始图像大小进而对每一个像素进行分类,解码器的最后一层为sigmoid层,sigmoid函数为
Figure BDA0002767892490000071
它将神经网络的输出归一化到0到1,当输出大于0.5时为前景,当输出小于0.5时,则为背景。
步骤4,损失函数:由于目标对象在在整副图像中通常只占一小部分,这就会出现严重的类别不平衡情况,因此设计一种基于Dice系数和二分类交叉熵损失函数相结合作为的新的目标函数在训练期间来不断进行优化,这可以处理前景和背景体像数量严重不平衡的情况,目标函数为:
Figure BDA0002767892490000072
式中,Yi
Figure BDA0002767892490000073
分别代表第i张图像展平后神经网络预测的概率和展平后真实标签,N代表批量大小。
步骤5,训练模型,采用tensorflow深度学习框架进行模型训练,模型训练预先采用Adam优化器不断优化步骤4中的自定义损失函数,初始学习率为0.001,然后再使用SGD优化器不断优化步骤4中的自定义损失函数,采用动态学习率机制进行训练,在验证集上指定10个epoch损失函数没有下降时,自动降低学习率使目标值达到最优。此外,设定earlystopping监督机制,当5个epoch后,模型在验证集上的精度没有得到改善时,自动停止训练,从而可以有效地避免无效地训练和降低模型过拟合的风险。
步骤6,后处理:精确定位和分类性能是深度神经网络中一对天生的平衡关系,经过上述处理后,模型分类表现的精确率很高,但是对象边缘的分割效果较差,轮廓边缘存在模糊的情况,采用全连接条件随机场对神经网络的分割结果进一步细化,如图5所示。通过构建能量函数不断迭代推理,条件随机场模型能够将位置相邻和颜色特征相似的像素归为一类从而优化对象轮廓边缘的分割效果,最终实现对工业CT图像的进一步细化分割。
上述实施例阐明的方法,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (8)

1.一种基于深度卷积神经网络的工业CT图像分割方法,其特征在于,包括以下步骤:
步骤1、工业CT图像数据集的构建步骤,得到训练集、验证集和测试集;
步骤2、制作标注样本,对步骤1中到的训练集和验证集进行图像标注;
步骤3、设计基于深度卷积神经网络的工业CT图像分割的网络结构,网络总体结构是编码器-解码器的结构,编码器主要用来从原始输入图像中自动提取特征并学习,而解码器负责将编码特征上采样到和输入图像具有相同分辨率的特征图以实现像素级的分类,最终实现工业CT图像的分割;
步骤4,设计损失函数:使用一种改进的基于Dice系数和二分类交叉熵的损失函数作为的新的目标函数在训练期间来进行优化;
步骤5,训练模型,采用tensorflow深度学习框架进行模型训练,模型训练预先采用Adam优化器不断优化步骤4中的自定义损失函数;
步骤6,后处理步骤:采用全连接条件随机场对神经网络的分割结果进一步细化处理,不断优化分割结果。
2.根据权利要求1所述的一种基于深度卷积神经网络的工业CT图像分割方法,其特征在于,所述步骤1工业CT数据集的构建,主要步骤包括:
1)采集图像,对图像进行一个初步的预处理操作;所述预处理操作包括图像灰度化、图像滤波、图像锐化、图像数据归一化;
2)数据增强步骤;
3)数据集划分,将步骤2)中通过数据增强后所得到的数据集进行shuffle操作后,按训练集、验证集和测试集8:1:1的比例进行划分。
3.根据权利要求2所述的一种基于深度卷积神经网络的工业CT图像分割方法,其特征在于,所述数据增强步骤具体包括:
为了扩充数据集以实现模型充分学习和模型泛化,通过生成对抗网络GAN对工业CT图像数据集进行扩充;此外,通过Imgaug库对训练样本数据集进行扩充,包括平移、镜像、旋转、高斯模糊和弹性变换,为了后续卷积神经网络能够进行充分的特征提取,对数据集进行随机缩放以便神经网络可以学习到不同尺度的特征。
4.根据权利要求1-3之一所述的一种基于深度卷积神经网络的工业CT图像分割方法,其特征在于,所述步骤2具体包括:
对步骤1得到的训练集和验证集进行图像标注,使用标注工具Labelme或者Photoshop对图像进行逐像素标注,对标签进行二值化操作,将图像中的对象对应的标签像素值置1,将图像中的背景部分对应的标签像素置0。
5.根据权利要求4所述的一种基于深度卷积神经网络的工业CT图像分割方法,其特征在于,所述步骤3基于深度卷积神经网络的工业CT图像分割的网络结构具体为:
1)编码器部分主要是以改进的深度残差网络ResNet-101作为backbone进行特征提取,第一组卷积,卷积核的大小为7*7,卷积核的个数是64个,在卷积层后添加一个批量归一化层和非线性激活函数Leaky-Relu,紧接着是平均池化层,核的尺寸为3*3,步长为2;第二组卷积包括3个残差块,每个残差块由有3个卷积组成,三个卷积核尺寸分别为1*1、3*3和1*1,对应的卷积核个数分别为64、64和256;第三组卷积包括包含4个残差块,每个残差块由有3个卷积组成,三个卷积核尺寸分别为1*1、3*3和1*1,对应的卷积核个数分别为128、128和512;第四组卷积包括包含23个残差块,每个残差块由有3个卷积组成,三个卷积核尺寸分别为1*1、3*3和1*1,对应的卷积核个数分别为256、256和1024。第五组卷积包括包含3个残差块,每个残差块由有3个卷积组成,三个卷积核尺寸分别为1*1、3*3和1*1,对应的卷积核个数分别为512、512和2048;
2)在解码阶段,将底层信息和深层次的信息进行高度融合,然后通过转置卷积不断学习进行上采样操作将特征图恢复到原始图像大小进而对每一个像素进行分类,解码器的最后一层为sigmoid层,sigmoid函数为
Figure FDA0002767892480000021
它将神经网络的输出归一化到0到1,当输出大于0.5时为前景,当输出小于0.5时,则为背景。
6.根据权利要求5所述的一种基于深度卷积神经网络的工业CT图像分割方法,其特征在于,所述步骤4的设计损失函数具体包括:设计一种基于Dice系数和二分类交叉熵损失函数相结合作为的新的目标函数在训练期间来不断进行优化,Dice系数函数表达式为
Figure FDA0002767892480000031
二分类交叉熵损失函数表达式为
Figure FDA0002767892480000032
新的目标函数为:
Figure FDA0002767892480000033
式中,Yi
Figure FDA0002767892480000034
分别代表第i张图像展平后神经网络预测的概率和展平后真实标签,N代表批量大小。
7.根据权利要求6所述的一种基于深度卷积神经网络的工业CT图像分割方法,其特征在于,所述步骤5具体包括:
训练模型,采用tensorflow深度学习框架进行模型训练,模型训练预先采用Adam优化器不断优化(4)中的自定义损失函数,初始学习率为0.001,然后再使用SGD优化器不断优化(4)中的自定义损失函数,采用动态学习率机制进行训练,在验证集上指定10个epoch损失函数没有下降时,自动降低学习率使目标值达到最优;此外,设定early stopping监督机制,当5个epoch后,模型在验证集上的精度没有得到改善时,自动停止训练。
8.根据权利要求7所述的一种基于深度卷积神经网络的工业CT图像分割方法,其特征在于,所述步骤6采用全连接条件随机场对神经网络的分割结果进一步细化处理,不断优化分割结果,具体包括:
构建如下能量函数:
Figure FDA0002767892480000035
式中,x代表像素的标签,Ψi(xi)是一元势能函数,它的函数表达式为Ψi(xi)=-logP(xi),其中P(xi)是深度卷积神经网络输出的第i个像素类别对应的标签预测概率,Ψij(xi,xj)是双边势能函数,函数表达式如下:
Figure FDA0002767892480000041
式中当xi=xj时,μ(xi,xj)=1,否则为0,第一个核函数依赖于像素的位置和像素的颜色强度,第二个核函数只依赖于像素的位置,σα,σβ,σγ是控制两个高斯核的尺度,ω1和ω2是两个高斯核的权重;
通过迭代推理,条件随机场模型能够将位置相邻和颜色特征相似的像素归为一类从而优化对象边缘的分割效果,最终完成工业CT图像的进一步细化分割。
CN202011239518.2A 2020-11-09 2020-11-09 一种基于深度卷积神经网络的工业ct图像分割方法 Active CN112330682B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011239518.2A CN112330682B (zh) 2020-11-09 2020-11-09 一种基于深度卷积神经网络的工业ct图像分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011239518.2A CN112330682B (zh) 2020-11-09 2020-11-09 一种基于深度卷积神经网络的工业ct图像分割方法

Publications (2)

Publication Number Publication Date
CN112330682A true CN112330682A (zh) 2021-02-05
CN112330682B CN112330682B (zh) 2022-08-26

Family

ID=74315534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011239518.2A Active CN112330682B (zh) 2020-11-09 2020-11-09 一种基于深度卷积神经网络的工业ct图像分割方法

Country Status (1)

Country Link
CN (1) CN112330682B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861829A (zh) * 2021-04-13 2021-05-28 山东大学 一种基于深度卷积神经网络的水体提取方法及系统
CN112950624A (zh) * 2021-03-30 2021-06-11 太原理工大学 基于深度卷积神经网络的直肠癌t分期自动诊断方法及设备
CN113052298A (zh) * 2021-03-12 2021-06-29 电子科技大学 一种基于胶囊网络的三维模型检索方法
CN113155851A (zh) * 2021-04-30 2021-07-23 西安交通大学 基于深度学习的覆铜板表面缺陷视觉在线检测方法及装置
CN113205523A (zh) * 2021-04-29 2021-08-03 浙江大学 多尺度表征优化的医学影像分割识别系统、终端及存储介质
CN113240014A (zh) * 2021-05-18 2021-08-10 长春理工大学 一种二类分割损失函数及其构建方法和应用
CN113409447A (zh) * 2021-06-09 2021-09-17 广东工业大学 一种基于多切片组合的冠状动脉分割方法和装置
CN113405667A (zh) * 2021-05-20 2021-09-17 湖南大学 基于深度学习的红外热人体姿态识别方法
CN113487550A (zh) * 2021-06-30 2021-10-08 佛山市南海区广工大数控装备协同创新研究院 一种基于改进激活函数的目标检测方法及装置
CN113657392A (zh) * 2021-08-16 2021-11-16 山东建筑大学 基于低秩混合注意力机制的小目标语义分割方法及系统
CN114119627A (zh) * 2021-10-19 2022-03-01 北京科技大学 基于深度学习的高温合金微观组织图像分割方法及装置
CN114758178A (zh) * 2022-04-18 2022-07-15 江南大学 一种基于深度学习的轮毂实时分类及其气阀孔定位方法
CN115115610A (zh) * 2022-07-20 2022-09-27 南京航空航天大学 基于改进卷积神经网络的工业ct识别复材内部缺陷方法
WO2022226886A1 (zh) * 2021-04-29 2022-11-03 深圳高性能医疗器械国家研究院有限公司 基于变换域下去噪自动编码器作为先验的图像处理方法
CN115937103A (zh) * 2022-11-19 2023-04-07 吉林大学 基于深度学习的碱性磷酸酶浓度检测方法及应用软件
CN117593591A (zh) * 2024-01-16 2024-02-23 天津医科大学总医院 一种基于医学图像分割的舌象分类方法
CN117593591B (zh) * 2024-01-16 2024-05-31 天津医科大学总医院 一种基于医学图像分割的舌象分类方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108710875A (zh) * 2018-09-11 2018-10-26 湖南鲲鹏智汇无人机技术有限公司 一种基于深度学习的航拍公路车辆计数方法及装置
CN109635711A (zh) * 2018-12-07 2019-04-16 上海衡道医学病理诊断中心有限公司 一种基于深度学习网络的病理图像分割方法
CN110570396A (zh) * 2019-08-07 2019-12-13 华中科技大学 一种基于深度学习的工业产品缺陷检测方法
CN111046847A (zh) * 2019-12-30 2020-04-21 北京澎思科技有限公司 一种视频处理方法、装置、电子设备以及介质
WO2020093042A1 (en) * 2018-11-02 2020-05-07 Deep Lens, Inc. Neural networks for biomedical image analysis
CN111179269A (zh) * 2019-11-11 2020-05-19 浙江工业大学 一种基于多视图和3维卷积融合策略的pet图像分割方法
CN111179229A (zh) * 2019-12-17 2020-05-19 中信重工机械股份有限公司 一种基于深度学习的工业ct缺陷检测方法
CN111340047A (zh) * 2020-02-28 2020-06-26 江苏实达迪美数据处理有限公司 基于多尺度特征与前背景对比的图像语义分割方法及系统
CN111369498A (zh) * 2020-02-19 2020-07-03 浙江大学城市学院 一种基于改进生成对抗网络的种苗生长势评估的数据增强方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108710875A (zh) * 2018-09-11 2018-10-26 湖南鲲鹏智汇无人机技术有限公司 一种基于深度学习的航拍公路车辆计数方法及装置
WO2020093042A1 (en) * 2018-11-02 2020-05-07 Deep Lens, Inc. Neural networks for biomedical image analysis
CN109635711A (zh) * 2018-12-07 2019-04-16 上海衡道医学病理诊断中心有限公司 一种基于深度学习网络的病理图像分割方法
CN110570396A (zh) * 2019-08-07 2019-12-13 华中科技大学 一种基于深度学习的工业产品缺陷检测方法
CN111179269A (zh) * 2019-11-11 2020-05-19 浙江工业大学 一种基于多视图和3维卷积融合策略的pet图像分割方法
CN111179229A (zh) * 2019-12-17 2020-05-19 中信重工机械股份有限公司 一种基于深度学习的工业ct缺陷检测方法
CN111046847A (zh) * 2019-12-30 2020-04-21 北京澎思科技有限公司 一种视频处理方法、装置、电子设备以及介质
CN111369498A (zh) * 2020-02-19 2020-07-03 浙江大学城市学院 一种基于改进生成对抗网络的种苗生长势评估的数据增强方法
CN111340047A (zh) * 2020-02-28 2020-06-26 江苏实达迪美数据处理有限公司 基于多尺度特征与前背景对比的图像语义分割方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
沈瑜: "基于深度学习的寒旱区遥感影像河流提取", 《农业机械学报》 *
肖春姣等: "深度融合网结合条件随机场的遥感图像语义分割", 《遥感学报》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052298A (zh) * 2021-03-12 2021-06-29 电子科技大学 一种基于胶囊网络的三维模型检索方法
CN112950624A (zh) * 2021-03-30 2021-06-11 太原理工大学 基于深度卷积神经网络的直肠癌t分期自动诊断方法及设备
CN112861829A (zh) * 2021-04-13 2021-05-28 山东大学 一种基于深度卷积神经网络的水体提取方法及系统
CN112861829B (zh) * 2021-04-13 2023-06-30 山东大学 一种基于深度卷积神经网络的水体提取方法及系统
WO2022226886A1 (zh) * 2021-04-29 2022-11-03 深圳高性能医疗器械国家研究院有限公司 基于变换域下去噪自动编码器作为先验的图像处理方法
CN113205523A (zh) * 2021-04-29 2021-08-03 浙江大学 多尺度表征优化的医学影像分割识别系统、终端及存储介质
CN113155851A (zh) * 2021-04-30 2021-07-23 西安交通大学 基于深度学习的覆铜板表面缺陷视觉在线检测方法及装置
CN113240014A (zh) * 2021-05-18 2021-08-10 长春理工大学 一种二类分割损失函数及其构建方法和应用
CN113240014B (zh) * 2021-05-18 2022-05-31 长春理工大学 一种二类分割损失函数在实现椎间盘组织图像二类分割中的应用方法
CN113405667A (zh) * 2021-05-20 2021-09-17 湖南大学 基于深度学习的红外热人体姿态识别方法
CN113409447A (zh) * 2021-06-09 2021-09-17 广东工业大学 一种基于多切片组合的冠状动脉分割方法和装置
CN113487550A (zh) * 2021-06-30 2021-10-08 佛山市南海区广工大数控装备协同创新研究院 一种基于改进激活函数的目标检测方法及装置
CN113487550B (zh) * 2021-06-30 2024-01-16 佛山市南海区广工大数控装备协同创新研究院 一种基于改进激活函数的目标检测方法及装置
CN113657392B (zh) * 2021-08-16 2022-09-23 山东建筑大学 基于低秩混合注意力机制的小目标语义分割方法及系统
CN113657392A (zh) * 2021-08-16 2021-11-16 山东建筑大学 基于低秩混合注意力机制的小目标语义分割方法及系统
CN114119627A (zh) * 2021-10-19 2022-03-01 北京科技大学 基于深度学习的高温合金微观组织图像分割方法及装置
CN114758178A (zh) * 2022-04-18 2022-07-15 江南大学 一种基于深度学习的轮毂实时分类及其气阀孔定位方法
CN114758178B (zh) * 2022-04-18 2024-04-05 江南大学 一种基于深度学习的轮毂实时分类及其气阀孔定位方法
CN115115610A (zh) * 2022-07-20 2022-09-27 南京航空航天大学 基于改进卷积神经网络的工业ct识别复材内部缺陷方法
CN115115610B (zh) * 2022-07-20 2023-08-22 南京航空航天大学 基于改进卷积神经网络的工业ct识别复材内部缺陷方法
CN115937103A (zh) * 2022-11-19 2023-04-07 吉林大学 基于深度学习的碱性磷酸酶浓度检测方法及应用软件
CN117593591A (zh) * 2024-01-16 2024-02-23 天津医科大学总医院 一种基于医学图像分割的舌象分类方法
CN117593591B (zh) * 2024-01-16 2024-05-31 天津医科大学总医院 一种基于医学图像分割的舌象分类方法

Also Published As

Publication number Publication date
CN112330682B (zh) 2022-08-26

Similar Documents

Publication Publication Date Title
CN112330682B (zh) 一种基于深度卷积神经网络的工业ct图像分割方法
US10740640B2 (en) Image processing method and processing device
CN112329680A (zh) 基于类激活图的半监督遥感影像目标检测和分割方法
CN116994140A (zh) 基于遥感影像的耕地提取方法、装置、设备和介质
CN112861915A (zh) 一种基于高级语义特征无锚框非合作目标检测方法
CN113498521A (zh) 文本检测方法及装置、存储介质
CN111680755A (zh) 医学图像识别模型构建及医学图像识别方法、装置、介质及终端
CN113538458A (zh) 基于FTL损失函数和注意力的U-Net图像分割方法
Fan et al. A novel sonar target detection and classification algorithm
Xu et al. Multiple guidance network for industrial product surface inspection with one labeled target sample
CN113378642B (zh) 一种对农村违法占地建筑物进行检测的方法
CN111079825A (zh) 针对医学图像的细胞核自动检测方法
CN112991281B (zh) 视觉检测方法、系统、电子设备及介质
CN116912923B (zh) 一种图像识别模型训练方法和装置
CN116486393A (zh) 一种基于图像分割的场景文本检测方法
CN116189130A (zh) 基于图像标注模型的车道线分割方法及装置
Fang et al. Developing a feature decoder network with low-to-high hierarchies to improve edge detection
CN116129417A (zh) 一种基于低质量图像的数字仪表读数检测方法
CN115049546A (zh) 样本数据处理方法、装置、电子设备及存储介质
Jia et al. Pyramid dilated convolutional neural network for image denoising
Wei et al. Multi-scale Defect Detection Network for Tire Visual Inspection
CN113642452A (zh) 人体图像质量评价方法、装置、系统及存储介质
CN113361445B (zh) 一种基于注意力机制的文档二值化处理方法及系统
Long et al. Spectrum decomposition in Gaussian scale space for uneven illumination image binarization
CN111915621B (zh) 一种融合深度神经网络与cv模型的污损图像分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant