CN109741341A - 一种基于超像素和长短时记忆网络的图像分割方法 - Google Patents

一种基于超像素和长短时记忆网络的图像分割方法 Download PDF

Info

Publication number
CN109741341A
CN109741341A CN201811560271.7A CN201811560271A CN109741341A CN 109741341 A CN109741341 A CN 109741341A CN 201811560271 A CN201811560271 A CN 201811560271A CN 109741341 A CN109741341 A CN 109741341A
Authority
CN
China
Prior art keywords
super
pixel
segmentation
training
lstm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811560271.7A
Other languages
English (en)
Other versions
CN109741341B (zh
Inventor
文颖
谢恺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Priority to CN201811560271.7A priority Critical patent/CN109741341B/zh
Publication of CN109741341A publication Critical patent/CN109741341A/zh
Application granted granted Critical
Publication of CN109741341B publication Critical patent/CN109741341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于超像素和长短时记忆网络(Long Short‑Term Memory,LSTM)的图像分割方法,包括训练和测试两个阶段,训练阶段:对图像训练集进行预处理;利用一种超像素分割算法进行预分割;建立超像素图;根据超像素图构建适用于LSTM输入的特征序列训练集和真值集;训练LSTM模型。测试阶段:对待分割图像进行预处理、超像素分割、构建超像素图并构建特征序列;将特征序列输入已训练的LSTM模型,根据分类结果还原分割后的图像。本发明基于超像素分割,通过训练神经网络对超像素块进行分类获得分割结果,解决了传统分割网络对于空间边缘分割精度不足的问题,同时利用LSTM对于序列特征数据分类的特点,融合了超像素块的邻域信息,进一步提高了分割精度和时间性能。

Description

一种基于超像素和长短时记忆网络的图像分割方法
技术领域
本发明属于图像分割技术领域,是一种基于超像素和长短时记忆网络(LongShort-Term Memory,LSTM)的图像分割方法。
背景技术
图像分割是由图像处理进到图像分析的关键步骤,也是一种基本的计算机视觉技术。 图像分割就是把图像分成各具特性的区域并提取出感兴趣目标区域的技术和过程。现有 的图像分割主要分为下面几类:基于阈值的分割方法,基于区域的分割方法,基于边缘的分割方法以及基于聚类的分割方法。随着近年来深度学习的发展,越来越多基于深度 神经网络的方法也逐渐应用于图像分割领域。Jonathan Long等人在2015年提出了全卷积 神经网络(Fully Convolutional Networks,FCN),通过构建端到端、像素到像素训练的卷 积网络来提取图像语义信息,成功应用于图像分割领域。此外,循环神经网络(RecurrentNeural Network,RNN)由于能够接受序列结构输入,更好地考虑输入特征向量之间相关性,近年来也有研究将其应用于图像分割,尤其是医学图像分割领域。
传统基于聚类方法的图像分割算法,如K-Means、FCM、SOM等方法,在应用时都 有各自的优缺点。例如K-means在实现时较为简单快速,但它对于噪点较为敏感,并且 分割结果较大依赖于初始化;FCM和SOM对于初始化并不敏感,但这两种方法都需要 依赖于不断地迭代,使得算法非常耗时。利用神经网络的图像分割,是一种有监督的机 器学习方法。通过将待分割图像输入预训练的模型,即可得到分割结果,这使得在测试 阶段的分割时间大大提升,并且能够处理更为复杂的图像分割任务。但是,目前广泛利 用的分割网络FCN由于池化层的降采样操作,使得得到的分割结果在边缘精度上表现不 佳。此外,像U-Net和SegNet虽然通过改进网络结构,在分割精度上有了很大提升,但 由于此类网络是基于像素的语义分割网络,其分割结果存在对于个别像素语义信息分类 错误的情况,因其较小的感受野,也没有很好地考虑其较大邻域的信息。
发明内容
本发明的目的是为了克服现有技术的上述缺陷而提出了一种基于超像素和长短时记 忆网络(Long Short-Term Memory,LSTM)的图像分割方法,该方法利用超像素对图像进 行预分割,通过训练LSTM对超像素块进行分类,实现图像分割。引入超像素解决了传 统分割网络对于空间边缘分割精度不足的问题,同时利用LSTM对于序列特征数据分类 的特点,融合了超像素块的邻域信息,在提高分割性能的同时也提高了分割的时间性能。
实现本发明目的的具体技术方案是:
一种基于超像素和长短时记忆网络的图像分割方法,该方法分为训练和测试两个阶 段,包括如下步骤:
步骤a:对图像训练集进行预处理;
步骤b:利用一种超像素分割算法进行预分割,去除作为背景的超像素块,构建超像 素图;
步骤c:根据超像素图构建适用于LSTM输入的特征序列训练集和真值集;
步骤d:训练LSTM分类模型;
步骤e:对待分割的测试图像,重复步骤a-c,将构建的特征序列输入已训练的LSTM模型,得到超像素块分类结果,将分类结果还原得到分割结果。
本发明提出的所述基于超像素和长短时记忆网络的图像分割方法中,所述步骤a中 预处理为对全部训练图像进行灰度拉伸变换。
本发明提出的所述基于超像素和长短时记忆网络的图像分割方法中,所述步骤b中 构建超像素图包括如下步骤:
步骤b1:对于所有的预处理后的训练图像,利用一种超像素分割算法(如SLIC)进行预分割,得到超像素块的预分割图像;
步骤b2:根据预分割图和超像素块的数量建立邻接矩阵,将每一块超像素区域作为 图的节点,空间上相邻的超像素块间用边连接,从而构建超像素图。
本发明提出的所述基于超像素和长短时记忆网络的图像分割方法中,所述步骤c中 根据超像素图构建适用于LSTM输入的特征序列训练集和真值集包括如下步骤:
步骤c1:对于每一张训练图像的每一个超像素节点,构建D×Q的特征序列,作为输入LSTM的训练样本;其中D为特征维数,Q为序列数;
步骤c2:对于每一张训练图像,根据该图的分割真值,构建真值向量;
步骤c3:对于整个训练集,重复步骤c1和c2,构建特征序列训练集和分割真值集。
本发明提出的所述基于超像素和LSTM的图像分割方法中,所述步骤d中训练LSTM模型包括如下步骤:
步骤d1:初始化LSTM网络结构;设置LSTM隐藏单元的数量numHiddemUnits = 40,分割类别数量numClass=4,特征维数D=1,最大迭代轮数maxEpoch=40,批 大小miniBatchSize =512,以及选择使用随机梯度下降作为优化算法,选择交叉熵损 失作为损失函数;
步骤d2:将c3中所得的特征序列训练集和分割真值集作为LSTM网络的输入,开始训练LSTM模型。训练过程为迭代过程:每一次迭代通过前向传播计算交叉熵损失,最 小化目标函数,并反向传播更新模型参数。
本发明提出的所述基于超像素和LSTM的图像分割方法中,所述步骤e中对待分割测试图像得到分割结果包括如下步骤:
步骤e1:测试阶段,对于一张待分割的测试图像,重复步骤a-c,从而构建该图的特征序列,将其作为步骤d中训练所得的LSTM模型的输入,得到超像素节点的分类结果;
步骤e2:将超像素块分类结果对应到原图中超像素块所在的区域,用分类所得的类 别编号作为该区域像素的值,得到分割结果。
本发明主要研究的是图像分割算法。本发明的有益效果在于:本发明是在超像素层 面的图像分割算法,引入超像素在一定程度上提高了空间边缘的分割精度,同时也提高了分割速度;同时,利用LSTM网络对于序列特征数据分类的特点,使得输入的特征序 列可以充分利用超像素块的邻域信息,提高分割精度。本发明解决了传统基于聚类分割 算法(如K-menas,FCM,SOM等)因为多次迭代而导致分割时间过长的问题,同时也解 决了基于卷积神经网络的语义分割方法(如FCN,U-Net,SegNet等)因为降采样而导致 分割边缘精度不佳的问题。
附图说明
图1是本发明基于超像素和长短时记忆网络的图像分割方法的流程图,包括训练和 测试两个阶段;
图2是实施例中原始的脑图像灰度图;
图3是实施例中原始脑图像经过灰度拉伸之后的图像;
图4是实施例预分割图像;其中,(a)是实施例中经过超像素分割后得到的预分割图像; (b)是实施例中对超像素预分割图像去除背景后的预分割图像;
图5是实施例中构建的特征序列的原理图;
图6是LSTM分类网络的结构图;
图7是分割结果图;其中,(a)是待分割图像割图像的真实分割结果;(b)是用本发明 得到的分割结果;(c)是用FCN-8s网络得到的分割结果;(d)是用U-Net网络得到的分割结 果;(e)是用SegNet网络得到的分割结果。
具体实施方式
结合以下具体实施例和附图,对本发明做进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识, 本发明没有特别限制内容。
本发明中涉及的一些数学符号的解释如下:
训练样本数量N;
训练样本集Ii为训练集中第i个样本的原始灰 度图像,Hi和Wi分别为第个训练样本的高和宽;
训练集中第i个样本经灰度拉伸后的图像Ii′;
训练集中第i个样本经SLIC超像素预分割后得到的标签矩阵Li
训练集中第i个样本经在去除背景后得超像素分割标签图L′i,所得超像素数量
训练集中第i个样本的真值标签图9i
特征序列训练集Xtrain
分割真值集合Ytrain
参阅图1,本发明的流程分为训练阶段和测试阶段。在实施例中,本发明以脑图像分 割为例,选用BrainWeb脑图像公共数据库中图像构建训练样本集选取训练样本数N=239,用于训练LSTM模型。在本实施例中,需要将脑图像划分为灰质(Gray Matter,GM)、白质(White Matter,WM)、脑脊液(Cerebro-Spinal Fluid,CSF)和背景(Background,BG)共四类,每类用不同颜色加以标注,用以可视化分割结果。本发明基于超像素和长 短期记忆网络的图像分割方法具体步骤如下:
步骤a:对图像训练集进行预处理。对于全部训练图像进行灰度拉伸变换。灰度拉伸 的目的是增强图像的对比度,使得每张图像的灰度值分布在0-255之间。即对于每一个灰 度值为x的像素,灰度拉伸变换如下:
x′=a+(x-c)×F(1)
式中,F=(b-a)/(d-c)为比例系数,a和b分别为拉伸后图像中的最小灰度值和 最大灰度值c和d分别为原始图像中的最小值和最大值。记变换之后的图像为 Ii′,i=1,2,…,N。在本实施例中,图2为一张原始脑图像,图3为经过灰度拉伸变换之后 的图像。
步骤b:利用一种超像素分割算法进行预分割,针对脑图像分割,进一步去除作为背 景的超像素块,构建超像素图。本发明采用简单线性迭代聚类(Simple lineariterative clustering,SLIC)的超像素分割算法对图像进行预分割。超像素是指图像中具有相似纹理、 颜色、亮度等特征的相邻像素构成的有一定视觉意义的不规则像素块,SLIC通过在聚类 中心邻域搜索迭代的方法生成超像素,其生成的超像素块能够较好地保持图像中不同物 体的边缘信息。记SLIC超像素分割如公式(2)所示:
Li=SLIC(Ii,numSuperpixels ,compactness),i=1,2,…,N (2)
其中,为标签矩阵,标量参数numSuperpixels为所需要的超像素数量,本例中取numSuperpixels=2500,参数compactness为超像素的形状,其值大小控制了 超像素的紧凑型,值越大,超像素的形状越规则,其值越小,超像素形状越不规则,边 缘粘附性越强,本例中取compactness=10。图4(a)显示了SLIC的分割结果。
由于超像素分割结果中存在不少超像素块为背景区域,在本实施例中通过设定阈值T 进一步将背景超像素块去除。由此,可以去除绝大部分背景超像素块,从而节约训练和测试时间。如式(3)所示,定义一个二值矩阵Bi,对Li去除作为背景的超像素块,得到 新的标签矩阵L′i
式中,Bi为去除背景后的二值矩阵,背景元素被置0,其余元素被置为1, 图4(b)显示了背景去除后SLIC的超像素分割结 果。
根据预分割图L′i和超像素块的数量建立邻接矩阵A,将每一块超像素区域作为图的节 点,空间上相邻的超像素块间用边连接,从而构建超像素图G(V,E),其中L′(h,w)中为0 的像素为背景,将不作为图的一部分。
步骤c:根据超像素图构建适用于LSTM输入的特征序列训练集Xtrain和真值集Ytrain, 其定义如式(4)所示。
其中,表示第i个训练样本中第k个超像素节点构成的特征序列,D为特征维 数,Qi,k为序列长度,为其对应的真值。为第i个超像素图中的节点数量。
参阅图5,对于特征序列Ci,k的构建,进一步来说,由式(5)所示:
Ci,k由两部分构成: 表示当前节点的特征向量, 表示与该节点相连的邻域节点构成的特征序列。Ni,k为与该节点相邻节点的数量。 本发明中,取D=1,则的计算由式(6)表示:
式中,特征由该节点区域内像素的平均值计算所得,Ri,k表示第i个训练样本中 第k个超像素节点所在的图像区域。由当前节点相邻节点依次排列构成,每一个 邻接节点的特征由该节点区域内像素的最大值计算所得,表示第i个训练样本中第k个 超像素节点的第m个邻接节点所在的图像区域。
对于真值yi,k的构建,由式(7)所示:
其中,Pi(h,w)表示对应第i个训练样本Ii的真值标签图,在本实施例中,Pi(h,w)的取值为{1,2,3,4},分别对应于脑图像中背景、脑脊液、灰质和白质四种类别。mode(·) 表示计算当前节点区域内元素的众数。
步骤d:训练LSTM分类模型。LSTM网络可以处理输入训练样本为序列的数据, 并且样本序列的长度式可变的,相比于一般的循环网络模型,LSTM解决了训练过程中 梯度消失和梯度爆炸的问题。LSTM通常用来处理时间序列的数据,而在本发明中,将 超像素节点和它邻域节点的特征构建成特征序列Ci,k作为LSTM模型的一个输入样本,这 样做能够较好地利用超像素点周围邻域的信息,提高LSTM作为分类网络的准确率。参 阅图6,先将特征序列作为LSTM的输入,经过LSTM单元(LSTM Cell)输出最后一个 序列的结果,然后经过一个全连接层和Softmax层,最后输出长度为4(类别数)的向量。
本发明中使用的基本的LSTM网络结构定义如下:在一个LSTM单元中,LSTM接 受当前的特征向量xi作为输入,并输出隐藏状态和单元状态 作为下一阶段的输入,其中d为输出向量维数。LSTM网络包含三个门:输 入门(input gate)gi,遗忘门(forget gate)gf和输出门(output gate)go,还有一个控制门gg, Wi,Wf,Wo,Wg分别为对应的权重矩阵。记Hi由当前阶段输入特征向量xi和上一阶段输出隐藏状态hi拼接而成,那么输出的隐藏状态hi+1和单元状态ci+1可以通过公式(8)更新:
式中σ表示sigmoid函数,⊙表示对应元素相乘。为了用更简单的形式表示上述公式, 记W为四个权重矩阵的组合,用LSTM(·)的形式将公式(8)简写为公式(9)的形式:
(hi+1,ci+1)=LSTM(Hi,ci,W) (9)
在本实施例中,在初始化LSTM网络结构时,设置LSTM隐藏单元的数量numHiddemUnits=40,分割类别数量numClass=4,特征维数d=1,最大迭代轮 数maxEpoch=40,批大小miniBatchSize =512,以及选择使用随机梯度下降(SGD) 作为优化算法,选择交叉熵损失作为损失函数。训练过程为迭代过程:每一次迭代通过 前向传播计算交叉熵损失,最小化目标函数,并反向传播更新模型参数,最终得到LSTM 分类模型。
步骤e:对待分割的测试图像,重复步骤a-c,将构建的特征序列输入已训练的LSTM模型,得到超像素块分类结果,将分类结果还原得到分割结果。该步骤进一步包括如下 步骤:
(e1)重复步骤a-c,从而该图的构建特征序列,将其作为步骤d中训练所得的LSTM分类模型的输入,得到超像素节点的分类结果;
(e2)将超像素块分类结果对应到原图中超像素块所在的区域,用分类所得的类别编号 作为该区域像素的值,得到分割结果。
为了比较本发明与其它神经网络和传统聚类算法在图像分割上的优劣性,经本发明 分割后的图像如图7(b)所示,图7(a)为分割真实结果,图7(c),图7(d)和图7 (e)分别表示用FCN-8s,U-Net和SegNet三种常用的基于卷积神经网络分割模型得到的 结果。通过对比发现,本发明有效地保留了物体边缘信息,取得了较好的分割准确率, 而通过卷积神经网络如FCN-8s的分割结果在边缘精度上明显不足,此外,像U-Net和 SegNet网络虽然通过改进网络结构,在分割精度上有了很大提升,但由于此类网络是基 于像素的语义分割网络,其分割结果存在对于个别像素语义信息分类错误的情况,因其 较小的感受野,没有很好地考虑其较大邻域的信息。在与传统聚类算法比较上,本发明 方法在时间上有了很大提升,而传统聚类算法如K-means,FCM等方法则要花费更多的时 间。
本发明的保护内容不局限于以上实施例。在不背离发明构思的精神和范围下,本领 域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求书为保 护范围。

Claims (6)

1.一种基于超像素和长短时记忆网络的图像分割方法,其特征在于,分为训练和测试两个阶段,包括如下步骤:
步骤a:对图像训练集进行预处理;
步骤b:利用一种超像素分割算法进行预分割,去除作为背景的超像素块,构建超像素图;
步骤c:根据超像素图构建适用于LSTM输入的特征序列训练集和真值集;
步骤d:训练LSTM模型;
步骤e:对待分割的测试图像,重复步骤a-c,将构建的特征序列输入已训练的LSTM模型,得到超像素块分类结果,将分类结果还原得到分割结果。
2.如权利要求1所述的基于超像素和长短时记忆网络的图像分割方法,其特征在于,所述步骤a中预处理为对全部训练图像进行灰度拉伸变换。
3.如权利要求1所述的基于超像素和长短时记忆网络的图像分割方法,其特征在于,所述步骤b中构建超像素图包括如下步骤:
步骤b1:对于所有的预处理后的训练图像,利用超像素分割算法进行预分割,得到超像素块的预分割图像;
步骤b2:根据预分割图和超像素块的数量建立邻接矩阵,将每一块超像素区域作为图的节点,空间上相邻的超像素块间用边连接,从而构建超像素图。
4.如权利要求1所述的基于超像素和长短时记忆网络的图像分割方法,其特征在于,所述步骤c中根据超像素图构建适用于LSTM输入的特征序列训练集和真值集包括如下步骤:
步骤c1:对于每一张训练图像的每一个超像素节点,构建D×Q的特征序列,作为输入LSTM的训练样本;其中D为特征维数,Q为序列数;
步骤c2:对于每一张训练图像,根据该图的分割真值,构建真值向量;
步骤c3:对于整个训练集,重复步骤c1和c2,构建特征序列训练集和分割真值集。
5.如权利要求1所述的基于超像素和长短时记忆网络的图像分割方法,其特征在于,所述步骤d中训练LSTM模型包括如下步骤:
步骤d1:初始化LSTM网络结构;设置LSTM隐藏单元的数量numHiddemUnits=40,分割类别数量numClass=4,特征维数D=1,最大迭代轮数maxEpoch=40,批大小miniBatchSize=512,以及选择使用随机梯度下降作为优化算法,选择交叉熵损失作为损失函数;
步骤d2:将c3中所得的特征序列训练集和分割真值集作为LSTM网络的输入,开始训练LSTM模型。训练过程为迭代过程:每一次迭代通过前向传播计算交叉熵损失,最小化目标函数,并反向传播更新模型参数。
6.如权利要求1所述的基于超像素和长短时记忆网络的图像分割方法,其特征在于,所述步骤e具体包括如下步骤:
步骤e1:测试阶段,对于一张待分割的测试图像,重复步骤a-c,从而构建该图的特征序列,将其作为步骤d中训练所得的LSTM模型的输入,得到超像素节点的分类结果;
步骤e2:将超像素块分类结果对应到原图中超像素块所在的区域,用分类所得的类别编号作为该区域像素的值,得到分割结果。
CN201811560271.7A 2018-12-20 2018-12-20 一种基于超像素和长短时记忆网络的图像分割方法 Active CN109741341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811560271.7A CN109741341B (zh) 2018-12-20 2018-12-20 一种基于超像素和长短时记忆网络的图像分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811560271.7A CN109741341B (zh) 2018-12-20 2018-12-20 一种基于超像素和长短时记忆网络的图像分割方法

Publications (2)

Publication Number Publication Date
CN109741341A true CN109741341A (zh) 2019-05-10
CN109741341B CN109741341B (zh) 2022-11-01

Family

ID=66360722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811560271.7A Active CN109741341B (zh) 2018-12-20 2018-12-20 一种基于超像素和长短时记忆网络的图像分割方法

Country Status (1)

Country Link
CN (1) CN109741341B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414481A (zh) * 2019-08-09 2019-11-05 华东师范大学 一种基于Unet和LSTM的3D医学影像识别和分割方法
CN112036466A (zh) * 2020-08-26 2020-12-04 长安大学 一种混合地形分类方法
CN112132842A (zh) * 2020-09-28 2020-12-25 华东师范大学 一种基于seeds算法和gru网络的脑图像分割方法
CN112217958A (zh) * 2020-09-15 2021-01-12 陕西科技大学 与设备颜色空间无关的数字水印载体图像预处理的方法
GB2585933A (en) * 2019-07-25 2021-01-27 Bae Systems Plc System and method for processing images
CN113470045A (zh) * 2021-06-16 2021-10-01 浙江工业大学 一种基于超像素统计特征和图注意力网络的口腔cbct图像分割方法
CN113470046A (zh) * 2021-06-16 2021-10-01 浙江工业大学 一种面向医学图像超像素灰度纹理采样特征的图注意力网络分割方法
CN113570610A (zh) * 2021-07-26 2021-10-29 北京百度网讯科技有限公司 采用语义分割模型对视频进行目标分割的方法、装置
WO2023137916A1 (zh) * 2022-01-21 2023-07-27 平安科技(深圳)有限公司 基于图神经网络的图像场景分类方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709924A (zh) * 2016-11-18 2017-05-24 中国人民解放军信息工程大学 基于深度卷积神经网络和超像素的图像语义分割方法
CN106970615A (zh) * 2017-03-21 2017-07-21 西北工业大学 一种深度强化学习的实时在线路径规划方法
US20180082172A1 (en) * 2015-03-12 2018-03-22 William Marsh Rice University Automated Compilation of Probabilistic Task Description into Executable Neural Network Specification
US20180101726A1 (en) * 2016-10-10 2018-04-12 Insurance Services Office Inc. Systems and Methods for Optical Character Recognition for Low-Resolution Documents
US20180268548A1 (en) * 2017-03-14 2018-09-20 Adobe Systems Incorporated Automatically segmenting images based on natural language phrases
CN108717856A (zh) * 2018-06-16 2018-10-30 台州学院 一种基于多尺度深度卷积循环神经网络的语音情感识别方法
CN108876797A (zh) * 2018-06-08 2018-11-23 长安大学 一种基于Spiking-SOM神经网络聚类的图像分割系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180082172A1 (en) * 2015-03-12 2018-03-22 William Marsh Rice University Automated Compilation of Probabilistic Task Description into Executable Neural Network Specification
US20180101726A1 (en) * 2016-10-10 2018-04-12 Insurance Services Office Inc. Systems and Methods for Optical Character Recognition for Low-Resolution Documents
CN106709924A (zh) * 2016-11-18 2017-05-24 中国人民解放军信息工程大学 基于深度卷积神经网络和超像素的图像语义分割方法
US20180268548A1 (en) * 2017-03-14 2018-09-20 Adobe Systems Incorporated Automatically segmenting images based on natural language phrases
CN106970615A (zh) * 2017-03-21 2017-07-21 西北工业大学 一种深度强化学习的实时在线路径规划方法
CN108876797A (zh) * 2018-06-08 2018-11-23 长安大学 一种基于Spiking-SOM神经网络聚类的图像分割系统及方法
CN108717856A (zh) * 2018-06-16 2018-10-30 台州学院 一种基于多尺度深度卷积循环神经网络的语音情感识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LIANG X D等: "Semantic object parsing with graph LSTM", 《BERLIN,GERMANY:SPRINGER》 *
刘云鹏等: "应用图像块和全卷积神经网络的肩关节MRI自动分割", 《中国图象图形学报》 *
张士杰: "超像素级图像组协同关联性分析与研究", 《中国博士学位论文全文数据库(电子期刊)》 *
田娟秀等: "医学图像分析深度学习方法研究与挑战", 《自动化学报》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2585933A (en) * 2019-07-25 2021-01-27 Bae Systems Plc System and method for processing images
GB2585933B (en) * 2019-07-25 2023-07-19 Bae Systems Plc System and method for processing images
CN110414481A (zh) * 2019-08-09 2019-11-05 华东师范大学 一种基于Unet和LSTM的3D医学影像识别和分割方法
CN112036466A (zh) * 2020-08-26 2020-12-04 长安大学 一种混合地形分类方法
CN112217958A (zh) * 2020-09-15 2021-01-12 陕西科技大学 与设备颜色空间无关的数字水印载体图像预处理的方法
CN112132842A (zh) * 2020-09-28 2020-12-25 华东师范大学 一种基于seeds算法和gru网络的脑图像分割方法
CN113470045A (zh) * 2021-06-16 2021-10-01 浙江工业大学 一种基于超像素统计特征和图注意力网络的口腔cbct图像分割方法
CN113470046A (zh) * 2021-06-16 2021-10-01 浙江工业大学 一种面向医学图像超像素灰度纹理采样特征的图注意力网络分割方法
CN113470045B (zh) * 2021-06-16 2024-04-16 浙江工业大学 一种基于超像素统计特征和图注意力网络的口腔cbct图像分割方法
CN113470046B (zh) * 2021-06-16 2024-04-16 浙江工业大学 一种面向医学图像超像素灰度纹理采样特征的图注意力网络分割方法
CN113570610A (zh) * 2021-07-26 2021-10-29 北京百度网讯科技有限公司 采用语义分割模型对视频进行目标分割的方法、装置
CN113570610B (zh) * 2021-07-26 2022-05-13 北京百度网讯科技有限公司 采用语义分割模型对视频进行目标分割的方法、装置
WO2023137916A1 (zh) * 2022-01-21 2023-07-27 平安科技(深圳)有限公司 基于图神经网络的图像场景分类方法及装置

Also Published As

Publication number Publication date
CN109741341B (zh) 2022-11-01

Similar Documents

Publication Publication Date Title
CN109741341A (zh) 一种基于超像素和长短时记忆网络的图像分割方法
CN112308158B (zh) 一种基于部分特征对齐的多源领域自适应模型及方法
CN108717568B (zh) 一种基于三维卷积神经网络的图像特征提取与训练方法
CN107506761B (zh) 基于显著性学习卷积神经网络的脑部图像分割方法及系统
CN110210486B (zh) 一种基于素描标注信息的生成对抗迁移学习方法
CN105205448B (zh) 基于深度学习的文字识别模型训练方法和识别方法
CN107729819B (zh) 一种基于稀疏全卷积神经网络的人脸标注方法
WO2018052587A1 (en) Method and system for cell image segmentation using multi-stage convolutional neural networks
CN105701480B (zh) 一种视频语义分析方法
CN107480726A (zh) 一种基于全卷积和长短期记忆单元的场景语义分割方法
CN109508655A (zh) 基于孪生网络的不完备训练集的sar目标识别方法
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
CN106920243A (zh) 改进的全卷积神经网络的陶瓷材质件序列图像分割方法
CN109948029A (zh) 基于神经网络自适应的深度哈希图像搜索方法
CN109102014A (zh) 基于深度卷积神经网络的类别不平衡的图像分类方法
CN108647595B (zh) 基于多属性深度特征的车辆重识别方法
CN112734775A (zh) 图像标注、图像语义分割、模型训练方法及装置
CN110363253A (zh) 一种基于卷积神经网络的热轧带钢表面缺陷分类方法
CN112364791B (zh) 一种基于生成对抗网络的行人重识别方法和系统
CN109886161A (zh) 一种基于可能性聚类和卷积神经网络的道路交通标识识别方法
CN109214298A (zh) 一种基于深度卷积网络的亚洲女性颜值评分模型方法
CN111695640B (zh) 地基云图识别模型训练方法及地基云图识别方法
CN111161244B (zh) 基于FCN+FC-WXGBoost的工业产品表面缺陷检测方法
CN112733602B (zh) 关系引导的行人属性识别方法
CN111611972A (zh) 基于多视图多任务集成学习的作物叶片种类识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant