CN109635812A - 图像的实例分割方法及装置 - Google Patents

图像的实例分割方法及装置 Download PDF

Info

Publication number
CN109635812A
CN109635812A CN201811443298.8A CN201811443298A CN109635812A CN 109635812 A CN109635812 A CN 109635812A CN 201811443298 A CN201811443298 A CN 201811443298A CN 109635812 A CN109635812 A CN 109635812A
Authority
CN
China
Prior art keywords
image
split
network
interest
resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811443298.8A
Other languages
English (en)
Other versions
CN109635812B (zh
Inventor
许乐乐
李叶
郭丽丽
阎镇
饶骏
金山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technology and Engineering Center for Space Utilization of CAS
Original Assignee
Technology and Engineering Center for Space Utilization of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Technology and Engineering Center for Space Utilization of CAS filed Critical Technology and Engineering Center for Space Utilization of CAS
Priority to CN201811443298.8A priority Critical patent/CN109635812B/zh
Publication of CN109635812A publication Critical patent/CN109635812A/zh
Application granted granted Critical
Publication of CN109635812B publication Critical patent/CN109635812B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本发明公开了图像的实例分割方法及装置,涉及图像处理领域。该方法包括:建立图像分割模型,图像分割模型包括4个依次连接的子神经网络,依次为双路径增强卷积网络、感兴趣区推荐网络、超分辨率生成对抗网络和分割网络;对图像分割模型进行训练;将待分割图像输入到训练后的图像分割模型中,依次通过4个子神经网络对图像进行处理,得到待分割图像的实例分割结果。本发明提供的实例分割方法及装置,可提高对植物图像在复杂背景及目标小尺度情况下的实例分割能力。

Description

图像的实例分割方法及装置
技术领域
本发明涉及图像处理领域,尤其涉及一种图像的实例分割方法及装置。
背景技术
随着生物科学的发展,植物科学家越来越多的关注植物的表型特征,比如植物的叶片数目、株高、叶长、叶宽、叶面积等,它们是由基因型和环境因素交互作用的结果。通过表型分析技术,科学家能够持续准确的量化环境因素与基因型的交互作用,了解植物的生长发育规律,促进育种和培养技术。
基于图像的实例分割由于能够区分同一类别的不同目标,因而在表型分析技术中具有很广泛的应用前景。
目前,深度学习方法已用于图像实例分割,比如Mask R-CNN,然而,在面对复杂背景及目标小尺度情况下的植物图像,现有实例分割方法存在很多不足。其中,复杂背景对植物叶片分割带来较大的干扰,导致分割准确度较低,比如实验对象交叠等;目标小尺度易导致实验对象细节缺失,现有技术无法实现植物图像的精细实例分割。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种图像的实例分割方法、一种图像的实例分割装置及一种存储介质。
本发明解决上述技术问题的技术方案如下:
一种图像的实例分割方法,包括:
建立图像分割模型,所述图像分割模型包括4个依次连接的子神经网络,依次为双路径增强卷积网络、感兴趣区推荐网络、超分辨率生成对抗网络和分割网络;
对所述图像分割模型进行训练;
将待分割图像输入到训练后的所述图像分割模型中,依次通过4个所述子神经网络对所述图像进行处理,得到所述待分割图像的实例分割结果。
本发明的有益效果是:本发明提供的实例分割方法,通过采用多个结构不同的子神经网络构建具有级联结构的图像分割模型,在通过图像分割模型级联进行训练和识别,由于级联模型可分别具有多层级强外观-语义特征的特点、多尺度感兴趣区的特点、超分辨率特征的特点以及逐像素实例分割的特点,从而可提高对植物图像在复杂背景及目标小尺度情况下的实例分割能力。
本发明解决上述技术问题的另一种技术方案如下:
一种图像的实例分割装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,实现如上述技术方案所述的实例分割方法。
本发明解决上述技术问题的另一种技术方案如下:
一种存储介质,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如上述技术方案所述的实例分割方法。
本发明附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。
附图说明
图1为本发明实例分割方法的实施例提供的流程示意图;
图2为本发明实例分割方法的实施例提供的图像分割模型结构框架示意图;
图3为本发明实例分割方法的其他实施例提供的双路径增强卷积网络结构框架示意图;
图4为本发明实例分割方法的其他实施例提供的感兴趣区推荐网络结构框架示意图;
图5为本发明实例分割方法的其他实施例提供的超分辨率生成对抗网络结构框架示意图;
图6为本发明实例分割方法的其他实施例提供的分割网络结构框架示意图;
图7为本发明实例分割装置的实施例提供的结构框架示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实施例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,为本发明实例分割方法的实施例提供的流程示意图,该实例分割方法包括:
S1,建立图像分割模型。
所述图像分割模型包括4个依次连接的子神经网络,依次为双路径增强卷积网络N1、感兴趣区推荐网络N2、超分辨率生成对抗网络N3和分割网络N4。
应理解,这些子神经网络都包括卷积层、采样层、全连接层等结构,这些子神经网络的具体结构可以根据实际需求设置。
其中,双路径增强卷积网络N1能够提取具有强外观-语义信息的多层次特征,可以有效抑制复杂背景的干扰;感兴趣区推荐网络N2能够基于多层次特征提取多尺度感兴趣区,有效识别出小尺度感兴趣图像块;超分辨率生成对抗网络N3能够提升小尺度感兴趣图像块的分辨率,解决小尺度特征提取难题;分割网络N4可以并行实现感兴趣区的类别、边框以及像素级分割,提升分割效率和精度。
通过结合各种子网络的优点,使得基于图像分割模型的图像实例分割方法能够同时实现复杂背景及目标小尺度情况下图像的有效实例分割。
下面给出一种可能的图像分割模型的结构。
例如,如图2所示,为本发明实例分割方法的实施例提供的图像分割模型结构框架示意图,相加层用虚线表示,所述双路径增强卷积网络N1可以包括依次设置的至少四个卷积层C1 1、C5 1、C9 1、C13 1,两个下采样层P2 1、P4 1,一个上采样层U2 1,两个相加层A2 1、A4 1;所述感兴趣区推荐网络N2可以包括依次设置的至少两个卷积层C1 2、C5 2,四个全连接层FC1 2、FC2 2、FC5 2、FC6 2;所述超分辨率生成对抗网络N3可以包括依次设置的至少三个卷积层C1 3、C5 3、C9 3,一个上采样层U1 3,一个全连接层FC1 3;所述分割网络N4可以包括依次设置的至少四个卷积层C1 4、C2 4、C4 4、S1 4,两个全连接层FC1 4、FC2 4
其中,由感兴趣区推荐网络N2输入超分辨率生成对抗网络N3感兴趣区域(regionof interest,ROI),是输入到卷积层C1 3,即低分辨率ROI入口,在训练过程中,可以分别向超分辨率生成对抗网络N3的卷积层C1 3输入低分辨率图像,向超分辨率生成对抗网络N3的卷积层C9 3输入高分辨率图像。
在超分辨率生成对抗网络N3中,由卷积层C1 3、上采样层U1 3和卷积层C5 3构成生成网络,由卷积层C9 3和全连接层FC1 3构成判别网络。
需要说明的是,C代表卷积核为3*3的卷积层,S代表卷积核为1*1的卷积层,卷积层C是为了中间层提取特征,卷积层S是为了计算分割得分图。
在双路径增强卷积网络N1中,还可表示为卷积层{Ci 1,i=1,…,nc 1,nc 1≥4},下采样层{Pi 1,i=1,…,np 1,np 1≥2},上采样层{Ui 1,i=1,…,nu 1,nu 1≥1},相加层{Ai 1,i=1,…,na 1,na 1≥2}。
其中,i为变量,nc 1表示卷积层的层数,np 1表示下采样层的层数,nu 1表示上采样层的层数,na 1表示相加层的层数。
在感兴趣区推荐网络N2中,还可表示为卷积层{Ci 2,i=1,…,nc 2,nc 2≥2},全连接层{FCi 2,i=1,…,nfc 2,nfc 2≥4}。
其中,i为变量,nc 2表示卷积层的层数,nfc 2表示全连接层的层数。
在超分辨率生成对抗网络N3中,还可表示为卷积层{Ci 3,i=1,…,nc 3,nc 3≥3},上采样层{Ui 3,i=1,…,nu 3,nu 3≥1},全连接层{FCi 3,i=1,…,nfc 3,nfc 3≥1}。
其中,i为变量,nc 3表示卷积层的层数,nu 3表示上采样层的层数,nfc 3表示全连接层的层数。
在分割网络N4中,还可表示为卷积层{Ci 4或Si 4,i=1,…,nc 4,nc 4≥4},全连接层{FCi 4,i=1,…,nfc 4,nfc 4≥2}。
其中,i为变量,nc 4表示卷积层的层数,nfc 4表示全连接层的层数。
S2,对所述图像分割模型进行训练。
需要说明的是,由于超分辨率生成对抗网络N3是为了提升小尺度感兴趣图像块的分辨率,因此,可以选择相同图像的高分辨率和低分辨率图像作为训练集,首先对超分辨率生成对抗网络N3进行训练。
优选地,为了使图像分割模型对待分割的目标更敏感更精确,可以选择特定的目标的高分辨率和低分辨率图像作为训练集。
例如,以植物叶片为例,当需要对植物叶片进行实例分割时,可以预先选取植物叶片的高分辨率和低分辨率图像作为训练集,以提高模型的精确度。
S3,将待分割图像输入到训练后的所述图像分割模型中,依次通过4个所述子神经网络对所述图像进行处理,得到所述待分割图像的实例分割结果。
例如,假设是对植物的叶片进行实例分割,那么待分割图像的实例分割结果可以为每个叶片在待处理图像中的位置坐标,以及每个叶片的像素级分割得分图。
需要说明的是,像素级指的是分割得分图是像素尺度上的分割得分图,单位可以为像素。
本实施例提供的实例分割方法,通过采用多个结构不同的子神经网络构建具有级联结构的图像分割模型,在通过图像分割模型级联进行训练和识别,由于级联模型可分别具有多层级强外观-语义特征的特点、多尺度感兴趣区的特点、超分辨率特征的特点以及逐像素实例分割的特点,从而可提高对植物图像在复杂背景及目标小尺度情况下的实例分割能力。
可选地,在一些实施例中,对所述图像分割模型进行训练,具体包括:
获取第一训练集和第二训练集,其中,所述第一训练集为包含待分割目标的图像集,所述第二训练集为包含待分割目标的不同分辨率图像的图像对集;
根据所述第二训练集对所述超分辨率生成对抗网络N3进行训练,再根据所述第一训练集对所述图像分割模型进行训练。
需要说的是,不同分辨率图像中,以高分辨率图像作为训练的目的。
例如,以植物叶片为例,可以选取包含植物叶片的一组图像对,每个图像对包含两张图像,这两张图像的内容都是完全相同的,只不过一个图像的分辨率更高,一个图像的分辨率更低,这些图像对就可以作为第二训练集。
还可以选取一些植物叶片的图像,然后对植物叶片和背景进行标注,作为第一训练集。
可选地,在一些实施例中,获取第一训练集,具体包括:
获取至少一张包含待分割目标的图像;
将全部所述图像中的待分割目标和背景标注为两个不同的类别,并将不同的待分割目标标注为不同的子类别,得到第一训练集。
例如,以植物叶片为例,可以将叶片标注为一个类别,将背景标注为一个类别,对于不同的叶片,可以标注为叶片1、叶片2、叶片3、…、等。
可选地,在一些实施例中,获取第二训练集,具体包括:
获取至少一对包含待分割目标的不同分辨率图像的图像对;
将全部所述图像对中同一图像对的不同分辨率标注为两个不同的类别,得到第二训练集。
可选地,在一些实施例中,根据所述第二训练集对所述超分辨率生成对抗网络N3进行训练,再根据所述第一训练集对所述图像分割模型进行训练,具体包括:
根据所述第二训练集和预设的反向传播算法,对所述超分辨率生成对抗网络N3进行训练;
根据所述第一训练集和预设的反向传播算法,对所述图像分割模型进行训练。
可选地,在一些实施例中,将待分割图像输入到训练后的所述图像分割模型中,依次通过4个所述子神经网络对所述图像进行处理,得到所述待分割图像的实例分割结果,具体包括:
将待分割图像输入到训练后的所述图像分割模型中,通过所述双路径增强卷积网络N1对所述待分割图像进行逐层处理,得到所述待分割的图像的多层次特征;
通过所述感兴趣区推荐网络N2对所述多层次特征进行滑窗处理,得到多个感兴趣区;
通过所述超分辨率生成对抗网络N3对多个所述感兴趣区进行精细上采样处理,得到每个所述感兴趣区的超分辨率特征;
通过所述分割网络N4对所述超分辨率特征进行逐像素分割处理,得到所述待分割图像的实例分割结果。
需要说明的是,多层次特征为多层次的强外观-语义特征。
下面给出另一种可能的图像分割模型的结构。
例如,如图3所示,为本发明实例分割方法的其他实施例提供的双路径增强卷积网络N1结构框架示意图,所述双路径增强卷积网络N1包括依次设置的卷积层C1 1、卷积层C2 1、下采样层P1 1、卷积层C3 1、卷积层C4 1、下采样层P2 1、卷积层C5 1、卷积层C6 1、上采样层U1 1、相加层A1 1、卷积层C7 1、卷积层C8 1、上采样层U2 1、相加层A2 1、卷积层C9 1、卷积层C10 1、下采样层P3 1、相加层A3 1、卷积层C11 1、卷积层C12 1、下采样层P4 1、相加层A4 1和卷积层C13 1
也就是说,在双路径增强卷积网络N1中,共包括nc 1=13个卷积层,np 1=4个下采样层,nu 1=2个上采样层,na 1=4个相加层。
如图4所示,为本发明实例分割方法的其他实施例提供的感兴趣区推荐网络N2结构框架示意图,所述感兴趣区推荐网络N2包括依次设置的卷积层C1 2、卷积层C2 2、全连接层FC1 2、全连接层FC2 2、卷积层C3 2、卷积层C4 2、全连接层FC3 2、全连接层FC4 2、卷积层C5 2、卷积层C6 2、全连接层FC5 2和全连接层FC6 2
也就是说,在感兴趣区推荐网络N2中,共包括nc 2=6个卷积层,nfc 2=6个全连接层。
如图5所示,为本发明实例分割方法的其他实施例提供的超分辨率生成对抗网络N3结构框架示意图,所述超分辨率生成对抗网络N3包括依次设置的卷积层C1 3、卷积层C2 3、卷积层C3 3、卷积层C4 3、上采样层U1 3、上采样层U2 3、卷积层C5 3、卷积层C6 3、卷积层C7 3、卷积层C8 3、卷积层C9 3、卷积层C10 3、卷积层C11 3、卷积层C12 3、卷积层C13 3和全连接层FC1 3
也就是说,在超分辨率生成对抗网络N3中,共包括nc 3=13个卷积层,nu 3=2个上采样层,nfc 3=1个全连接层。
如图6所示,为本发明实例分割方法的其他实施例提供的分割网络N4结构框架示意图,所述分割网络N4包括依次设置的卷积层C1 4、卷积层C2 4、卷积层C3 4、全连接层FC1 4、全连接层FC2 4、卷积层C4 4、卷积层C5 4和卷积层S1 4
也就是说,在分割网络N4中,共包括nc 4=6个卷积层,nfc 4=2个全连接层。
其中,双路径增强卷积网络N1中的下采样层可以利用池化操作或带有步进大于1的卷积操作实现,对特征进行降维。双路径增强卷积网络N1、超分辨率生成对抗网络N3中的上采样层可以利用转置卷积操作或双线性插值操作或上池化操作实现,对特征进行升维。
需要说明的是,C代表卷积核为3*3的卷积层,S代表卷积核为1*1的卷积层,卷积层C是为了中间层提取特征,卷积层S是为了计算分割得分图。下面以植物叶片为例,对各个子神经网络进行说明。
双路径增强卷积网络N1中卷积层用于提取图像特征,下采样层用于对图像特征进行降维,上采样层用于对图像特征进行升维。该网络通过自底向上的特征降维可以得到语义信息丰富的顶层特征,进而通过自顶向上的特征升维将丰富的语义信息传至底层特征,最后通过自底向上的特征降维将丰富的底层外观信息传至顶层特征,使得不同层次的特征均包含丰富的外观-语义信息,从而有效抑制复杂背景的干扰。
感兴趣区推荐网络N2中卷积层用于提取图像特征,全连接层用于计算特征块是否包含叶片的得分以及可能包含叶片的位置坐标。该网络基于双路径增强卷积网络N1输出的多个不同层次特征,可以有效识别出不同尺度包括小尺度的感兴趣区。
超分辨率生成对抗网络N3中卷积层用于提取图像特征,上采样层用于对图像特征进行升维,全连接层用于计算判别网络中输入的特征是否为高分辨率特征的得分。该网络在预训练过程中通过生成网络和判别网络间的对抗学习,实现大尺度向小尺度目标的特征迁移,从而使生成网络生成包含目标细节的超分辨率特征。在生成网络中,通过卷积-上采样-卷积的逐层操作,不断提升特征分辨率并细化细节信息,解决小尺度特征提取难题。
分割网络N4中卷积层用于提取感兴趣区特征,全连接层用于计算感兴趣区的类别得分、位置坐标以及像素级分割得分图。该网络通过并行实现感兴趣区的类别、边框以及像素级分割,提升分割效率和精度。
级联各种子网络,使得基于深度特征增强和生成对抗网络的植物叶片实例分割方法能够同时实现复杂背景及目标小尺度情况下植物图像叶片的有效实例分割。
可选地,在一些实施例中,通过所述分割网络N4对所述超分辨率特征进行逐像素分割处理,得到所述待分割图像的实例分割结果,具体包括:
通过所述分割网络N4对所述超分辨率特征进行逐像素分割处理,得到每个所述感兴趣区的类别、坐标和像素级分割得分图;
对每个所述感兴趣区的类别进行判断,剔除所述类别为背景的感兴趣区域,保留所述类别为待分割目标的感兴趣区域;
将所述类别为待分割目标的感兴趣区域的坐标和像素级分割得分图作为所述待分割图像的实例分割结果。
可选地,在一些实施例中,通过所述感兴趣区推荐网络N2对所述多层次特征进行滑窗处理,得到多个感兴趣区,具体包括:
通过滑窗方式分别将所述多层次特征分成以每个像素为中心,n×n为大小的特征块,其中,n≥3;
将全部所述特征块输入到所述感兴趣区推荐网络N2中进行处理,得到每个所述特征块是否包含待分割目标的预测得分以及待分割目标的预测坐标,根据所述预测得分和所述预测坐标得到多个感兴趣区。
可以理解,在一些实施例中,可以包含如上述各实施例中的部分或全部步骤。
如图7所示,为本发明实例分割装置的实施例提供的结构框架示意图,该实例分割装置包括:
存储器1,用于存储计算机程序;
处理器2,用于执行所述计算机程序,实现如上述实施例中任一项所述的实例分割方法。
需要说明的是,本实施例是与上述各方法实施例对应的产品实施例,对于本实施例中各结构及可选实施方式的说明可以参考上述各方法实施例中的对应说明,在此不再赘述。
在本发明的其他实施例中,还提供一种存储介质,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如上述实施例中任一项所述的实例分割方法。
读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种图像的实例分割方法,其特征在于,包括:
建立图像分割模型,所述图像分割模型包括4个依次连接的子神经网络,依次为双路径增强卷积网络、感兴趣区推荐网络、超分辨率生成对抗网络和分割网络;
对所述图像分割模型进行训练;
将待分割图像输入到训练后的所述图像分割模型中,依次通过4个所述子神经网络对所述图像进行处理,得到所述待分割图像的实例分割结果。
2.根据权利要求1所述的实例分割方法,其特征在于,对所述图像分割模型进行训练,具体包括:
获取第一训练集和第二训练集,其中,所述第一训练集为包含待分割目标的图像集,所述第二训练集为包含待分割目标的不同分辨率图像的图像对集;
根据所述第二训练集对所述超分辨率生成对抗网络进行训练,再根据所述第一训练集对所述图像分割模型进行训练。
3.根据权利要求2所述的实例分割方法,其特征在于,获取第一训练集,具体包括:
获取至少一张包含待分割目标的图像;
将全部所述图像中的待分割目标和背景标注为两个不同的类别,并将不同的待分割目标标注为不同的子类别,得到第一训练集。
4.根据权利要求2或3所述的实例分割方法,其特征在于,获取第二训练集,具体包括:
获取至少一对包含待分割目标的不同分辨率图像的图像对;
将全部所述图像对中同一图像对的不同分辨率标注为两个不同的类别,得到第二训练集。
5.根据权利要求4所述的实例分割方法,其特征在于,根据所述第二训练集对所述超分辨率生成对抗网络进行训练,再根据所述第一训练集对所述图像分割模型进行训练,具体包括:
根据所述第二训练集和预设的反向传播算法,对所述超分辨率生成对抗网络进行训练;
根据所述第一训练集和预设的反向传播算法,对所述图像分割模型进行训练。
6.根据权利要求1所述的实例分割方法,其特征在于,将待分割图像输入到训练后的所述图像分割模型中,依次通过4个所述子神经网络对所述图像进行处理,得到所述待分割图像的实例分割结果,具体包括:
将待分割图像输入到训练后的所述图像分割模型中,通过所述双路径增强卷积网络对所述待分割图像进行逐层处理,得到所述待分割的图像的多层次特征;
通过所述感兴趣区推荐网络对所述多层次特征进行滑窗处理,得到多个感兴趣区;
通过所述超分辨率生成对抗网络对多个所述感兴趣区进行精细上采样处理,得到每个所述感兴趣区的超分辨率特征;
通过所述分割网络对所述超分辨率特征进行逐像素分割处理,得到所述待分割图像的实例分割结果。
7.根据权利要求6所述的实例分割方法,其特征在于,通过所述分割网络对所述超分辨率特征进行逐像素分割处理,得到所述待分割图像的实例分割结果,具体包括:
通过所述分割网络对所述超分辨率特征进行逐像素分割处理,得到每个所述感兴趣区的类别、坐标和像素级分割得分图;
对每个所述感兴趣区的类别进行判断,剔除所述类别为背景的感兴趣区域,保留所述类别为待分割目标的感兴趣区域;
将所述类别为待分割目标的感兴趣区域的坐标和像素级分割得分图作为所述待分割图像的实例分割结果。
8.根据权利要求6所述的实例分割方法,其特征在于,通过所述感兴趣区推荐网络对所述多层次特征进行滑窗处理,得到多个感兴趣区,具体包括:
通过滑窗方式分别将所述多层次特征分成以每个像素为中心,n×n为大小的特征块,其中,n≥3;
将全部所述特征块输入到所述感兴趣区推荐网络中进行处理,得到每个所述特征块是否包含待分割目标的预测得分以及待分割目标的预测坐标,根据所述预测得分和所述预测坐标得到多个感兴趣区。
9.一种图像的实例分割装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,实现如权利要求1至8中任一项所述的实例分割方法。
10.一种存储介质,其特征在于,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如权利要求1至8中任一项所述的实例分割方法。
CN201811443298.8A 2018-11-29 2018-11-29 图像的实例分割方法及装置 Active CN109635812B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811443298.8A CN109635812B (zh) 2018-11-29 2018-11-29 图像的实例分割方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811443298.8A CN109635812B (zh) 2018-11-29 2018-11-29 图像的实例分割方法及装置

Publications (2)

Publication Number Publication Date
CN109635812A true CN109635812A (zh) 2019-04-16
CN109635812B CN109635812B (zh) 2019-11-08

Family

ID=66069801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811443298.8A Active CN109635812B (zh) 2018-11-29 2018-11-29 图像的实例分割方法及装置

Country Status (1)

Country Link
CN (1) CN109635812B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348403A (zh) * 2019-07-15 2019-10-18 华瑞新智科技(北京)有限公司 一种树木数量实时测量统计方法、系统及无人机
CN110533046A (zh) * 2019-08-30 2019-12-03 北京地平线机器人技术研发有限公司 一种图像实例分割方法和装置
CN110533044A (zh) * 2019-05-29 2019-12-03 广东工业大学 一种基于gan的域适应图像语义分割方法
CN111553303A (zh) * 2020-05-07 2020-08-18 武汉大势智慧科技有限公司 基于卷积神经网络的遥感正射影像密集建筑物提取方法
CN111627029A (zh) * 2020-05-28 2020-09-04 北京字节跳动网络技术有限公司 图像实例分割结果的获取方法及装置
CN113554656A (zh) * 2021-07-13 2021-10-26 中国科学院空间应用工程与技术中心 基于图神经网络的光学遥感图像实例分割方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651877A (zh) * 2016-12-20 2017-05-10 北京旷视科技有限公司 实例分割方法及装置
CN106778705A (zh) * 2017-02-04 2017-05-31 中国科学院自动化研究所 一种行人个体分割方法及装置
CN106897573A (zh) * 2016-08-01 2017-06-27 12西格玛控股有限公司 使用深度卷积神经网络的用于医学图像的计算机辅助诊断系统
CN107301400A (zh) * 2017-06-23 2017-10-27 深圳市唯特视科技有限公司 一种语义导向的半监督视频对象分割方法
CN107481188A (zh) * 2017-06-23 2017-12-15 珠海经济特区远宏科技有限公司 一种图像超分辨率重构方法
CN107610146A (zh) * 2017-09-29 2018-01-19 北京奇虎科技有限公司 图像场景分割方法、装置、计算设备及计算机存储介质
CN107704862A (zh) * 2017-11-06 2018-02-16 深圳市唯特视科技有限公司 一种基于语义实例分割算法的视频对象分割方法
US20180268284A1 (en) * 2017-03-15 2018-09-20 Samsung Electronics Co., Ltd. System and method for designing efficient super resolution deep convolutional neural networks by cascade network training, cascade network trimming, and dilated convolutions
CN108711161A (zh) * 2018-06-08 2018-10-26 Oppo广东移动通信有限公司 一种图像分割方法、图像分割装置及电子设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897573A (zh) * 2016-08-01 2017-06-27 12西格玛控股有限公司 使用深度卷积神经网络的用于医学图像的计算机辅助诊断系统
CN106651877A (zh) * 2016-12-20 2017-05-10 北京旷视科技有限公司 实例分割方法及装置
CN106778705A (zh) * 2017-02-04 2017-05-31 中国科学院自动化研究所 一种行人个体分割方法及装置
US20180268284A1 (en) * 2017-03-15 2018-09-20 Samsung Electronics Co., Ltd. System and method for designing efficient super resolution deep convolutional neural networks by cascade network training, cascade network trimming, and dilated convolutions
CN107301400A (zh) * 2017-06-23 2017-10-27 深圳市唯特视科技有限公司 一种语义导向的半监督视频对象分割方法
CN107481188A (zh) * 2017-06-23 2017-12-15 珠海经济特区远宏科技有限公司 一种图像超分辨率重构方法
CN107610146A (zh) * 2017-09-29 2018-01-19 北京奇虎科技有限公司 图像场景分割方法、装置、计算设备及计算机存储介质
CN107704862A (zh) * 2017-11-06 2018-02-16 深圳市唯特视科技有限公司 一种基于语义实例分割算法的视频对象分割方法
CN108711161A (zh) * 2018-06-08 2018-10-26 Oppo广东移动通信有限公司 一种图像分割方法、图像分割装置及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHRISTIAN LEDIG ET AL.: ""Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network"", 《2017 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110533044A (zh) * 2019-05-29 2019-12-03 广东工业大学 一种基于gan的域适应图像语义分割方法
CN110533044B (zh) * 2019-05-29 2023-01-20 广东工业大学 一种基于gan的域适应图像语义分割方法
CN110348403A (zh) * 2019-07-15 2019-10-18 华瑞新智科技(北京)有限公司 一种树木数量实时测量统计方法、系统及无人机
CN110533046A (zh) * 2019-08-30 2019-12-03 北京地平线机器人技术研发有限公司 一种图像实例分割方法和装置
CN110533046B (zh) * 2019-08-30 2022-03-29 北京地平线机器人技术研发有限公司 一种图像实例分割方法、装置、计算机可读存储介质及电子设备
CN111553303A (zh) * 2020-05-07 2020-08-18 武汉大势智慧科技有限公司 基于卷积神经网络的遥感正射影像密集建筑物提取方法
CN111553303B (zh) * 2020-05-07 2024-03-29 武汉大势智慧科技有限公司 基于卷积神经网络的遥感正射影像密集建筑物提取方法
CN111627029A (zh) * 2020-05-28 2020-09-04 北京字节跳动网络技术有限公司 图像实例分割结果的获取方法及装置
CN113554656A (zh) * 2021-07-13 2021-10-26 中国科学院空间应用工程与技术中心 基于图神经网络的光学遥感图像实例分割方法及装置

Also Published As

Publication number Publication date
CN109635812B (zh) 2019-11-08

Similar Documents

Publication Publication Date Title
CN109635812B (zh) 图像的实例分割方法及装置
CN109598733B (zh) 基于深度全卷积神经网络的视网膜眼底图像分割方法
CN109300121B (zh) 一种心血管疾病诊断模型的构建方法、系统及该诊断装置
CN104281853B (zh) 一种基于3d卷积神经网络的行为识别方法
CN110287960A (zh) 自然场景图像中曲线文字的检测识别方法
CN107341518A (zh) 一种基于卷积神经网络的图像分类方法
CN107506761A (zh) 基于显著性学习卷积神经网络的脑部图像分割方法及系统
CN106940816A (zh) 基于3d全连接卷积神经网络的ct图像肺结节检测系统
CN109447998B (zh) 基于PCANet深度学习模型下的自动分割方法
CN108010049A (zh) 使用全卷积神经网络分割定格动画中人手部区域的方法
CN109241871A (zh) 一种基于视频数据的公共区域人流跟踪方法
CN109559300A (zh) 图像处理方法、电子设备及计算机可读存储介质
CN109345508A (zh) 一种基于两阶段神经网络的骨龄评价方法
CN114220035A (zh) 一种基于改进yolo v4的快速害虫检测方法
CN111597920B (zh) 一种自然场景下的全卷积单阶段的人体实例分割方法
CN106096605A (zh) 一种基于深度学习的图像模糊区域检测方法及装置
CN108090904A (zh) 一种医学图像实例分割方法和装置
CN109508644A (zh) 基于深度视频数据分析的面瘫等级评估系统
CN110765833A (zh) 一种基于深度学习的人群密度估计方法
CN110276402A (zh) 一种基于深度学习语义边界增强的盐体识别方法
CN106023145A (zh) 基于超像素标注的遥感图像的分割与识别方法
CN104484886B (zh) 一种mr图像的分割方法及装置
CN109272487A (zh) 一种基于视频的公共区域内人群的数量统计方法
CN104182771B (zh) 基于带丢包自动编码技术的时间序列数据图形化分析方法
CN109711401A (zh) 一种基于Faster Rcnn的自然场景图像中的文本检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant