CN111127502A - 生成实例掩码的方法、装置及电子设备 - Google Patents

生成实例掩码的方法、装置及电子设备 Download PDF

Info

Publication number
CN111127502A
CN111127502A CN201911261755.6A CN201911261755A CN111127502A CN 111127502 A CN111127502 A CN 111127502A CN 201911261755 A CN201911261755 A CN 201911261755A CN 111127502 A CN111127502 A CN 111127502A
Authority
CN
China
Prior art keywords
image
pixel
representation
vector
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911261755.6A
Other languages
English (en)
Other versions
CN111127502B (zh
Inventor
王绍儒
宫永超
黄李超
黄畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Horizon Robotics Technology Research and Development Co Ltd
Original Assignee
Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Horizon Robotics Technology Research and Development Co Ltd filed Critical Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority to CN201911261755.6A priority Critical patent/CN111127502B/zh
Publication of CN111127502A publication Critical patent/CN111127502A/zh
Application granted granted Critical
Publication of CN111127502B publication Critical patent/CN111127502B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

公开了一种生成实例掩码的方法及装置,其中方法包括:基于物体表征提取训练参数,确定第一图像中预设物体的物体表征训练向量;基于像素表征提取训练参数,确定所述第一图像中每个像素点的像素表征训练向量;基于所述第一图像中预设物体的物体表征训练向量和所述第一图像中每个像素点的像素表征训练向量,确定所述物体表征提取训练参数对应的物体表征提取应用参数和所述像素表征提取训练参数对应的像素表征提取应用参数;基于所述物体表征提取应用参数和所述像素表征提取应用参数,确定第二图像中预设物体的实例掩码。本公开提供的技术方案考虑了预设物体的特征,简化了对预设物体进行后处理的过程,可以提高生成实例掩码的精度和速度。

Description

生成实例掩码的方法、装置及电子设备
技术领域
本发明涉及计算机技术领域,具体涉及一种生成实例掩码的方法、装置及电子设备。
背景技术
图像实例分割是无人驾驶等应用的研究基础,图像实例分割的重点是如何生成实例掩码。常见的生成实例掩码的方法是:首先进行区域提名,然后在每个提名的区域内预测实例掩码。常见方法生成的实例掩码的分辨率较低,难以满足很多实际应用的需求。
发明内容
为了解决上述技术问题,本申请实施例提供了一种生成实例掩码的方法、装置及电子设备。
根据本申请的一个方面,提供了一种生成实例掩码的方法,包括:基于物体表征提取训练参数,确定第一图像中预设物体的物体表征训练向量;基于像素表征提取训练参数,确定所述第一图像中每个像素点的像素表征训练向量;基于所述第一图像中预设物体的物体表征训练向量和所述第一图像中每个像素点的像素表征训练向量,确定所述物体表征提取训练参数对应的物体表征提取应用参数和所述像素表征提取训练参数对应的像素表征提取应用参数;基于所述物体表征提取应用参数和所述像素表征提取应用参数,确定第二图像中预设物体的实例掩码。
根据本申请的另一个方面,提供了一种生成实例掩码的装置,包括:物体表征训练向量确定模块,用于基于物体表征提取训练参数,确定第一图像中预设物体的物体表征训练向量;像素表征训练向量确定模块,用于基于像素表征提取训练参数,确定所述第一图像中每个像素点的像素表征训练向量;表征提取应用参数确定模块,用于基于所述第一图像中预设物体的物体表征训练向量和所述第一图像中每个像素点的像素表征训练向量,确定所述物体表征提取训练参数对应的物体表征提取应用参数和所述像素表征提取训练参数对应的像素表征提取应用参数;实例掩码确定模块,用于基于所述物体表征提取应用参数和所述像素表征提取应用参数,确定第二图像中预设物体的实例掩码。
根据本申请的另一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述任一所述的方法。
根据本申请的另一个方面,提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于执行上述任一所述的方法。
本申请实施例提供的生成实例掩码的方法,确定并基于第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量,确定物体表征提取训练参数对应的物体表征提取应用参数和像素表征提取训练参数对应的像素表征提取应用参数,再基于物体表征提取应用参数和像素表征提取应用参数,确定第二图像中预设物体的实例掩码,即将第一图像中预设物体的表征作为滤波器在像素点的表征上执行相关滤波,即可得到每个物体的实例掩码,由于所生成的实例掩码充分考虑了图像中预设物体(即,实例)的特征,因此可以使实例掩码能够具有与预设物体相同的类别,进而简化了对预设物体进行后处理的过程,可以提高生成实例掩码的精度和速度。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本申请一示例性实施例提供的生成实例掩码的方法的流程示意图。
图2是本申请一示例性实施例提供的一种基于第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量,确定物体表征提取训练参数对应的物体表征提取应用参数和像素表征提取训练参数对应的像素表征提取应用参数的流程示意图。
图3是本申请一示例性实施例提供的一种基于物体表征提取应用参数和像素表征提取应用参数,确定第二图像中预设物体的实例掩码的流程示意图。
图4是本申请一示例性实施例提供的基于相关滤波归一化向量,确定第二图像中预设物体的实例掩码的流程示意图。
图5是本申请一示例性实施例提供的一种训练过程示例图。
图6是本申请一示例性实施例提供的一种测试过程示例图。
图7是本申请一示例性实施例提供的生成实例掩码的装置的结构示意图。
图8是本申请一示例性实施例提供的生成实例掩码的装置中表征提取应用参数确定模块的结构示意图。
图9是本申请一示例性实施例提供的生成实例掩码的装置中实例掩码确定模块的结构示意图。
图10是本申请一示例性实施例提供的生成实例掩码的装置中实例掩码确定单元的结构示意图。
图11是本申请一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
图像实例分割是无人驾驶等应用的研究基础,图像实例分割的重点是如何生成实例掩码。由于常见的生成实例掩码的方法生成的实例掩码分辨率较低。现有研究开发人员提出一种利用图像语义分割生成实例掩码的方法:首先将图像中每个像素点标记为预定义类别,然后通过聚类等方法将这些像素分配给图像中的各个实例,生成实例掩码。然而,利用图像语义分割生成实例掩码的方法,未充分考虑图像中实例的特征,较难设计预定义类别,后续处理过程较为繁琐耗时。
针对上述技术问题,本申请的基本构思是提出一种生成实例掩码的方法、装置及电子设备。
下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性方法
图1是本申请一示例性实施例提供的生成实例掩码的方法的流程示意图。本申请实施例提供的生成实例掩码的方法可应用到计算机技术领域。如图1所示,本申请实施例提供的生成实例掩码的方法包括如下步骤:
步骤101,基于物体表征提取训练参数,确定第一图像中预设物体的物体表征训练向量。
在一实施例中,输入高度为h、宽度为w的第一图像I,第一图像I中包含有多个物体,例如人、摩托车等。提取第一图像I中预设物体的物体表征训练向量
Figure BDA0002311782790000041
其中,Fobj表示物体表征提取函数,ωobj表示物体表征提取训练参数(其为待优化的参数),
Figure BDA0002311782790000042
表示实数,x为2×d×1×1维向量,其中值为1的维度没有特别的含义,只为了步骤103中计算表达的方便。
步骤102,基于像素表征提取训练参数,确定第一图像中每个像素点的像素表征训练向量。
在一实施例中,逐像素点提取第一图像的像素表征训练向量X=Fpx(I,ωpx),
Figure BDA0002311782790000051
其中,Fpx表示像素表征提取函数,ωpx表示像素表征提取训练参数(其为待优化的参数),X为1×d×w×h维向量,其中值为1的维度没有特别的含义,只为了步骤103中计算表达的方便。
需要说明的是,步骤101和步骤102没有先后顺序要求,可以根据实际应用状况进行设置。
步骤103,基于第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量,确定物体表征提取训练参数对应的物体表征提取应用参数和像素表征提取训练参数对应的像素表征提取应用参数。
在一实施例中,基于第一图像中预设物体的物体表征训练向量x和第一图像中每个像素点的像素表征训练向量X,确定物体表征提取训练参数ωobj对应的物体表征提取应用参数
Figure BDA0002311782790000052
和像素表征提取训练参数ωpx对应的像素表征提取应用参数
Figure BDA0002311782790000053
步骤104,基于物体表征提取应用参数和像素表征提取应用参数,确定第二图像中预设物体的实例掩码。
在一实施例中,基于物体表征提取应用参数
Figure BDA0002311782790000054
和像素表征提取应用参数
Figure BDA0002311782790000055
确定第二图像中预设物体的实例掩码
Figure BDA0002311782790000056
本申请实施例提供的生成实例掩码的方法,确定并基于第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量,确定物体表征提取训练参数对应的物体表征提取应用参数和像素表征提取训练参数对应的像素表征提取应用参数,再基于物体表征提取应用参数和像素表征提取应用参数,确定第二图像中预设物体的实例掩码,即将第一图像中预设物体的表征作为滤波器在像素点的表征上执行相关滤波,即可得到每个物体的实例掩码,由于所生成的实例掩码充分考虑了图像中预设物体(即,实例)的特征,因此可以使实例掩码能够具有与预设物体相同的类别,进而简化了对预设物体进行后处理的过程,可以提高生成实例掩码的精度和速度。
图2是本申请一示例性实施例提供的一种基于第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量,确定物体表征提取训练参数对应的物体表征提取应用参数和像素表征提取训练参数对应的像素表征提取应用参数的流程示意图。在本申请图1所示实施例的基础上延伸出本申请图2所示实施例,下面着重叙述图2所示实施例与图1所示实施例的不同之处,相同之处不再赘述。
如图2所示,在本申请实施例提供的生成实例掩码的方法中,基于第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量,确定物体表征提取训练参数对应的物体表征提取应用参数和像素表征提取训练参数对应的像素表征提取应用参数(即步骤103),包括:
步骤1031,确定第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量的相关滤波归一化函数。
其中,相关滤波归一化函数中包括物体表征提取训练参数和像素表征提取训练参数。
在一实施例中,确定第一图像中预设物体的物体表征训练向量x和第一图像中每个像素点的像素表征训练向量X的相关滤波归一化函数Z=x*X,
Figure BDA0002311782790000061
其中,*表示卷积操作,x、X、
Figure BDA0002311782790000062
与文中其他地方的含义相同,此处不再赘述,并且需要说明的是,文中所有相同公式、相同字母的含义相同,不再一一赘述。
步骤1032,基于相关滤波归一化函数,确定第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量的交叉熵损失函数。
其中,交叉熵损失函数中包括物体表征提取训练参数和像素表征提取训练参数。
在一实施例中,使用归一化指数softmax函数在Z的第一个维度上进行归一化,得到归一化的相关滤波归一化函数P:P=Softmax(Z),P∈[0,1]2×1×w×h。基于归一化的相关滤波归一化函数P,确定第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量的交叉熵损失函数Loss:
Figure BDA0002311782790000071
其中,(Yij+1)1ij表示矩阵下标,Yij的取值为0或1,则Yij+1的取值为1或2,也就是说分别对应着P中第一个维度的第一和第二通道,即:前景<==>(Yij=1)<==>P中第一个维度的第二通道,背景<==>(Yij=0)<==>P中第一个维度的第一通道。
步骤1033,基于第一图像的标签图像,最小化交叉熵损失函数,得到物体表征提取训练参数对应物体表征提取应用参数和像素表征提取训练参数对应的像素表征提取应用参数。
其中,第一图像的标签图像Yij是提取第一图像中预设物体的每个像素点的标注标签得到的二值化图像(具体是属于第一图像中预设物体的像素点标注为1,不属于第一图像中预设物体的像素点标注为0,也就是前景为1,背景为0)即Yij∈{0,1},i∈{1,2,…,w},j∈{1,2,…,h}。
在一实施例中,基于第一图像的标签图像Yij,应用梯度下降算法优化交叉熵损失函数Loss中的物体表征提取训练参数ωobj和像素表征提取训练参数ωpx,得到物体表征提取应用参数
Figure BDA0002311782790000072
和像素表征提取应用参数
Figure BDA0002311782790000073
本申请实施例提供的生成实例掩码的方法,确定并基于相关滤波归一化函数,确定第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量的交叉熵损失函数,基于第一图像的标签图像,最小化交叉熵损失函数,得到物体表征提取训练参数对应物体表征提取应用参数和像素表征提取训练参数对应的像素表征提取应用参数,利用物体表征、像素表征、相关滤波归一化函数、交叉熵损失函数,既可以得到优化后的表征参数和像素参数,由于充分利用了物体表征、像素表征、相关滤波归一化函数、交叉熵损失函数等物理量,因此大大提高实例掩码的准确性。
图3是本申请一示例性实施例提供的一种基于物体表征提取应用参数和像素表征提取应用参数,确定第二图像中预设物体的实例掩码的流程示意图。在本申请图1或图2所示实施例的基础上延伸出本申请所示实施例,下面着重叙述本申请所示实施例与图1或图2所示实施例的不同之处,相同之处不再赘述。
在本申请实施例提供的生成实例掩码的方法中,基于物体表征提取应用参数和像素表征提取应用参数,确定第二图像中预设物体的实例掩码(即步骤104),具体包括:
步骤1041,基于物体表征提取应用参数,对第二图像中预设物体进行物体表征提取,得到第二图像中预设物体的物体应用表征向量。
在一实施例中,输入高度为h、宽度为w的第二图像I′。需要说明的是,第一图像是用于训练确定物体表征提取应用参数
Figure BDA0002311782790000081
和像素表征提取应用参数
Figure BDA0002311782790000082
可以通过大量的第一图像训练确定物体表征提取应用参数
Figure BDA0002311782790000083
和像素表征提取应用参数
Figure BDA0002311782790000084
第二图像是实际需要提取实例掩码或是测试得到的物体表征提取应用参数
Figure BDA0002311782790000085
和像素表征提取应用参数
Figure BDA0002311782790000086
的精确度的图像,第二图像用于测试的作用时,第二图像可以使用与第一图像同样的图像,也可以使用与第一图像不同的图像。
在一实施例中,基于物体表征提取应用参数,提取第二图像I′中预设物体的物体表征训练向量
Figure BDA0002311782790000087
其中,Fobj表示物体表征提取函数,
Figure BDA0002311782790000088
表示物体表征提取应用参数,
Figure BDA0002311782790000089
表示实数,x′为2×d×1×1维向量,其中值为1的维度没有特别的含义,只为了步骤1043中计算表达的方便。
步骤1042,基于像素表征提取应用参数,对第二图像中每个像素点进行像素应用表征提取,得到第二图像中每个像素点的像素应用表征向量。
在一实施例中,基于像素表征提取应用参数,逐像素点提取第二图像中每个像素点的表征向量
Figure BDA0002311782790000091
步骤1043,确定第二图像中预设物体的物体应用表征向量和第二图像中每个像素点的像素应用表征向量的相关滤波归一化向量。
在一实施例中,确定第二图像中预设物体的物体应用表征向量x′和第二图像中每个像素点的像素应用表征向量X′的相关滤波归一化向量Z′=x′*X′,
Figure BDA0002311782790000092
步骤1044,基于相关滤波归一化向量,确定第二图像中预设物体的实例掩码。
在一实施例中,基于相关滤波归一化向量,确定第二图像中预设物体的实例掩码相关滤波Z′=x′*X′,
Figure BDA0002311782790000093
使用softmax函数在Z′的第一个维度上进行归一化,得到P′:P′=Softmax(Z′),P′∈[0,1]2×1×w×h,需要说明的是P′为2×1×w×h维的向量,且P′中每个元素的取值范围为0到1;取P′中对应于训练时前景的通道(即为第二通道):P′f=P′21∷,P′f∈[0,1]w×h,其中,21∷表示矩阵下标,:表示取当前维度的所有通道;二值化P′f得到第二图像中预设物体的实例掩码M′:
Figure BDA0002311782790000094
其中,
Figure BDA0002311782790000095
表示指示函数,具体的定义是
Figure BDA0002311782790000096
通过指示函数可以完成二值化,τ为预设阈值,优选取值为0.4,M′为w*h的矩阵,M′中每个元素点取值为0或1。
本申请实施例所提及的生成实例掩码的方法,确定并基于第二图像中预设物体的物体应用表征向量和第二图像中每个像素点的像素应用表征向量的相关滤波归一化向量,即可确定第二图像中预设物体的实例掩码,不需要将图像中每个像素点标记为预定义类别等其他步骤,生成方式简单快捷,可以提高生成实例掩码的效率。
图4是本申请一示例性实施例提供的基于相关滤波归一化向量,确定第二图像中预设物体的实例掩码的流程示意图。在本申请图3所示实施例的基础上延伸出本申请图4所示实施例,下面着重叙述图4所示实施例与图3所示实施例的不同之处,相同之处不再赘述。
如图4所示,在本申请实施例提供的生成实例掩码的方法中,基于相关滤波归一化向量,确定第二图像中预设物体的实例掩码(即步骤1044),包括:
步骤10441,提取相关滤波归一化向量中第一个维度的第二通道的值,得到前景通道向量。
步骤10442,对前景通道向量进行二值化,得到第二图像中预设物体的实例掩码。
步骤10441与步骤10442的具体过程,详见步骤1044中的例子,此处不再赘述。
本申请实施例所提及的生成实例掩码的方法,提取相关滤波归一化向量中第一个维度的第二通道的值,得到前景通道向量,对前景通道向量进行二值化,得到第二图像中预设物体的实例掩码,由于前景通道向量是预设物体的特征,可以提高生成实例掩码的精度。
为了便于理解,进一步通过示例图进行说明,在本示例图中以第二图像用于测试的作用为例进行说明,并且以第二图像使用与第一图像同样的图像为例进行说明,参见图5和图6,分别为本申请一示例性实例提供的一种训练过程示例图和一种测试过程示例图,通过图5训练过程确定物体表征提取应用参数和像素表征提取应用参数,在图6测试过程中,基于物体表征提取应用参数和像素表征提取应用参数,确定第二图像中预设物体的实例掩码。
具体地,参见图5,输入第一图像I、第一图像的标签图像Yij,预设图像为摩托车,训练过程包括:
①提取第一图像I中预设物体的物体表征训练向量x=Fobj(I,ωobj),
Figure BDA0002311782790000101
Figure BDA0002311782790000102
②逐像素点提取第一图像I中每个像素点的像素表征训练向量X=Fpx(I,ωpx),
Figure BDA0002311782790000111
③确定第一图像中预设物体的物体表征训练向量x和第一图像中每个像素点的像素表征训练向量X的相关滤波归一化函数Z=x*X,
Figure BDA0002311782790000112
④使用归一化指数softmax函数在Z的第一个维度上进行归一化,得到归一化的相关滤波归一化函数P:P=Softmax(Z),P∈[0,1]2×1×w×h
⑤基于第一图像的标签图像Yij,应用梯度下降算法最小交叉熵损失函数
Figure BDA0002311782790000113
得到优化后的ωobjpx分别为
Figure BDA0002311782790000114
具体地,参见图6,输入第二图像I′,测试过程包括:
1、基于物体表征提取应用参数,提取第二图像I′中预设物体的物体表征训练向量
Figure BDA0002311782790000115
2、基于像素表征提取应用参数,逐像素点提取第二图像中每个像素点的表征向量。
3、确定第二图像中预设物体的物体应用表征向量x′和第二图像中每个像素点的像素应用表征向量X′的相关滤
Figure BDA0002311782790000116
波归一化向量Z′=x′*X′,
Figure BDA0002311782790000117
4、使用softmax函数在Z′的第一个维度上进行归一化,得到P′:P′=Softmax(Z′),P′∈[0,1]2×1×w×h
5、取P′中对应于训练时前景的通道(即为第二通道):P′f=P′21∷,P′f∈[0,1]w×h;二值化P′f得到第二图像中预设物体的实例掩码M′:
Figure BDA0002311782790000118
Figure BDA0002311782790000119
M′∈{0,1}w×h
需要说明的是,图5和图6所示过程的各个公式和字母的含义与上面任一处相同,此处不再一一赘述。
另外,需要说明的是,图5和图6中第一图像和第二图像是同一图像,实际应用中第一图像和第二图像可以是不同的图像,图5和图6中第一图像和第二图像中的预设对象是同一对象,实际应用中第一图像和第二图像中的预设对象也可以是不同的对象,且在图5训练的过程中,可以使用多个第一图像、多个第一图像中的多个预设物体进行训练,提高物体表征提取应用参数和像素表征提取应用参数的准确性和实用性,在图6测试过程中,可以同时确定第二图像中的多个预设物体的实例掩码,当图6对应于实际应用过程时,与测试过程相同。
示例性装置
图7是本申请一示例性实施例提供的生成实例掩码的装置的结构示意图。本申请实施例提供的生成实例掩码的装置可应用到计算机技术领域,如图7所示,本申请实施例提供的生成实例掩码的装置,包括:
物体表征训练向量确定模块201,用于基于物体表征提取训练参数,确定第一图像中预设物体的物体表征训练向量;
像素表征训练向量确定模块202,用于基于像素表征提取训练参数,确定第一图像中每个像素点的像素表征训练向量;
表征提取应用参数确定模块203,用于基于第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量,确定物体表征提取训练参数对应的物体表征提取应用参数和像素表征提取训练参数对应的像素表征提取应用参数;
实例掩码确定模块204,用于基于物体表征提取应用参数和像素表征提取应用参数,确定第二图像中预设物体的实例掩码。
图8是本申请一示例性实施例提供的生成实例掩码的装置中表征提取应用参数确定模块的结构示意图。在本申请图7所示实施例的基础上延伸出本申请图8所示实施例,下面着重叙述图8所示实施例与图7所示实施例的不同之处,相同之处不再赘述。
如图8所示,在本申请实施例提供的生成实例掩码的装置中,表征提取应用参数确定模块203包括:
相关滤波归一化函数确定单元2031,用于确定第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量的相关滤波归一化函数,其中,相关滤波归一化函数中包括物体表征提取训练参数和像素表征提取训练参数;
交叉熵损失函数确定单元2032,用于基于相关滤波归一化函数,确定第一图像中预设物体的物体表征训练向量和第一图像中每个像素点的像素表征训练向量的交叉熵损失函数,其中,交叉熵损失函数中包括物体表征提取训练参数和像素表征提取训练参数;
应用参数确定单元2033,用于基于第一图像的标签图像,最小化交叉熵损失函数,得到物体表征提取应用参数和像素表征提取应用参数。
图9是本申请一示例性实施例提供的生成实例掩码的装置中实例掩码确定模块的结构示意图。在本申请图7或图8所示实施例的基础上延伸出本申请图9所示实施例,下面着重叙述图9所示实施例与图7或图8所示实施例的不同之处,相同之处不再赘述。
如图9所示,在本申请实施例提供的生成实例掩码的装置中,实例掩码确定模块204包括:
物体应用表征向量确定单元2041,用于基于物体表征提取应用参数,对第二图像中预设物体进行物体表征提取,得到第二图像中预设物体的物体应用表征向量;
像素应用表征向量确定单元2042,用于基于像素表征提取应用参数,对第二图像中每个像素点进行像素应用表征提取,得到第二图像中每个像素点的像素应用表征向量;
相关滤波归一化向量确定单元2043,用于确定第二图像中预设物体的物体应用表征向量和第二图像中每个像素点的像素应用表征向量的相关滤波归一化向量;
实例掩码确定单元2044,用于基于相关滤波归一化向量,确定第二图像中预设物体的实例掩码。
图10是本申请一示例性实施例提供的生成实例掩码的装置中实例掩码确定单元的结构示意图。在本申请图9所示实施例的基础上延伸出本申请图10所示实施例,下面着重叙述图10所示实施例与图9所示实施例的不同之处,相同之处不再赘述。
如图10所示,在本申请实施例提供的生成实例掩码的装置中,实例掩码确定单元2044包括:
前景通道向量确定子单元20441,用于提取相关滤波归一化向量中第一个维度的第二通道的值,得到前景通道向量;
实例掩码确定子单元20442,用于对前景通道向量进行二值化,得到第二图像中预设物体的实例掩码。
应当理解,图7至图10提供的生成实例掩码的装置中的物体表征训练向量确定模块201、像素表征训练向量确定模块202、表征提取应用参数确定模块203、实例掩码确定模块204,表征提取应用参数确定模块203中的相关滤波归一化函数确定单元2031、交叉熵损失函数确定单元2032和应用参数确定单元2033,实例掩码确定模块204中的物体应用表征向量确定单元2041、像素应用表征向量确定单元2042、相关滤波归一化向量确定单元2043、实例掩码确定单元2044,以及实例掩码确定单元2044中包括的前景通道向量确定子单元20441、实例掩码确定子单元20442的操作和功能可以参考上述图1至图6提供的生成实例掩码的方法,为了避免重复,在此不再赘述。
示例性电子设备
图11图示了本申请实施例的电子设备的框图。
如图11所示,电子设备11包括一个或多个处理器111和存储器112。
处理器111可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备11中的其他组件以执行期望的功能。
存储器112可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器111可以运行所述程序指令,以实现上文所述的本申请的各个实施例的生成实例掩码的方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、运行结果等各种内容。
在一个示例中,电子设备11还可以包括:输入装置113和输出装置114,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
例如,该输入装置113可以是摄像头或麦克风、麦克风阵列等,用于捕捉图像或声源的输入信号。在该电子设备是单机设备时,该输入装置113可以是通信网络连接器,用于从网络处理器接收所采集的输入信号。
此外,该输入设备113还可以包括例如键盘、鼠标等等。
该输出装置114可以向外部输出各种信息,包括确定出的输出电压、输出电流信息等。该输出设备114可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图11中仅示出了该电子设备11中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备11还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的生成实例掩码的方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的生成实例掩码的方法的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种生成实例掩码的方法,包括:
基于物体表征提取训练参数,确定第一图像中预设物体的物体表征训练向量;
基于像素表征提取训练参数,确定所述第一图像中每个像素点的像素表征训练向量;
基于所述第一图像中预设物体的物体表征训练向量和所述第一图像中每个像素点的像素表征训练向量,确定所述物体表征提取训练参数对应的物体表征提取应用参数和所述像素表征提取训练参数对应的像素表征提取应用参数;
基于所述物体表征提取应用参数和所述像素表征提取应用参数,确定第二图像中预设物体的实例掩码。
2.根据权利要求1所述的方法,其中,基于所述第一图像中预设物体的物体表征训练向量和所述第一图像中每个像素点的像素表征训练向量,确定所述物体表征提取训练参数对应的物体表征提取应用参数和所述像素表征提取训练参数对应的像素表征提取应用参数,包括:
确定所述第一图像中预设物体的物体表征训练向量和所述第一图像中每个像素点的像素表征训练向量的相关滤波归一化函数,其中,所述相关滤波归一化函数中包括所述物体表征提取训练参数和所述像素表征提取训练参数;
基于所述相关滤波归一化函数,确定所述第一图像中预设物体的物体表征训练向量和所述第一图像中每个像素点的像素表征训练向量的交叉熵损失函数,其中,所述交叉熵损失函数中包括所述物体表征提取训练参数和所述像素表征提取训练参数;
基于所述第一图像的标签图像,最小化所述交叉熵损失函数,得到所述物体表征提取应用参数和所述像素表征提取应用参数。
3.根据权利要求1或2所述的方法,其中,基于所述物体表征提取应用参数和所述像素表征提取应用参数,确定第二图像中预设物体的实例掩码,包括:
基于所述物体表征提取应用参数,对所述第二图像中预设物体进行物体表征提取,得到所述第二图像中预设物体的物体应用表征向量;
基于所述像素表征提取应用参数,对所述第二图像中每个像素点进行像素应用表征提取,得到所述第二图像中每个像素点的像素应用表征向量;
确定所述第二图像中预设物体的物体应用表征向量和所述第二图像中每个像素点的像素应用表征向量的相关滤波归一化向量;
基于所述相关滤波归一化向量,确定所述第二图像中预设物体的实例掩码。
4.根据权利要求3所述的方法,其中,基于所述相关滤波归一化向量,确定所述第二图像中预设物体的实例掩码,包括:
提取所述相关滤波归一化向量中第一个维度的第二通道的值,得到前景通道向量;
对所述前景通道向量进行二值化,得到所述第二图像中预设物体的实例掩码。
5.一种生成实例掩码的装置,包括:
物体表征训练向量确定模块,用于基于物体表征提取训练参数,确定第一图像中预设物体的物体表征训练向量;
像素表征训练向量确定模块,用于基于像素表征提取训练参数,确定所述第一图像中每个像素点的像素表征训练向量;
表征提取应用参数确定模块,用于基于所述第一图像中预设物体的物体表征训练向量和所述第一图像中每个像素点的像素表征训练向量,确定所述物体表征提取训练参数对应的物体表征提取应用参数和所述像素表征提取训练参数对应的像素表征提取应用参数;
实例掩码确定模块,用于基于所述物体表征提取应用参数和所述像素表征提取应用参数,确定第二图像中预设物体的实例掩码。
6.根据权利要求5所述的装置,其中,所述表征提取应用参数确定模块包括:
相关滤波归一化函数确定单元,用于确定所述第一图像中预设物体的物体表征训练向量和所述第一图像中每个像素点的像素表征训练向量的相关滤波归一化函数,其中,所述相关滤波归一化函数中包括所述物体表征提取训练参数和所述像素表征提取训练参数;
交叉熵损失函数确定单元,用于基于所述相关滤波归一化函数,确定所述第一图像中预设物体的物体表征训练向量和所述第一图像中每个像素点的像素表征训练向量的交叉熵损失函数,其中,所述交叉熵损失函数中包括所述物体表征提取训练参数和所述像素表征提取训练参数;
应用参数确定单元,用于基于所述第一图像的标签图像,最小化所述交叉熵损失函数,得到所述物体表征提取应用参数和所述像素表征提取应用参数。
7.根据权利要求5或6所述的装置,其中,所述实例掩码确定模块包括:
物体应用表征向量确定单元,用于基于所述物体表征提取应用参数,对所述第二图像中预设物体进行物体表征提取,得到所述第二图像中预设物体的物体应用表征向量;
像素应用表征向量确定单元,用于基于所述像素表征提取应用参数,对所述第二图像中每个像素点进行像素应用表征提取,得到所述第二图像中每个像素点的像素应用表征向量;
相关滤波归一化向量确定单元,用于确定所述第二图像中预设物体的物体应用表征向量和所述第二图像中每个像素点的像素应用表征向量的相关滤波归一化向量;
实例掩码确定单元,用于基于所述相关滤波归一化向量,确定所述第二图像中预设物体的实例掩码。
8.根据权利要求7所述的装置,其中,所述实例掩码确定单元包括:
前景通道向量确定子单元,用于提取所述相关滤波归一化向量中第一个维度的第二通道的值,得到前景通道向量;
实例掩码确定子单元,用于对所述前景通道向量进行二值化,得到所述第二图像中预设物体的实例掩码。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-4任一所述的生成实例掩码的方法。
10.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于执行上述权利要求1-4任一所述的生成实例掩码的方法。
CN201911261755.6A 2019-12-10 2019-12-10 生成实例掩码的方法、装置及电子设备 Active CN111127502B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911261755.6A CN111127502B (zh) 2019-12-10 2019-12-10 生成实例掩码的方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911261755.6A CN111127502B (zh) 2019-12-10 2019-12-10 生成实例掩码的方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111127502A true CN111127502A (zh) 2020-05-08
CN111127502B CN111127502B (zh) 2023-08-29

Family

ID=70498267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911261755.6A Active CN111127502B (zh) 2019-12-10 2019-12-10 生成实例掩码的方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111127502B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113298049A (zh) * 2021-07-12 2021-08-24 浙江大华技术股份有限公司 图像特征降维方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704862A (zh) * 2017-11-06 2018-02-16 深圳市唯特视科技有限公司 一种基于语义实例分割算法的视频对象分割方法
WO2018232592A1 (en) * 2017-06-20 2018-12-27 Microsoft Technology Licensing, Llc. SEMANTIC SEGMENTATION TAKING INTO ACCOUNT AN EVENT WITH COMPLETE CONVOLUTION
CN109740609A (zh) * 2019-01-09 2019-05-10 银河水滴科技(北京)有限公司 一种轨距检测方法及装置
CN109948474A (zh) * 2019-03-04 2019-06-28 成都理工大学 Ai热成像全天候智能监控方法
CN110503097A (zh) * 2019-08-27 2019-11-26 腾讯科技(深圳)有限公司 图像处理模型的训练方法、装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018232592A1 (en) * 2017-06-20 2018-12-27 Microsoft Technology Licensing, Llc. SEMANTIC SEGMENTATION TAKING INTO ACCOUNT AN EVENT WITH COMPLETE CONVOLUTION
CN107704862A (zh) * 2017-11-06 2018-02-16 深圳市唯特视科技有限公司 一种基于语义实例分割算法的视频对象分割方法
CN109740609A (zh) * 2019-01-09 2019-05-10 银河水滴科技(北京)有限公司 一种轨距检测方法及装置
CN109948474A (zh) * 2019-03-04 2019-06-28 成都理工大学 Ai热成像全天候智能监控方法
CN110503097A (zh) * 2019-08-27 2019-11-26 腾讯科技(深圳)有限公司 图像处理模型的训练方法、装置及存储介质

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
ALIREZA FATHI等: "Semantic Instance Segmentation via Deep Metric Learning" *
CHI FEI等: "Learning Pixel-Level and Instance-Level Context-Aware Features for Pedestrian Detection in Crowds" *
HUI YING等: "EmbedMask:Embedding Coupling for One-stage Instance Segmentation" *
SHAORU WANG等: "RDSNet:A New Deep Architecture for Reciprocal Object Detection and Instance Segmentation" *
SURAJ TRIPATHI等: "Visual Context-aware Convolution Filters for Transformation-invariant Neural Network" *
王子愉等: "利用深度可分离卷积核多级特征的分割实例" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113298049A (zh) * 2021-07-12 2021-08-24 浙江大华技术股份有限公司 图像特征降维方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN111127502B (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
EP3437019B1 (en) Optical character recognition in structured documents
CN112949415B (zh) 图像处理方法、装置、设备和介质
US11816710B2 (en) Identifying key-value pairs in documents
CN108108342B (zh) 结构化文本的生成方法、检索方法及装置
CN109034069B (zh) 用于生成信息的方法和装置
JP2022185143A (ja) テキスト検出方法、テキスト認識方法及び装置
CN111292334A (zh) 一种全景图像分割方法、装置及电子设备
CN111325200A (zh) 图像标注方法、装置、设备及计算机可读存储介质
CN110909768B (zh) 一种标注数据获取方法及装置
CN109919214B (zh) 一种神经网络模型的训练方法及训练装置
CN111242162A (zh) 图像分类模型的训练方法、装置、介质以及电子设备
CN112464927B (zh) 一种信息提取方法、装置及系统
CN107168635A (zh) 信息呈现方法和装置
CN112749639B (zh) 模型训练方法、装置、计算机设备和存储介质
CN111523351A (zh) 神经网络的训练方法、装置和电子设备
CN111127502A (zh) 生成实例掩码的方法、装置及电子设备
CN113343981A (zh) 一种视觉特征增强的字符识别方法、装置和设备
CN110210572B (zh) 图像分类方法、装置、存储介质及设备
CN109145991B (zh) 图像组生成方法、图像组生成装置和电子设备
CN110929499A (zh) 文本相似度获取方法、装置、介质及电子设备
CN115546813A (zh) 一种文档分析方法、装置、存储介质及设备
CN111767710B (zh) 印尼语的情感分类方法、装置、设备及介质
CN110516717B (zh) 用于生成图像识别模型的方法和装置
CN114511393A (zh) 财务数据处理方法及系统
CN112801086A (zh) 凭证分类的方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant