CN115482387A - 基于多尺度类别原型的弱监督图像语义分割方法及系统 - Google Patents

基于多尺度类别原型的弱监督图像语义分割方法及系统 Download PDF

Info

Publication number
CN115482387A
CN115482387A CN202211215498.4A CN202211215498A CN115482387A CN 115482387 A CN115482387 A CN 115482387A CN 202211215498 A CN202211215498 A CN 202211215498A CN 115482387 A CN115482387 A CN 115482387A
Authority
CN
China
Prior art keywords
image
category
class
feature
prototypes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211215498.4A
Other languages
English (en)
Inventor
杨纪冲
薛冰
薛垂帅
沈胜庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Juxiang Machinery Co ltd
Original Assignee
Shandong Juxiang Machinery Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Juxiang Machinery Co ltd filed Critical Shandong Juxiang Machinery Co ltd
Priority to CN202211215498.4A priority Critical patent/CN115482387A/zh
Publication of CN115482387A publication Critical patent/CN115482387A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多尺度类别原型的弱监督图像语义分割方法及系统,涉及计算机视觉技术领域。通过获取待处理图像特征图,设置三组原型向量集合,利用原型对特征图进行目标像素定位生成类别特征图。将类别特征图融合并进行图像分类学习;提取类别特征图中的类别激活图得到图像类别掩码,进而获得类别分割图。通过使用类别原型机制,从图像特征图中发掘类别的位置和语义,准确推断对象的语音信息和像素位置。提取语义信息后,采用多尺度原型能够更好的融合不同粒度级别的语义信息,大大提高了弱监督前置分类任务对目标的定位能力。

Description

基于多尺度类别原型的弱监督图像语义分割方法及系统
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种基于多尺度类别原型的弱监督图像语义分割方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
语义分割的目标是为图像中的每个像素分配一个语义类别。它一直是计算机视觉中最重要的任务之一,例如图像编辑和场景理解,具有广泛的应用。最近,基于深度卷积神经网络的方法已被用于语义分割,并取得了重大进展。然而,这种方法依赖于学习需要逐像素注释的监督模型,需要花费大量的精力和时间。为了减少注释像素级真实标签的工作量,逐渐提出了许多使用各种类型标签的弱监督方法,例如图像级标注、视频级标注、边界框标注、点级标注和基于涂鸦的标注。其中,图像级标注是最经济,最有效的设置之一。
然而图像级标注对象的位置和大小是未知的,所以需要推断对象的语义信息和像素位置。现有方法对于信息类别的挖掘形式过于单一,不能实现多类别的位置和语义挖掘。另外,传统方法确定语义信息后由于不能实现多尺度的语义信息融合,语义差距过大,会导致特征表达能力差,从而难以定位目标的位置。
发明内容
针对现有技术的不足,本发明的目的是提供一种基于多尺度类别原型的弱监督图像语义分割方法及系统,使用类别原型机制,从图像特征图中发掘类别的位置和语义,使用多尺度原型融合不同粒度级别的语义信息,从而提高弱监督前置分类任务对目标的定位能力。
为了实现上述目的,本发明是通过如下的技术方案来实现:
本发明第一方面提供了一种基于多尺度类别原型的弱监督图像语义分割方法,包括以下步骤:
收集待分割图像,标注每张图像的类别,对图像进行预处理;将图像输入特征提取网络中获取特征图;
设置三组原型向量集合,并对原型进行初始化;
利用原型对特征图进行目标像素定位,生成类别特征图;具体步骤为:使用原型逐像素对特征图进行点乘,每个原型产生一个一通道特征图;
将类别特征图融合并进行图像分类学习;类别特征图融合的具体过程为:三组原型产生了三个类别特征图;三个类别特征图尺寸都经过缩放后进行调和相加,然后送入卷积中进行处理得到处理后的特征图;
提取类别特征图中的类别激活图得到图像类别掩码,进而获得类别分割图。
进一步的,对图像进行预处理的具体步骤为:将图像尺寸等比例缩放,对每个像素元素进行正则化。
进一步的,对原型进行初始化的具体步骤为:使用随机数初始化三组原型向量集合,每组包含总类别个数个类别原型。
进一步的,图像分类学习的具体步骤为:对得到的经卷积处理后的特征图进行全局平均池化,得到特征向量,直接使用该特征向量计算交叉熵损失。
进一步的,使用类激活图算法提取类别激活图,通过上采样得到原图大小的图像类别掩码。
本发明第二方面提供了一种基于多尺度类别原型的弱监督图像语义分割系统,包括:
图像处理模块,被配置为收集待分割图像,标注每张图像的类别,对图像进行预处理;将图像输入特征提取网络中获取特征图;
原型构建模块,被配置为设置三组原型向量集合,并对原型进行初始化;
目标像素定位模块,被配置为利用原型对特征图进行目标像素定位生成类别特征图;具体步骤为:使用原型逐像素对特征图进行点乘,每个原型产生一个一通道特征图;
分类学习模块,被配置为将类别特征图融合并进行图像分类学习;类别特征图融合的具体过程为:三组原型产生了三个类别特征图;三个类别特征图尺寸都经过缩放后进行调和相加,然后送入卷积中进行处理得到处理后的特征图;
类别分割图生成模块,被配置为提取类别特征图中的类别激活图得到图像类别掩码,进而获得类别分割图。
进一步的,图像处理模块对图像进行预处理时被配置为,将图像尺寸等比例缩放,对每个像素元素进行正则化。
进一步的,原型构建模块对原型进行初始化时被配置为,使用随机数初始化三组原型向量集合,每组包含总类别个数个类别原型。
进一步的,分类学习模块进行图像分类学习时被配置为,对得到的经卷积处理后的特征图进行全局平均池化,得到特征向量,直接使用该特征向量计算交叉熵损失。
进一步的,类别分割图生成模块还被配置为使用类激活图算法提取类别激活图,通过上采样得到原图大小的图像类别掩码。
上述本发明的实施例的有益效果如下:
本发明公开了一种基于多尺度类别原型的弱监督图像语义分割方法,通过使用类别原型机制,从图像特征图中发掘类别的位置和语义,准确推断对象的语音信息和像素位置。提取语义信息后,采用多尺度原型能够更好的融合不同粒度级别的语义信息,大大提高了弱监督前置分类任务对目标的定位能力。
本发明通过学习一组语意原型,从同类图像中学习到定位共有特征的能力,从而使其在泛化到测试图像时保持较高的定位能力,进而更好的实现弱监督图像的语义分割。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例一中基于多尺度类别原型的弱监督图像语义分割方法的整体流程示意图;
图2为本发明实施例一基于多尺度类别原型的弱监督图像语义分割方法中获得类别分割图过程的示意图。
具体实施方式:
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合;
实施例一:
本发明实施例一提供了一种基于多尺度类别原型的弱监督图像语义分割方法,如图1所示,将待处理图像输入进卷积神经网络中,得到三组特征图形状f1、f2、f3,将f1、f2、f3与设置好的向量长度使用原型逐像素进行点乘定位,对应关系分别为P[1]对f1进行定位,P[2]对f2进行定位,P[3]对f3进行定位,三组原型产生了三个类别特征图M1,M2,M3,将类别特征图融合并送入1*1卷积进行处理得到特征图Z,对Z进行全局平均池化得到的分类分数并计算交叉熵损失。
此外,获得类别分割图的具体过程如图2所示,类别特征图融合融合后并送入1*1卷积进行处理得到特征图Z,对Z进行全局平均池化得到的分类分数,从得分最高的类别进行反向传播,得到输入1*1卷积前特征图的梯度,从而得到类别分割图。
具体包括以下步骤:
S1:收集待分割图像,标注每张图像的类别,对图像进行预处理;将图像输入特征提取网络中获取特征图。
S1.1:将图像转换成RGB三通道,长边缩放到512大小,短边等比例收缩,不足512的部分填充0。
S1.2:RGB三通道分别使用0.485,0.456,0.406作为均值,0.229,0.224,0.225作为方差进行正则化。
S2:设置三组原型向量集合,并对原型进行初始化。
S2.1:使用随机数初始化三组原型向量集合,每组包含总类别个数(class_num)个类别原型。
优选的,每组原型的元素设置为可被反向传播更新。向量长度分别为512(第一组P[1]),1024(第二组P[2]),2048(第三组P[3])。每组集合中原型个数和总类别数一致。每个向量都是可以通过梯度下降进行学习的。
S3:利用原型对特征图进行目标像素定位生成类别特征图。
S3.1:将resnet50网络去掉最后三层(最后三层为全连接层),只保留卷积层。
S3.2:将图像输入到resnet50网络中,获取resnet50后三层卷积层的特征图。
优选的,特征图形状分别为28*28*2048(f3),56*56*1024(f2),112*112*512(f1)。
S3.3:使用原型逐像素对特征图进行点乘<P[1],f1>定位,对应关系分别为P[1]对f1进行定位,P[2]对f2进行定位,P[3]对f3进行定位。每个原型产生一个一通道特征图。即:
Mi=<P[i],fi>i∈{1,2,...,n}
其中,M是原型和特征图交互得到的定位图,P是原型,f是网络的特征图,i表示第i个特征图,n为特征图个数,这里等于3。
S4:多尺度原型特征交互:三个原型产生的特征两两进行交互,交互时对尺寸较小的特征图进行上采样,交互方式采用交叉注意力,空间尺寸较小的特征图作为query,空间尺寸较大的特征图作为key,和value。然后,得到三组交互后的特征图。
S4.1:三组原型产生了三个类别特征图M1,M2,M3。M1首先和M2使用两次交叉注意力M2作为queryQ,M1作为key K和value V,从而得到Z1,M2与M3进行同样的操作,M3作为queryQ,M2作为key K和value V,经过两次交叉注意力得到Z2。同样地,M1和M3使用两次交叉注意力,其中M3作为query Q,M1作为key K和valueV得到Z3
S5:将类别特征图融合并进行图像分类学习。图像分类学习具体为对交互后的三组特征图进行全局最大池化,得到三个特征向量。三组特征图进行调和相加得到新的融合后的特征图,进行全局最大池化得到融合后的特征向量。分别计算四组特征图交叉熵损失训练网络。
S5.1:三组原型产生了三个类别特征图M1,M2,M3。三者尺寸都缩放到112*112尺寸之后进行调和相加:
Figure BDA0003876542530000071
Figure BDA0003876542530000072
其中,n为特征图个数,
Figure BDA0003876542530000081
表示尺寸缩放后的特征图,i表示第i个特征图,
Figure BDA0003876542530000082
为调和相加后的特征图。
S5.2:将
Figure BDA0003876542530000083
送入1*1卷积进行处理得到特征图Z:
Figure BDA0003876542530000084
S5.3:对S5.2得到的处理后的特征图Z进行全局最大池化并使用softmax得到分类分数:
Figure BDA0003876542530000085
其中,max H,W()代表在空间维度取最大值,H和W分别代表特征图Z的宽和高,
Figure BDA0003876542530000086
是通过对特征图Z进行平均池化得到的分类分数,i表示第i个特征图。
S5.4:计算交叉熵损失
Figure BDA0003876542530000087
Figure BDA0003876542530000088
通过减小预测的分类分数
Figure BDA0003876542530000089
与真实标签y之间的差距,使用交叉熵作为损失函数提供监督信号以优化模型。
S6:提取类别特征图中的类别激活图,通过上采样得到图像类别掩码,进而获得类别分割图。
S6.1:使用类激活图(grad-cam)算法从得分最高的类别进行反向传播,得到Z4中输入1*1卷积前特征图的梯度,然后使用grad-cam算法即可得到类别分割图。
实施例二:
本发明实施例二提供了一种基于多尺度类别原型的弱监督图像语义分割系统,包括:
图像处理模块,被配置为收集待分割图像,标注每张图像的类别,对图像进行预处理;将图像输入特征提取网络中获取特征图;
原型构建模块,被配置为设置三组原型向量集合,并对原型进行初始化;
目标像素定位模块,被配置为利用原型对特征图进行目标像素定位生成类别特征图;具体步骤为:使用原型逐像素对特征图进行点乘,每个原型产生一个一通道特征图;
分类学习模块,被配置为将类别特征图融合并进行图像分类学习;类别特征图融合的具体过程为:三组原型产生了三个类别特征图;三个类别特征图尺寸都经过缩放后进行调和相加,然后送入卷积中进行处理得到处理后的特征图;
类别分割图生成模块,被配置为提取类别特征图中的类别激活图得到图像类别掩码,进而获得类别分割图。
图像处理模块对图像进行预处理时被配置为,将图像尺寸等比例缩放,对每个像素元素进行正则化。
原型构建模块对原型进行初始化时被配置为,使用随机数初始化三组原型向量集合,每组包含总类别个数个类别原型。
分类学习模块进行图像分类学习时被配置为,对得到的经卷积处理后的特征图进行全局平均池化,得到特征向量,直接使用该特征向量计算交叉熵损失。
类别分割图生成模块还被配置为使用类激活图算法提取类别激活图,通过上采样得到原图大小的图像类别掩码。
详细步骤与实施例一提供的基于多尺度类别原型的弱监督图像语义分割方法相同,这里不再赘述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于多尺度类别原型的弱监督图像语义分割方法,其特征在于,包括以下步骤:
收集待分割图像,标注每张图像的类别,对图像进行预处理;将图像输入特征提取网络中获取特征图;
设置三组原型向量集合,并对原型进行初始化;
利用原型对特征图进行目标像素定位生成类别特征图;具体步骤为:使用原型逐像素对特征图进行点乘,每个原型产生一个一通道特征图;
将类别特征图融合并进行图像分类学习;类别特征图融合的具体过程为:三组原型产生了三个类别特征图;三个类别特征图尺寸都经过缩放后进行调和相加,然后送入卷积中进行处理得到处理后的特征图;
提取类别特征图中的类别激活图得到图像类别掩码,进而获得类别分割图。
2.如权利要求1所述的基于多尺度类别原型的弱监督图像语义分割方法,其特征在于,对图像进行预处理的具体步骤为:将图像尺寸等比例缩放,对每个像素元素进行正则化。
3.如权利要求1所述的基于多尺度类别原型的弱监督图像语义分割方法,其特征在于,对原型进行初始化的具体步骤为:使用随机数初始化三组原型向量集合,每组包含总类别个数个类别原型。
4.如权利要求1所述的基于多尺度类别原型的弱监督图像语义分割方法,其特征在于,图像分类学习的具体步骤为:对得到的经卷积处理后的特征图进行全局平均池化,得到特征向量,直接使用该特征向量计算交叉熵损失。
5.如权利要求1所述的基于多尺度类别原型的弱监督图像语义分割方法,其特征在于,使用类激活图算法提取类别激活图,通过上采样得到原图大小的图像类别掩码。
6.一种基于多尺度类别原型的弱监督图像语义分割系统,其特征在于,包括:
图像处理模块,被配置为收集待分割图像,标注每张图像的类别,对图像进行预处理;将图像输入特征提取网络中获取特征图;
原型构建模块,被配置为设置三组原型向量集合,并对原型进行初始化;
目标像素定位模块,被配置为利用原型对特征图进行目标像素定位生成类别特征图;具体步骤为:使用原型逐像素对特征图进行点乘,每个原型产生一个一通道特征图;
分类学习模块,被配置为将类别特征图融合并进行图像分类学习;类别特征图融合的具体过程为:三组原型产生了三个类别特征图;三个类别特征图尺寸都经过缩放后进行调和相加,然后送入卷积中进行处理得到处理后的特征图;
类别分割图生成模块,被配置为提取类别特征图中的类别激活图得到图像类别掩码,进而获得类别分割图。
7.如权利要求6所述的基于多尺度类别原型的弱监督图像语义分割系统,其特征在于,图像处理模块对图像进行预处理时被配置为,将图像尺寸等比例缩放,对每个像素元素进行正则化。
8.如权利要求6所述的基于多尺度类别原型的弱监督图像语义分割系统,其特征在于,原型构建模块对原型进行初始化时被配置为,使用随机数初始化三组原型向量集合,每组包含总类别个数个类别原型。
9.如权利要求6所述的基于多尺度类别原型的弱监督图像语义分割系统,其特征在于,分类学习模块进行图像分类学习时被配置为,对得到的经卷积处理后的特征图进行全局平均池化,得到特征向量,直接使用该特征向量计算交叉熵损失。
10.如权利要求6所述的基于多尺度类别原型的弱监督图像语义分割系统,其特征在于,类别分割图生成模块还被配置为使用类激活图算法提取类别激活图,通过上采样得到原图大小的图像类别掩码。
CN202211215498.4A 2022-09-28 2022-09-28 基于多尺度类别原型的弱监督图像语义分割方法及系统 Pending CN115482387A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211215498.4A CN115482387A (zh) 2022-09-28 2022-09-28 基于多尺度类别原型的弱监督图像语义分割方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211215498.4A CN115482387A (zh) 2022-09-28 2022-09-28 基于多尺度类别原型的弱监督图像语义分割方法及系统

Publications (1)

Publication Number Publication Date
CN115482387A true CN115482387A (zh) 2022-12-16

Family

ID=84394608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211215498.4A Pending CN115482387A (zh) 2022-09-28 2022-09-28 基于多尺度类别原型的弱监督图像语义分割方法及系统

Country Status (1)

Country Link
CN (1) CN115482387A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116597151A (zh) * 2023-07-17 2023-08-15 南京亚信软件有限公司 一种基于细粒度特征分组的无监督语义分割方法
CN117036832A (zh) * 2023-10-09 2023-11-10 之江实验室 一种基于随机多尺度分块的图像分类方法、装置及介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116597151A (zh) * 2023-07-17 2023-08-15 南京亚信软件有限公司 一种基于细粒度特征分组的无监督语义分割方法
CN116597151B (zh) * 2023-07-17 2023-09-26 南京亚信软件有限公司 一种基于细粒度特征分组的无监督语义分割方法
CN117036832A (zh) * 2023-10-09 2023-11-10 之江实验室 一种基于随机多尺度分块的图像分类方法、装置及介质
CN117036832B (zh) * 2023-10-09 2024-01-05 之江实验室 一种基于随机多尺度分块的图像分类方法、装置及介质

Similar Documents

Publication Publication Date Title
CN109614979B (zh) 一种基于选择与生成的数据增广方法及图像分类方法
Liu et al. Multi-objective convolutional learning for face labeling
CN112132197B (zh) 模型训练、图像处理方法、装置、计算机设备和存储介质
CN113657387B (zh) 基于神经网络的半监督三维点云语义分割方法
CN108595558B (zh) 一种数据均衡策略和多特征融合的图像标注方法
CN115482387A (zh) 基于多尺度类别原型的弱监督图像语义分割方法及系统
Meng et al. Weakly supervised semantic segmentation by a class-level multiple group cosegmentation and foreground fusion strategy
CN112287941B (zh) 一种基于自动字符区域感知的车牌识别方法
CN112115265A (zh) 文本分类中的小样本学习方法
CN113313173B (zh) 基于图表示和改进Transformer的人体解析方法
CN108154156B (zh) 基于神经主题模型的图像集成分类方法及装置
CN110111365B (zh) 基于深度学习的训练方法和装置以及目标跟踪方法和装置
CN110728307A (zh) 自生成数据集与标签实现x光影像图小样本字符识别方法
Rios et al. Feature visualization for 3D point cloud autoencoders
CN115240024A (zh) 一种联合自监督学习和半监督学习的地外图片分割方法和系统
CN112561926A (zh) 三维图像分割方法、系统、存储介质及电子设备
Saqib et al. Intelligent dynamic gesture recognition using CNN empowered by edit distance
CN112183464A (zh) 基于深度神经网络和图卷积网络的视频行人识别方法
CN114333062A (zh) 基于异构双网络和特征一致性的行人重识别模型训练方法
CN111143544B (zh) 一种基于神经网络的柱形图信息提取方法及装置
CN113688715A (zh) 面部表情识别方法及系统
CN117522735A (zh) 基于多尺度的密流感知去雨图像增强方法
CN110942463B (zh) 一种基于生成对抗网络的视频目标分割方法
CN116912486A (zh) 基于边缘卷积和多维特征融合的目标分割方法、电子装置
Li et al. Few-shot meta-learning on point cloud for semantic segmentation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination