CN114067162A - 一种基于多尺度多粒度特征解耦的图像重构方法及系统 - Google Patents

一种基于多尺度多粒度特征解耦的图像重构方法及系统 Download PDF

Info

Publication number
CN114067162A
CN114067162A CN202111401567.6A CN202111401567A CN114067162A CN 114067162 A CN114067162 A CN 114067162A CN 202111401567 A CN202111401567 A CN 202111401567A CN 114067162 A CN114067162 A CN 114067162A
Authority
CN
China
Prior art keywords
image
decoupling
depth
granularity
hidden variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111401567.6A
Other languages
English (en)
Inventor
王烨
赵钱蒙可
刘群
王国胤
冷佳旭
郑丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202111401567.6A priority Critical patent/CN114067162A/zh
Publication of CN114067162A publication Critical patent/CN114067162A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于图像领域,具体涉及一种基于多尺度多粒度特征解耦的图像重构方法及系统,包括提供一种深度隐变量特征解耦生成模型,模型包括编码器、隐空间特征解耦、分类模型和重构模型四个模块,利用编码器对图像进行编码,得到包含多粒度语义信息的深度隐变量;分类模型根据解耦后的深度隐变量包含的粗粒度信息,对图像的所属类别进行细化;重构模型对解耦后的深度隐变量进行解码,得到重构生成图像;本发明利用多尺度多粒度语义标签将深度隐变量生成模型的隐空间有监督的解耦成不同层次的语义类别的子空间,更好地学习到图像中不同粒度层次的语义信息,从而能更好地应用于生成任务。

Description

一种基于多尺度多粒度特征解耦的图像重构方法及系统
技术领域
发明属于图像领域,涉及深度隐变量特征解耦的图像重构模型,具体涉及一种基于多尺度多粒度特征解耦的图像重构方法。
背景技术
图像生成的关键在于对深度隐变量进行特征解耦,使模型学习到的各个语义之间相互独立,从而更好地应用于后续图像重构。现有技术主要分为无监督学习和有监督学习两种任务来进行,都是使用深度隐变量模型,尝试对模型学习到的高维隐空间变量中的不同语义进行分离,将隐变量解耦成特定的特征表示。然而上述的模型不管是在有监督学习还是在无监督学习的情况下,特征解耦都是在同一粒度级下进行的,缺乏层次性,从而不能较好地对不同层次之间的语义信息进行学习以及解耦。
图像的重构常采用自编码器,传统的自编码器包括编码器和解码器,只具备编码和解码的功能。自编码器采用的结构可分为两类,一类是编码器和解码器都采用一个CNN网络,其重构图像效果好,但由于CNN的结构特性导致高维空间维度过高,且隐空间杂乱无章,无法用已有标签信息引导隐空间解耦,另一类是编码器和解码器都采用多层感知器(Multi-Layer Perceptron,MLP),MLP除了输入层和输出层,它中间有多个隐层,且隐层数量可以自行设定,但重构图像效果比采用CNN网络的自编码器差,因此如何在保障图像重构效果的同时实现深度隐变量的解耦也是研究的焦点。
发明内容
为解决现有模型对深度隐变量特征解耦都是在同一粒度层次下进行的,不能很好的捕捉不同层次之间的语义信息的问题。本发明提供了一种基于多尺度多粒度特征解耦的图像重构方法,提出多尺度自编码器,其包括编码器、隐空间特征解耦和重构模型三个模块,从而构建一种深度隐变量特征解耦生成模型,包括多尺度自编码器和可用于下游分类任务的分类模型,包括以下步骤:
S1、获取图像样本集及图像样本集中每张图像样本的粗粒度标签和细粒度标签,并初始化深度隐变量特征解耦生成模型的参数;
S2、从图像样本集中抽取图像样本,将该图像样本及其粗粒度标签和细粒度标签送入深度隐变量特征解耦生成模型;
S3、将图像样本输入编码器得到该图像的深度隐变量,深度隐变量经过隐空间特征解耦并根据细粒度标签计算该深度隐变量的特征解耦损失;
S4、将S3中计算特征解耦损失后的深度隐变量送入重构模型,得到重构输出结果,并计算重构输出结果的损失;
S5、将S3中计算特征解耦损失后的深度隐变量送入分类模型,分类模型根据粗粒度标签得到分类输出结果,并计算分类输出结果的损失;
S6、将以上三种损失相加,通过梯度反向传播更新深度隐变量特征解耦生成模型的参数,参数更新后返回步骤S2进行迭代,直到参数收敛完成深度隐变量的特征解耦;
S7、将实时数据送入训练好的深度隐变量特征解耦生成模型,得到实时数据的重构图像及重构图像的类别信息。
进一步的,采用CNN和多层感知器构建编码器和重构模型。
进一步的,本发明基于自编码器(AE)提出了多尺度自编码器Multi-scale Auto-Encoder(MAE),其能让深度隐变量学习到代表图像类别的粗粒度信息和代表图像中具体语义的细粒度信息。
进一步的,通过损失函数训练深度隐变量特征解耦生成模型,该损失函数表示为:
Loss(X)=LZ+Lcls+Lrec
其中,LZ是编码器采用的损失函数,Lcls是分类损失函数,Lrec是重构损失函数。
进一步的,图像样本输入编码器后得到深度隐变量,通过损失函数对该深度隐变量进行训练,损失函数表示为:
Figure BDA0003371135590000031
其中,N是图像样本总数,T是图像样本深度隐变量的总维度数,α是图像样本中不同语义间的权重值,pt是第t维度的语义概率值,yt是第t维度的细粒度标签信息,γ是超参数,Xi是第i个图像样本。
进一步的,经过编码得到的深度隐变量包含多粒度的语义信息,每个深度隐变量代表一个特定粗粒度信息,隐变量中的每个维度代表一个特定细粒度语义信息,维度之间系相互独立。
进一步的,采用分类损失函数训练分类模型,分类损失函数表示为:
Figure BDA0003371135590000032
其中,M是粗粒度类别总数,N是图像样本总数,ym(Xi)是第i个图像样本是第m个粗粒度类别的概率值,pm是第m个粗粒度类别的标签信息,Xi是第i个图像样本。
进一步的,采用重构损失函数训练重构模型,重构损失函数表示为:
Figure BDA0003371135590000033
其中,EZ表示对图像样本进行编码得到深度隐变量z,Dx表示对深度隐变量解码得到重构输入,N是图像样本总数,Xi是第i个图像样本。
一种基于多尺度多粒度特征解耦的图像重构系统,包括多尺度自编码器和分类模块,多尺度自编码器包括编码器模块、隐空间解耦模块和重构模块,其中:
编码器模块,用于对输入图像进行编码,得到深度隐变量;
隐空间解耦模块,用于将编码器模块得到的深度隐变量进行多粒度特征解耦;
重构模块,用于对多粒度特征解耦后的深度隐变量进行解码,解码后得到重构图像;
分类模块,用于对多粒度特征解耦后的深度隐变量进行分类得到其分类信息。
本发明的有益效果:
本发明基于自编码器提出多尺度自编码器,采用CNN和多层感知器相结合的方式构建编码器与重构模型,并在传统自编码器的基础上添加深度隐变量在隐空间的特征解耦。多尺度自编码器对输入图像进行编码得到包含多尺度多粒度语义信息的深度隐变量,并将深度隐变量在隐空间特征解耦使得特征解耦在不同粒度级下进行,提升图像重构效果,在保证重构效果的同时添加下游分类任务,得到图像的分类信息,提升了图像分类的准确度。
本发明利用多尺度多粒度语义标签将深度隐变量生成模型的隐空间有监督的解耦成不同层次的语义类别的子空间,更好地学习到图像中不同粒度层次的语义信息,从而能更好地应用于生成任务,体现模型的可解释性。
附图说明
图1为本发明深度隐变量特征解耦生成模型的结构图;
图2为本发明深度隐变量特征解耦生成模型的训练流程图;
图3为本发明输入图像与重构图像对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于多尺度多粒度特征解耦的图像分类和重构方法,提供一种深度隐变量特征解耦生成模型,如图1所示,包括编码器Encoder、分类模型Classification Model和重构模型Reconstruction Model三个模块,深度隐变量特征解耦生成模型的使用包括以下步骤:
输入图像,利用编码器对图像进行编码,得到包含多粒度语义信息的深度隐变量;
对包含多粒度语义信息的深度隐变量进行多尺度多粒度解耦,得到可视化的粗粒度信息和细粒度信息;
分类模型根据解耦后的深度隐变量包含的粗粒度信息,对图像的所属类别进行细化;
重构模型对解耦后的深度隐变量进行解码,得到重构生成图像。
优选地,采用CNN和多层感知器构建编码器和重构模型。图像在输入编码器后,首先经过一个CNN模型,提取图像中不同层次粒度特征后,将CNN终层输出的多通道特征转换成一维特征,紧接着进入多层感知器,让模型对不同层次粒度特征继续进行学习,以此得到深度隐变量。而重构模型是编码器的逆过程,即让深度隐变量经过多层感知器后,将得到的一维特征转换成多通道特征后,再放入CNN模型,得到最终的重构图像;
优选地,提出多尺度自编码器,多尺度自编码器在自编码器的基础上增加隐空间特征解耦,使得输入图像经过编码得到深度隐变量,对该深度隐变量在隐空间进行多粒度特征解耦,让深度隐变量学习到代表图像类别的粗粒度信息和代表图像中具体语义的细粒度信息,最后对深度隐变量进行解码输出重构图像。
具体地,输入图像经过编码得到的深度隐变量包含多粒度的语义信息,每个深度隐变量代表一个特定粗粒度信息,隐变量中的每个维度代表一个特定细粒度语义信息,维度之间系相互独立。
在另一实施例中,深度隐变量特征解耦生成模型的训练及使用过程,如图2所示,提出多尺度自编码器,其包括编码器、隐空间特征解耦和重构模型三个模块,其中重构模型也称为解码器,从而构建一种深度隐变量特征解耦生成模型,包括多尺度自编码器和分类模型,包括以下步骤:
S1、获取图像样本集及图像样本集中每张图像样本的粗粒度标签和细粒度标签,并初始化深度隐变量特征解耦生成模型的参数;
具体地,本发明采用的图像样本集的粗粒度类别信息有11类,细粒度语义信息有80类。
S2、从图像样本集中抽取图像样本,将该图像样本及其粗粒度标签和细粒度标签送入深度隐变量特征解耦生成模型;
S3、将图像样本输入编码器得到该图像的深度隐变量,深度隐变量经过隐空间特征解耦并根据细粒度标签计算该深度隐变量的特征解耦损失;
S4、将S3中计算特征解耦损失后的深度隐变量送入重构模型得到重构输出结果,并计算重构输出结果的损失;
S5、将S3中计算特征解耦损失后的深度隐变量送入分类模型,分类模型根据粗粒度标签得到分类输出结果,并计算分类输出结果的损失;
S6、将以上三种损失相加,通过梯度反向传播更新深度隐变量特征解耦生成模型的参数,参数更新后返回步骤S2进行迭代,直到参数收敛;
S7、将实时数据送入训练好的深度隐变量特征解耦生成模型,得到实时数据的重构图像及重构图像的类别信息。
具体地,表1是聚类指标,记录了深度隐变量的粗粒度类别聚类Coarse-grainedCategory Clustering(CCC)和细粒度语义聚类Fine-grained Semantic Clustering(FSC)的定量指标结果,表明深度隐变量不同层次粒度的解耦效果,表中采用高斯混合模型GMM、K-means聚类算法、基于密度的DBSCAN聚类算法、分级聚类hierarchical clustering四种算法测量计算了粗粒度类别聚类和细粒度语义聚类的聚类概率。
表1 聚类指标
Figure BDA0003371135590000071
具体地,表2为分类指标,记录了加入与不加入下游重构生成任务,对于原本下游分类任务的精度影响对比,表明增加下游重构任务几乎不对分类精度有影响,表格中的Vanilla-VGG13、Vanilla-VGG16和Vanilla-VGG19分别表示采用VGG13、VGG16和VGG19的传统编码器加入分类模型的分类效果;VGG13 variant+Ours表示本发明的模型编码采用VGG13,解码采用VGG13的逆过程后加入分类模型得到的分类效果,后面的VGG16 variant+Ours和VGG19 variant+Ours同理;此外,IA表示模型对图像中粗粒度和细粒度信息都预测正确的样本在所有样本中的比例,IR表示模型对图像中粗粒度和细粒度信息都预测正确的样本在模型只对粗粒度类别信息预测正确的样本中所占的比例,IP表示模型对图像中粗粒度和细粒度信息都预测正确的样本在模型只对细粒度语义信息预测正确的样本中所占的比例,IF1为IR和IP的综合考量指标,由表可知,本发明在保证重构效果良好的前提下可以产生好的分类效果。
表2 分类指标
Figure BDA0003371135590000072
优选地,通过损失函数训练深度隐变量特征解耦生成模型,该损失函数表示为:
Loss(X)=LZ+Lcls+Lrec
其中,LZ是编码器采用的损失函数,Lcls是分类损失函数,Lrec是重构损失函数。
优选地,图像样本输入编码器后被编码到隐空间相应的位置,从而得到深度隐变量,通过损失函数对该深度隐变量进行训练,损失函数表示为:
Figure BDA0003371135590000081
其中,N是图像样本总数,T是图像样本深度隐变量的总维度数,α是图像样本中不同语义间的权重值,pt是第t维度的语义概率值,yt是第t维度的细粒度标签信息,γ是超参数,Xi是第i个图像样本。
在模型没训练完成之前,图像样本输入编码器会被不可控地编码到隐空间的不同位置,在可视化图中就是显示出杂乱无章的样子,当模型训练结束后,相同粗粒度或者细粒度标签的图像样本输入编码器后都会可控地出现在隐空间的相应位置,如图1所示。
优选地,经过编码得到的深度隐变量包含多粒度的语义信息,每个深度隐变量代表一个特定粗粒度信息,隐变量中的每个维度代表一个特定细粒度语义信息,维度之间系相互独立。
优选地,采用分类损失函数训练分类模型,分类损失函数表示为:
Figure BDA0003371135590000082
其中,M是粗粒度类别总数,N是图像样本总数,ym(Xi)是第i个图像样本是第m个粗粒度类别的概率值,pm是第m个粗粒度类别的标签信息,Xi是第i个图像样本。
优选地,采用重构损失函数训练重构模型,重构损失函数表示为:
Figure BDA0003371135590000083
其中,EZ表示对图像样本进行编码得到深度隐变量z,Dx表示对深度隐变量解码得到重构输入,N是图像样本总数,Xi是第i个图像样本。
在一实施例中,构建一种基于多尺度多粒度特征解耦的图像重构系统,包括多尺度自编码器和分类模块,多尺度自编码器包括编码器模块、隐空间解耦模块和重构模块,其中:
编码器模块,用于对输入图像进行编码,得到深度隐变量;
隐空间解耦模块,用于将编码器模块得到的深度隐变量进行多粒度特征解耦;
重构模块,用于对多粒度特征解耦后的深度隐变量进行解码,解码后得到重构图像;
具体地,图3是输入图像与重构图像的对比图,记录了输入图像与经过模型重构生成的图像的质量对比。
分类模块,用于对多粒度特征解耦后的深度隐变量进行分类得到重构图像的分类信息。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种基于多尺度多粒度特征解耦的图像重构方法,其特征在于,提出多尺度自编码器,其包括编码器、隐空间特征解耦和重构模型三个模块,从而构建一种深度隐变量特征解耦生成模型,包括多尺度自编码器和用于下游分类任务的分类模型,包括以下步骤:
S1、获取图像样本集及图像样本集中每张图像样本的粗粒度标签和细粒度标签,并初始化深度隐变量特征解耦生成模型的参数;
S2、从图像样本集中抽取图像样本,将该图像样本及其粗粒度标签和细粒度标签送入深度隐变量特征解耦生成模型;
S3、将图像样本输入编码器得到该图像的深度隐变量,深度隐变量经过隐空间特征解耦并根据细粒度标签计算该深度隐变量的特征解耦损失;
S4、将S3中计算特征解耦损失后的深度隐变量送入重构模型得到重构输出结果,并计算重构输出结果的损失;
S5、将S3中计算特征解耦损失后的深度隐变量送入分类模型,分类模型根据粗粒度标签得到分类输出结果,并计算分类输出结果的损失;
S6、将以上三种损失相加,通过梯度反向传播更新深度隐变量特征解耦生成模型的参数,参数更新后返回步骤S2进行迭代,直到参数收敛完成深度隐变量的特征解耦;
S7、将实时数据送入训练好的深度隐变量特征解耦生成模型,得到实时数据的重构图像及重构图像的类别信息。
2.根据权利要求1所述的一种基于多尺度多粒度特征解耦的图像重构方法,其特征在于,经过编码得到的深度隐变量包含多粒度的语义信息,每个深度隐变量代表一个特定粗粒度信息,深度隐变量中的每个维度代表一个特定细粒度语义信息,维度之间相互独立。
3.根据权利要求1所述的一种基于多尺度多粒度特征解耦的图像重构方法,其特征在于,通过损失函数训练深度隐变量特征解耦生成模型,该损失函数表示为:
Loss(X)=LZ+Lcls+Lrec
其中,LZ是编码器采用的损失函数,Lcls是分类损失函数,Lrec是重构损失函数。
4.根据权利要求1或3所述的一种基于多尺度多粒度特征解耦的图像重构方法,其特征在于,图像样本输入编码器后得到深度隐变量,通过损失函数对该深度隐变量进行训练,损失函数表示为:
Figure FDA0003371135580000021
其中,N是图像样本总数,T是图像样本深度隐变量的总维度数,α是图像样本中不同语义间的权重值,pt是第t维度的语义概率值,yt是第t维度的细粒度标签信息,γ是超参数,Xi是第i个图像样本。
5.根据权利要求1或3所述的一种基于多尺度多粒度特征解耦的图像重构方法,其特征在于,采用分类损失函数训练分类模型,分类损失函数表示为:
Figure FDA0003371135580000022
其中,M是粗粒度类别总数,N是图像样本总数,ym(Xi)是第i个图像样本是第m个粗粒度类别的概率值,pm是第m个粗粒度类别的标签信息,Xi是第i个图像样本。
6.根据权利要求1或3所述的一种基于多尺度多粒度特征解耦的图像重构方法,其特征在于,采用重构损失函数训练重构模型,重构损失函数表示为:
Figure FDA0003371135580000023
其中,EZ表示对图像样本进行编码得到深度隐变量z,Dx表示对深度隐变量解码得到重构输入,N是图像样本总数,Xi是第i个图像样本。
7.根据权利要求1所述的一种基于多尺度多粒度特征解耦的图像重构方法,其特征在于,采用CNN和多层感知器构建编码器和重构模型。
8.一种基于多尺度多粒度特征解耦的图像重构系统,其特征在于,包括多尺度自编码器和分类模块,多尺度自编码器包括编码器模块、隐空间解耦模块和重构模块,其中:
编码器模块,用于对输入图像进行编码,得到深度隐变量;
隐空间解耦模块,用于将编码器模块得到的深度隐变量进行多粒度特征解耦;
重构模块,用于对多粒度特征解耦后的深度隐变量进行解码,解码后得到重构图像;
分类模块,用于对多粒度特征解耦后的深度隐变量进行分类得到其分类信息。
CN202111401567.6A 2021-11-24 2021-11-24 一种基于多尺度多粒度特征解耦的图像重构方法及系统 Pending CN114067162A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111401567.6A CN114067162A (zh) 2021-11-24 2021-11-24 一种基于多尺度多粒度特征解耦的图像重构方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111401567.6A CN114067162A (zh) 2021-11-24 2021-11-24 一种基于多尺度多粒度特征解耦的图像重构方法及系统

Publications (1)

Publication Number Publication Date
CN114067162A true CN114067162A (zh) 2022-02-18

Family

ID=80275661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111401567.6A Pending CN114067162A (zh) 2021-11-24 2021-11-24 一种基于多尺度多粒度特征解耦的图像重构方法及系统

Country Status (1)

Country Link
CN (1) CN114067162A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114418919A (zh) * 2022-03-25 2022-04-29 北京大甜绵白糖科技有限公司 图像融合方法及装置、电子设备和存储介质
CN114915786A (zh) * 2022-04-26 2022-08-16 哈尔滨工业大学(深圳) 一种面向物联网场景的非对称语义图像压缩方法
CN117095132A (zh) * 2023-10-18 2023-11-21 北京渲光科技有限公司 基于隐式函数的三维重建方法和系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114418919A (zh) * 2022-03-25 2022-04-29 北京大甜绵白糖科技有限公司 图像融合方法及装置、电子设备和存储介质
CN114915786A (zh) * 2022-04-26 2022-08-16 哈尔滨工业大学(深圳) 一种面向物联网场景的非对称语义图像压缩方法
CN114915786B (zh) * 2022-04-26 2023-07-28 哈尔滨工业大学(深圳) 一种面向物联网场景的非对称语义图像压缩方法
CN117095132A (zh) * 2023-10-18 2023-11-21 北京渲光科技有限公司 基于隐式函数的三维重建方法和系统
CN117095132B (zh) * 2023-10-18 2024-02-20 北京渲光科技有限公司 基于隐式函数的三维重建方法和系统

Similar Documents

Publication Publication Date Title
CN111291212B (zh) 基于图卷积神经网络的零样本草图图像检索方法和系统
CN109299342B (zh) 一种基于循环生成式对抗网络的跨模态检索方法
CN114067162A (zh) 一种基于多尺度多粒度特征解耦的图像重构方法及系统
CN113780003B (zh) 时空数据变分编解码跨模态增强方法
CN113806494B (zh) 一种基于预训练语言模型的命名实体识别方法
CN111581385A (zh) 一种不平衡数据采样的中文文本类别识别系统及方法
CN113535953B (zh) 一种基于元学习的少样本分类方法
CN112749274B (zh) 基于注意力机制和干扰词删除的中文文本分类方法
CN110866542A (zh) 一种基于特征可控融合的深度表示学习方法
CN112434628B (zh) 基于主动学习和协同表示的小样本图像分类方法
CN112164067A (zh) 一种基于多模态子空间聚类的医学图像分割方法及装置
CN111666406A (zh) 基于自注意力的单词和标签联合的短文本分类预测方法
CN117475038B (zh) 一种图像生成方法、装置、设备及计算机可读存储介质
CN112597766A (zh) 一种基于BERT-base网络的带噪半监督文本分类方法
Dai et al. Hybrid deep model for human behavior understanding on industrial internet of video things
CN111523943A (zh) 一种电影票房预测模型的构建方法及电影票房预测方法
CN117217368A (zh) 预测模型的训练方法、装置、设备、介质及程序产品
CN113920379B (zh) 一种基于知识辅助的零样本图像分类方法
CN116595406A (zh) 基于角色一致性的事件论元角色分类方法及系统
CN112035689A (zh) 一种基于视觉转语义网络的零样本图像哈希检索方法
CN117009545A (zh) 一种持续多模态知识图谱的构建方法
CN114881032A (zh) 基于多任务学习的层次类别命名实体识别模型设计方法
CN112836482B (zh) 一种基于模板的序列生成模型生成问题的方法及装置
CN113435190B (zh) 一种融合多层次信息抽取和降噪的篇章关系抽取方法
CN110070018A (zh) 一种结合深度学习的地震灾害场景识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination