CN109558890B - 基于自适应权重哈希循环对抗网络的零样本图像分类方法 - Google Patents
基于自适应权重哈希循环对抗网络的零样本图像分类方法 Download PDFInfo
- Publication number
- CN109558890B CN109558890B CN201811158795.3A CN201811158795A CN109558890B CN 109558890 B CN109558890 B CN 109558890B CN 201811158795 A CN201811158795 A CN 201811158795A CN 109558890 B CN109558890 B CN 109558890B
- Authority
- CN
- China
- Prior art keywords
- hash
- weight
- adaptive weight
- adaptive
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
一种基于自适应权重哈希循环对抗网络的零样本图像分类方法:将训练样本的视觉特征和文本语义类别特征分别进行循环对抗网络映射,得到对应的哈希码;将各特征的哈希码进行权重分配,建立自适应权重哈希模型;对自适应权重哈希模型进行训练和测试;为拟合函数,对编码函数进行重新参数化;将视觉特征和文本语义类别特征的哈希码分别进行映射,得到对应的编码;将伯努利变量变量重新参数化;通过映射将哈希码转换为另一模态特征,再由循环一致性对抗网络的生成器,转换为原模态视觉或者语义特征,使得循环一致性损失达到最小,从而实现跨模态零样本分类。本发明实现了不同模态的特征和对应类别进行知识迁移,提高了信息嵌入特征的表征能力。
Description
技术领域
本发明涉及一种零样本图像分类方法。特别是涉及一种基于自适应权重哈希循环对抗网络的零样本图像分类方法。
背景技术
自适应权重算法是一种基于格式塔互连(gestalt grouping)的机制而产生的一套权值分配原则。它主要是用于解释人类视觉系统如何判别前景和背景的方法。当观察一张图像时,显著的物体人们就会给予较多的关注,也就自然而然地把它当作前景,而其余不关注的部分就被当作背景。一开始人们观察一张图像时,只能获得前景的一部分,然后是通过对这一部分进行不断扩展和更为细致的研究,运用该机制对这一部分图像的像素进行权值分配,与中心像素越接近、颜色越相似的像素分配较大的权重,相反相距越远的、颜色越相异的分配较小权重。本发明运用的自适应权重哈希同样运用了该机制,在视觉特征和语义特征中给予相同的类别图像的特征以较大权重,相差越大的类别权重分配越低。
根据先验知识,人类具有来推断未见类别事物的能力,例如:一开始从未见过“大象”,但能根据“大象”的文本描述信息“大鼻子,两边大牙,像河马一样体型硕大”,对大象进行类别分类。受该推断能力的启发,零样本图像分类的目标是通过大量样本的学习,能够对训练阶段从未出现过的类别进行分类和表征。为有效地得到训练图像更多的特征信息,使高维视觉特征转化为低维语义特征中特征信息利用最大化,故使用循环对抗网络(CycleGAN)来训练权重哈希网络。
与传统的生成式对抗网络不同,CycleGAN解决了模型训练数据不成对的问题,将一类图片转换成另一类图片,即想要获取一个数据集的特征,却转化为另一个数据集的特征。该网络实际的目标就是学习两个映射,样本空间x到样本空间y的映射F和样本空间y到样本空间x的映射G,并要求F(G(y))≈y以及G(F(x))≈x,这样空间x的图片转换到Y空间后还可以转换回x空间,也杜绝了模型可以把所有X的图片都转换为Y空间中的同一张图片的特殊情况。
因此,在该网络的两个映射过程中加入自适应权重哈希学习可减少哈希编码的冗余性,利用网络的两个映射被分解为二进制代码生成H和从二进制代码重新生成输入的逆过程P,将两个哈希码对源域和目标域进行映射,极大地提高了相近图像类别在汉明空间的距离相似度,而使不同图像类别距离相差更远。
针对某些特定情况,为了将训练的图像和文本信息利用最大化,提出了自适应权重哈希循环一致性对抗学习,以达到零样本图像分类效果的目的。
发明内容
本发明所要解决的技术问题是,提供一种能够实现不同模态的特征和对应类别进行知识迁移的基于自适应权重哈希循环对抗网络的零样本图像分类方法。
本发明所采用的技术方案是:一种基于自适应权重哈希循环对抗网络的零样本图像分类方法,包括如下步骤:
1)将训练样本的视觉特征xi和文本语义类别特征xt分别采用如下公式进行循环对抗网络映射H*,得到对应的哈希码h(x):
其中x*是视觉特征或文本语义类别特征,Wh,v是自适应权重哈希的网络参数;
2)将步骤1)所生成的各特征的哈希码进行权重分配,建立自适应权重哈希模型;
3)对自适应权重哈希模型进行训练和测试;
4)为拟合函数q(h/x),对编码函数p(h/x)进行重新参数化,
5)将视觉特征xi和文本语义类别特征xt的哈希码分别采用如下公式进行p*映射,得到对应的编码p(h/x):
将伯努利变量变量hk(z),z∈(0,1)重新参数化:
6)通过p*映射将哈希码转换为另一模态特征,
再由循环一致性对抗网络的生成器F或G,转换为原模态视觉或者语义特征,使得循环一致性损失达到最小,从而实现跨模态零样本分类。
步骤2)包括:
(1)定义自适应权重哈希模型的类元素权重层,生成自适应权重W;将步骤1)得到的哈希码h(x)和自适应权重W代入如下公式,得到类元素的权重ω(hx):
ω(hx)=W(CX,:)·hx,s.t.W≥0
其中hx是x*输出的哈希码,CX是x*的图像或者文本的类别索引,·指的是元素的内积;(2)定义权重汉明距离H(Xi,Xj):
其中k为码字;二进制码bk(x)=sgn(hk(x)-0.5),k=1,…,q;hk(x)表示各类别的哈希码;Xi,Xj表示不同的两个特征;
(3)定义三元权重排序损失函数
(4)定义训练时各个类别softmax损失:
其中IC是指示函数,如果c为真,则IC=1,否则IC=0;
(6)用如下公式计算类元素权重层的梯度,从而更新自适应权重网络参数w
(7)由于softmax损失,计算θj的梯度为:
步骤3)所述的训练包括对自适应权重哈希模型输入:图像x,参数m后,进行如下过程:
(1)通过神经网络前向传播将图像x转变为h(x);
(3)计算softmax损失LC(θ);
(6)输出自适应权重网络参数w。
步骤3)所述的测试包括对自适应权重哈希模型输入自适应权重网络参数w,测试图像xq,汉明空间数据库B后,进行如下过程:
(1)导入自适应权重W到类元素权重层;
(2)预测类别概率p(xq);
(3)生成对应哈希码h(xq);
(4)生成自适应权重w(xq),wq=WTp(xq);
(5)计算权重汉明距离H(Xi,Xq);
(6)通过权重汉明距离大小分类图像;
(7)输出分类图像的哈希码。
本发明的基于自适应权重哈希循环对抗网络的零样本图像分类方法,主要优势体现在:
(1)新颖性:提出了一种新的通过自适应权重哈希CycleGAN的框架用于解决零样本分类问题。通过循环一致性对抗权重哈希网络,学习一种联合嵌入模型,从而实现了不同模态的特征和对应类别进行知识迁移。
(2)多模态性:本发明提出的自适应权重哈希CycleGAN的框架将视觉模态特征和类别标签的语义文本模态特征联合嵌入到权重的汉明空间中,在对抗学习的过程中,将样本嵌入特征和类别嵌入特征与类别标签结合,实现不同模态特征到类别的知识迁移。
(3)有效性:与传统的对抗网络学习方法不同,本发明所提出的算法主要是通过自适应权重哈希循环一致性来体现的,对抗学习的方式上也有本质的不同,本发明是将模态经过一系列映射后还是会回到原模态,使模态特征学习后的信息损失到尽可能小,极大地保留了样本特征的低维语义信息,提高了信息嵌入特征的表征能力,有利于最终达到零样本分类的目的。
(4)实用性:简单可行,操作方便。可广泛应用于许多零样本分类任务以及图像的检索、目标检测、语义描述和识别等问题的相关领域中。
附图说明
图1是本发明基于自适应权重哈希循环对抗网络的零样本图像分类方法的原理图;
图2是本发明使用的CycleGAN网络的映射原理图;
图3是对图1自适应权重哈希模型的具体实现过程图。
具体实施方式
下面结合实施例和附图对本发明的基于自适应权重哈希循环对抗网络的零样本图像分类方法做出详细说明。
本发明的基于自适应权重哈希循环对抗网络的零样本图像分类方法,因为跨模态生成哈希是通过哈希码对不同模态的目标对象进行翻译转换,因此其语义一致性的实现没有数据成对的约束限制。利用对抗网络先将视觉特征和文本特征做两个映射,全部映射到汉明空间后,通过自适应权重哈希算法进行分配,生成自适应权重,经过权重汉明距离后生成分类图像的哈希码,最后由循环一致性损失计算映射到的预测视觉特征和文本特征,从而较大地提高了跨模态多媒体信息的利用率。在该模型中,图像各特征先进入二进制码生成器H*,之后引入了自适应深度权重哈希模型训练得到自适应权重W,通过权重W计算权重汉明距离H(Xi,Xj),生成二进制哈希hi,ht,运用二进制码生成输入的逆过程P*,由生成器F或G,返回原图像特征,最后通过循环一致性损失从而实现跨模态,达到零样本分类的目的。
如图1所示,本发明的基于自适应权重哈希循环对抗网络的零样本图像分类方法,包括如下步骤:
1)将训练样本的视觉特征xi和文本语义类别特征xt分别采用如下公式进行循环对抗网络映射H*,得到对应的哈希码h(x):
其中x*是视觉特征或文本语义类别特征,Wh,v是自适应权重哈希的网络参数;
2)将步骤1)所生成的各特征的哈希码进行权重分配,建立自适应权重哈希模型;包括:
(1)定义自适应权重哈希模型的类元素权重层,生成自适应权重W;将步骤1)得到的哈希码h(x)和自适应权重W代入如下公式,得到类元素的权重ω(hx):
ω(hx)=W(CX,:)·hx,s.t.W≥0 (2)
其中hx是x*输出的哈希码,CX是x*的图像或者文本的类别索引,·指的是元素的内积;即,通过类元素权重得到类元素权重层,每张图像的哈希码与所对应的自适应类别权重相乘得到各特征x*的类元素的权重ω(hx);
(2)定义权重汉明距离H(Xi,Xj):
其中k为码字;二进制码bk(x)=sgn(hk(x)-0.5),k=1,…,q;hk(x)表示各类别的哈希码;Xi,Xj表示不同的两个特征;
所得的汉明距离用权重欧几里得距离代替简化来计算量,
(3)定义三元权重排序损失函数
(4)定义训练时各个类别softmax损失:
其中IC是指示函数,如果c为真,则IC=1,否则IC=0;
(6)用如下公式计算类元素权重层的梯度,从而更新自适应权重网络参数w
(7)由于softmax损失,计算θj的梯度为:
3)如图3所示,对自适应权重哈希模型进行训练和测试;使用BP神经网络反向传播更新权重网络参数W,并不断循环以上公式(19)(20)(21),直至LR和Lc收敛,最终输出自适应哈希权重的类元素权重w。然后代入参数w计算权重汉明距离,生成对应分类库图像哈希码。其中,
所述的训练包括对自适应权重哈希模型输入:图像x,参数m后,进行如下过程:
(1)通过神经网络前向传播将图像x转变为h(x);
(3)计算softmax损失LC(θ);
(6)输出自适应权重网络参数w。
所述的测试包括对自适应权重哈希模型输入自适应权重网络参数w,测试图像xq,汉明空间数据库B后,进行如下过程:
(1)导入自适应权重W到类元素权重层;
(2)预测类别概率p(xq);
(3)生成对应哈希码h(xq);
(4)生成自适应权重w(xq),wq=WTp(xq);
(5)计算权重汉明距离H(Xi,Xq);
(6)通过权重汉明距离大小分类图像;
(7)输出分类图像的哈希码。
4)定义最大似然生成的输入x与对应二进制码h
Pi:hi→xt定义为p(xt/hi)
Pt:ht→xi定义为p(xi/ht)
p(x,h)=p(x/h)p(h),p(x/h)=N(Uh,ρ2I)满足简单高斯分布。
为拟合函数q(h/x),对编码函数p(h/x)进行重新参数化,
5)将视觉特征xi和文本语义类别特征xt的哈希码分别采用如下公式进行p*映射,得到对应的编码p(h/x):
将伯努利变量变量hk(z),z∈(0,1)重新参数化:
6)如图2通过p*映射将哈希码转换为另一模态特征,
再由循环一致性对抗网络的生成器F或G,转换为原模态视觉或者语义特征,使得循环一致性损失达到最小,从而实现跨模态零样本分类。
Claims (1)
1.一种基于自适应权重哈希循环对抗网络的零样本图像分类方法,其特征在于,包括如下步骤:
1)将训练样本的视觉特征xi和文本语义类别特征xt分别采用如下公式进行循环对抗网络映射H*,得到对应的哈希码h(x):
其中x*是视觉特征或文本语义类别特征,Wh,v是自适应权重哈希的网络参数;
2)将步骤1)所生成的各特征的哈希码进行权重分配,建立自适应权重哈希模型;包括:
(1)定义自适应权重哈希模型的类元素权重层,生成自适应权重W;将步骤1)得到的哈希码h(x)和自适应权重W代入如下公式,得到类元素的权重ω(hx):
ω(hx)=W(CX,:)·hx,s.t.W≥0
其中hx是x*输出的哈希码,CX是x*的图像或者文本的类别索引,·指的是元素的内积;
(2)定义权重汉明距离H(Xi,Xj):
其中k为码字;二进制码bk(x)=sgn(hk(x)-0.5),k=1,…,q;hk(x)表示各类别的哈希码;Xi,Xj表示不同的两个特征;
(3)定义三元权重排序损失函数
(4)定义训练时各个类别softmax损失:
其中IC是指示函数,如果c为真,则IC=1,否则IC=0;
(6)用如下公式计算类元素权重层的梯度,从而更新自适应权重网络参数w
(7)由于softmax损失,计算θj的梯度为:
3)对自适应权重哈希模型进行训练和测试;其中,
所述的训练包括对自适应权重哈希模型输入:图像x,参数m后,进行如下过程:
(1)通过神经网络前向传播将图像x转变为h(x);
(3)计算softmax损失LC(θ);
(6)输出自适应权重网络参数w;
所述的测试包括对自适应权重哈希模型输入自适应权重网络参数w,测试图像xq,汉明空间数据库B后,进行如下过程:
(1)导入自适应权重W到类元素权重层;
(2)预测类别概率p(xq);
(3)生成对应哈希码h(xq);
(4)生成自适应权重w(xq),wq=WTp(xq);
(5)计算权重汉明距离H(Xi,Xq);
(6)通过权重汉明距离大小分类图像;
(7)输出分类图像的哈希码;
4)为拟合函数q(h/x),对编码函数p(h/x)进行重新参数化,
5)将视觉特征xi和文本语义类别特征xt的哈希码分别采用如下公式进行p*映射,得到对应的编码p(h/x):
将伯努利变量变量hk(z),z∈(0,1)重新参数化:
6)通过p*映射将哈希码转换为另一模态特征,
再由循环一致性对抗网络的生成器F或G,转换为原模态视觉或者语义特征,使得循环一致性损失达到最小,从而实现跨模态零样本分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811158795.3A CN109558890B (zh) | 2018-09-30 | 2018-09-30 | 基于自适应权重哈希循环对抗网络的零样本图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811158795.3A CN109558890B (zh) | 2018-09-30 | 2018-09-30 | 基于自适应权重哈希循环对抗网络的零样本图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109558890A CN109558890A (zh) | 2019-04-02 |
CN109558890B true CN109558890B (zh) | 2023-03-31 |
Family
ID=65864795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811158795.3A Active CN109558890B (zh) | 2018-09-30 | 2018-09-30 | 基于自适应权重哈希循环对抗网络的零样本图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109558890B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222140B (zh) * | 2019-04-22 | 2021-07-13 | 中国科学院信息工程研究所 | 一种基于对抗学习和非对称哈希的跨模态检索方法 |
CN110197521B (zh) * | 2019-05-21 | 2023-03-24 | 复旦大学 | 基于语义结构表示的视觉文本嵌入方法 |
CN110444277B (zh) * | 2019-07-19 | 2023-03-28 | 重庆邮电大学 | 一种基于多生成多对抗的多模态脑部mri图像双向转换方法 |
CN110443293B (zh) * | 2019-07-25 | 2023-04-07 | 天津大学 | 基于双判别生成对抗网络文本重构的零样本图像分类方法 |
CN110647804A (zh) * | 2019-08-09 | 2020-01-03 | 中国传媒大学 | 一种暴力视频识别方法、计算机系统和存储介质 |
CN110580501B (zh) * | 2019-08-20 | 2023-04-25 | 天津大学 | 一种基于变分自编码对抗网络的零样本图像分类方法 |
CN110674335B (zh) * | 2019-09-16 | 2022-08-23 | 重庆邮电大学 | 一种基于多生成多对抗的哈希码与图像双向转换方法 |
CN111461162B (zh) * | 2020-01-03 | 2023-04-07 | 华中科技大学 | 一种零样本目标检测模型及其建立方法 |
CN111428733B (zh) * | 2020-03-12 | 2023-05-23 | 山东大学 | 基于语义特征空间转换的零样本目标检测方法及系统 |
CN111461067B (zh) * | 2020-04-26 | 2022-06-14 | 武汉大学 | 基于先验知识映射及修正的零样本遥感影像场景识别方法 |
CN112115317B (zh) * | 2020-08-20 | 2024-05-14 | 鹏城实验室 | 一种针对深度哈希检索的有目标攻击方法及终端设备 |
CN112132230B (zh) * | 2020-10-09 | 2024-02-20 | 腾讯科技(深圳)有限公司 | 图像分类方法及装置 |
CN112905822B (zh) * | 2021-02-02 | 2022-07-01 | 华侨大学 | 一种基于注意力机制的深度监督跨模态对抗学习方法 |
CN113377973B (zh) * | 2021-06-10 | 2022-06-14 | 电子科技大学 | 一种基于对抗哈希的物品推荐方法 |
CN113626629B (zh) * | 2021-08-17 | 2023-09-29 | 北京计算机技术及应用研究所 | 一种利用尺度不变特征计算图像哈希值的方法 |
CN115019149B (zh) * | 2022-08-03 | 2022-11-11 | 中国电子科技集团公司第五十四研究所 | 一种基于模型解释结果的零样本识别方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226585A (zh) * | 2013-04-10 | 2013-07-31 | 大连理工大学 | 面向图像检索的自适应哈希重排方法 |
CN104834748A (zh) * | 2015-05-25 | 2015-08-12 | 中国科学院自动化研究所 | 一种利用基于深度语义排序哈希编码的图像检索方法 |
CN107092918A (zh) * | 2017-03-29 | 2017-08-25 | 太原理工大学 | 一种基于语义特征和有监督哈希的图像检索实现肺结节征象识别的方法 |
CN107729513A (zh) * | 2017-10-25 | 2018-02-23 | 鲁东大学 | 基于语义对齐的离散监督跨模态哈希检索方法 |
CN107871014A (zh) * | 2017-11-23 | 2018-04-03 | 清华大学 | 一种基于深度融合哈希的大数据跨模态检索方法及系统 |
CN108170755A (zh) * | 2017-12-22 | 2018-06-15 | 西安电子科技大学 | 基于三元组深度网络的跨模态哈希检索方法 |
-
2018
- 2018-09-30 CN CN201811158795.3A patent/CN109558890B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226585A (zh) * | 2013-04-10 | 2013-07-31 | 大连理工大学 | 面向图像检索的自适应哈希重排方法 |
CN104834748A (zh) * | 2015-05-25 | 2015-08-12 | 中国科学院自动化研究所 | 一种利用基于深度语义排序哈希编码的图像检索方法 |
CN107092918A (zh) * | 2017-03-29 | 2017-08-25 | 太原理工大学 | 一种基于语义特征和有监督哈希的图像检索实现肺结节征象识别的方法 |
CN107729513A (zh) * | 2017-10-25 | 2018-02-23 | 鲁东大学 | 基于语义对齐的离散监督跨模态哈希检索方法 |
CN107871014A (zh) * | 2017-11-23 | 2018-04-03 | 清华大学 | 一种基于深度融合哈希的大数据跨模态检索方法及系统 |
CN108170755A (zh) * | 2017-12-22 | 2018-06-15 | 西安电子科技大学 | 基于三元组深度网络的跨模态哈希检索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109558890A (zh) | 2019-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109558890B (zh) | 基于自适应权重哈希循环对抗网络的零样本图像分类方法 | |
CN110490946B (zh) | 基于跨模态相似度和生成对抗网络的文本生成图像方法 | |
Li et al. | LGM-Net: Learning to generate matching networks for few-shot learning | |
KR102166105B1 (ko) | 신경망 및 신경망 트레이닝의 방법 | |
CN110909862A (zh) | 基于卷积神经网络的注意力权重计算方法和装置 | |
CN109885756B (zh) | 基于cnn和rnn的序列化推荐方法 | |
CN114239560B (zh) | 三维图像分类方法、装置、设备和计算机可读存储介质 | |
Zeng et al. | Quaternion softmax classifier | |
CN112163715B (zh) | 生成式对抗网络的训练方法及装置、电力负荷预测方法 | |
CN112307883B (zh) | 训练方法、装置、电子设备以及计算机可读存储介质 | |
Peng et al. | A robust coverless steganography based on generative adversarial networks and gradient descent approximation | |
KR20190126857A (ko) | 이미지에서 오브젝트 검출 및 표현 | |
CN110659411A (zh) | 一种基于神经注意力自编码器的个性化推荐方法 | |
CN111563770A (zh) | 一种基于特征差异化学习的点击率预估方法 | |
CN115203409A (zh) | 一种基于门控融合和多任务学习的视频情感分类方法 | |
Guo et al. | A deep reinforcement learning method for multimodal data fusion in action recognition | |
CN114820871A (zh) | 字体生成方法、模型的训练方法、装置、设备和介质 | |
CN114529785B (zh) | 模型的训练方法、视频生成方法和装置、设备、介质 | |
CN110111365B (zh) | 基于深度学习的训练方法和装置以及目标跟踪方法和装置 | |
CN118015637A (zh) | 文本生成图像模型训练方法、文本生成图像方法及装置 | |
CN113065027A (zh) | 视频推荐的方法、装置、电子设备和存储介质 | |
Gan et al. | GANs with multiple constraints for image translation | |
CN111339734A (zh) | 一种基于文本生成图像的方法 | |
CN113780350B (zh) | 一种基于ViLBERT和BiLSTM的图像描述方法 | |
CN114155422A (zh) | 一种视觉问题回答的实现方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |