CN109447115A - 基于多层语义监督式注意力模型的细粒度零样本分类方法 - Google Patents
基于多层语义监督式注意力模型的细粒度零样本分类方法 Download PDFInfo
- Publication number
- CN109447115A CN109447115A CN201811115665.1A CN201811115665A CN109447115A CN 109447115 A CN109447115 A CN 109447115A CN 201811115665 A CN201811115665 A CN 201811115665A CN 109447115 A CN109447115 A CN 109447115A
- Authority
- CN
- China
- Prior art keywords
- classification
- feature
- semanteme
- image
- visual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
一种基于多层语义监督式注意力模型的细粒度零样本分类方法,利用卷积神经网络提取在细粒度图像中所选定部位的局部视觉特征,利用类别的文本描述信息作为类别语义特征对细粒度图像的局部视觉特征的分类进行监督,为细粒度图像的局部视觉特征逐步赋予权重;用类别语义特征引导映射到隐空间局部视觉特征,得到多层语义监督注意力模型的损失函数;将细粒度图像的全局视觉特征与经过多层语义监督注意力模型赋予权重后的局部视觉特征结合,作为图像的新的视觉特征;将类别语义特征嵌入到新的视觉特征空间,将多层语义监督注意力网络输出的视觉特征与语义特征进行对齐,利用softmax函数进行分类。本发明可输入提取好的视觉特征和类别语义特征,输出图像的分类结果。
Description
技术领域
本发明涉及一种零样本分类方法。特别是涉及一种基于多层语义监督式注意力模型的细粒度零样本分类方法。
背景技术
近年来深度学习的发展极大程度上促进了计算机视觉识别任务的巨大成功,但当前大部分分类模型都是基于监督学习的模型,不仅需要大量带有标注的数据,而且需要许多次迭代来训练模型参数。当出现新类别或没有标注数据的稀有类别时,这些模型不得不重新训练,这严重限制了传统分类模型的可扩展性。
人类具有即使没有见过某类视觉样本,也能够借助辅助信息推断出新类别的能力。例如,一个人只见过马而没有见过斑马,当他得到描述信息,即斑马与马外表相似,只是身上有黑白相间的条纹,那么此人就极有可能正确识别出斑马这一新类别。零样本学习(Zero-Shot Learning,ZSL)正是受人类这一能力启发,致力于解决当带标签的训练数据不足以涵盖所有目标类别,仅给出对于未知类别的一些描述时,如何进行分类的问题。
零样本学习主要是寻找一个嵌入空间,将视觉特征与类别语义特征进行对齐,进而实现可见类别与未见类别的信息转移。随着深度学习的发展,视觉特征大多采用深度神经网络提取的图像表征,如利用深度卷积神经网络、深度残差网络提取的特征等;语义特征主要包括属性特征,词向量以及文本描述等。目前大多数零样本分类方法利用深度神经网络提取整张图像的全局特征作为视觉特征,这种类型的方法在粗粒度图像分类任务上取得了良好的性能。但对于细粒度图像,图像的局部特征往往包含更丰富的判别信息,因此基于图像局部特征的方法在细粒度图像分类任务中逐渐受到重视。
近年来有学者提出注意力模型,注意力模型的目的在于模拟人脑的视觉注意力机制,人类视觉通过快速扫描全局图像,获得需要重点关注的目标区域,也就是注意力焦点,而后对这一区域投入更多注意力资源,以获取更多所需要关注目标的细节信息,同时抑制其他无用信息。注意力模型在计算机视觉、机器翻译等领域取得了良好的效果。在细粒度图像分类任务中,有学者利用注意力模型为图像不同区域的局部特征分配不同的注意力权重,以获得更具有判别能力的局部特征,进行后续分类工作。
发明内容
本发明所要解决的技术问题是,提供一种以语义信息作为监督,利用多层注意力模型实现细粒度零样本分类的基于多层语义监督式注意力模型的细粒度零样本分类方法。
本发明所采用的技术方案是:一种基于多层语义监督式注意力模型的细粒度零样本分类方法,首先,利用卷积神经网络提取在细粒度图像中所选定部位的局部视觉特征,利用类别的文本描述信息作为类别语义特征对所述细粒度图像的局部视觉特征的分类进行监督,为细粒度图像的局部视觉特征逐步赋予权重,得到语义监督注意力模型,其中,与语义信息相关性越高的局部视觉特征,对应的权重就越大;用类别语义特征引导映射到隐空间局部视觉特征,得到多层语义监督注意力模型的损失函数;将细粒度图像的全局视觉特征与经过多层语义监督注意力模型赋予权重后的局部视觉特征结合,作为图像的新的视觉特征;最后将类别语义特征嵌入到新的视觉特征空间,将多层语义监督注意力网络输出的视觉特征与语义特征进行对齐,利用softmax函数进行分类,得到图像分类。
具体包括如下步骤:
1)获取来自细粒度图像的n个可见类别的N张图像的局部视觉特征VI,类别语义特征向量s以及真实标签矩阵Y;
2)利用公式f(VI)=h(WI,AVI)将局部视觉特征VI映射到隐空间;
式中:代表图像的局部视觉特征,其中p为局部视觉特征的维度,m为局部视觉特征的个数,vi为对应的第i个区域的局部视觉特征向量;h为非线性函数;WI,A∈Rd×p为从局部视觉特征空间到隐空间的映射矩阵,d为隐空间的维度;
3)将局部视觉特征VI压缩为视觉特征向量vG,利用公式g(vG)=h(WG,Ah(WG,SvG))将视觉特征向量vG映射到隐空间;
式中:WG,A∈Rd×q为语义空间到隐空间的映射矩阵;WG,S∈Rq×p为从视觉特征空间到语义空间的映射矩阵,q为语义空间的维度;
4)利用公式将f(VI)和g(vG)进行特征融合,得到融合后的特征向量hA;
5)利用公式pI=softmax(WphA+bp)计算出图像每个局部区域的注意力权重
式中:Wp∈Rd为softmax函数的权重向量;bp为常数偏置项;pi为每个局部视觉特征对应的注意力权重;
6)利用公式ui=vi+pi vi计算出单层语义监督注意力网络输出的视觉特征向量ui,进而得到m个视觉区域的局部特征的集合以及单层语义监督注意力网络输出的压缩后的视觉特征向量uG;
7)将局部特征的集合UI和压缩后的视觉特征向量uG分别代替图像的局部视觉特征VI和视觉特征向量vG,重复步骤2)~步骤6)得到多层语义监督注意力网络输出的视觉特征向量ui″;
8)为实现以语义信息为监督,引导注意力模型对细粒度图像的局部视觉特征进行选择,将语义信息嵌入到两层注意力网络中,分别得到损失函数Loss1和Loss2:
Loss1=||h(WG,SvG)-s||2
Loss2=||h(WG,SuG)-s||2;
9)将每张图像m个区域的多层语义监督注意力网络输出的视觉特征向量ui″依次串联起来得到图像的全局视觉特征向量uG′,进而得到N张可见类别图像经过多层语义监督注意力网络后输出的全局视觉特征向量的集合UG={uG′};
10)利用公式vs=h(WEs+bE)将类别语义特征向量s嵌入到视觉特征空间得到vs,进而得到n个可见类别的语义特征向量嵌入到视觉特征空间的集合Vs={vs};
式中:WE∈Rl×q为嵌入矩阵,bE∈Rl为嵌入偏置,其中l=m×p,为全局特征向量的长度;
11)使视觉特征和语义特征在视觉特征空间进行对齐,得到损失函数Loss3:
Loss3=||vs-uG′||2
12)利用公式Pc=softmax(UGVs T)计算每张可见类别图像属于每个可见类别的预测概率Pc;
13)利用公式得到分类损失函数Lossc;
14)整个网络的损失函数为:
min Loss=Loss1+Loss2+Loss3+Lossc
在训练过程中通过多次迭代,使网络的损失函数不断下降,最终达到收敛,训练完成。
15)在测试阶段,输入来自t个未见类别的测试图像的局部视觉特征VU,未见类别的测试图像的视觉特征向量vT,得到多层语义监督注意力网络输出的视觉特征向量ut;将未见类别的类别语义特征ST利用视觉语义对齐网络嵌入到视觉特征空间得到语义嵌入特征VT;根据下式计算多层语义监督注意力网络输出的视觉特征向量ut与语义嵌入特征VT的距离D,距离最小的类别即为测试图像的预测类别:
本发明的基于多层语义监督式注意力模型的细粒度零样本分类方法,利用卷积神经网络提取细粒度图像特定部位的局部视觉特征;利用类别的文本描述信息作为类别语义特征进行监督,为细粒度图像的局部视觉特征逐步赋予权重,选择出与语义信息更相关的特征;将全局视觉特征与经过注意力模型赋予权重后的局部特征结合,作为图像的新的视觉特征;最后将类别语义特征嵌入到新的视觉特征空间,进行视觉语义对齐,实现图像分类。本发明以语义信息作为引导,利用注意力模型生成的权重可以有效压缩全局视觉特征中的噪声信息。此外,本发明采用多层的注意力模型,可以精确地选择出与语义信息更相关的局部视觉特征,从而得到更有利于分类的视觉特征。本发明可采用端对端的训练方式,输入提取好的视觉特征和类别语义特征,输出图像的分类结果。
附图说明
图1是本发的基于多层语义监督式注意力模型的细粒度零样本分类方法明流程图。
具体实施方式
下面结合实施例和附图对本发明的基于多层语义监督式注意力模型的细粒度零样本分类方法做出详细说明。
本发明的基于多层语义监督式注意力模型的细粒度零样本分类方法,首先,利用卷积神经网络提取在细粒度图像中所选定部位的局部视觉特征,利用类别的文本描述信息作为类别语义特征对所述细粒度图像的局部视觉特征的分类进行监督,为细粒度图像的局部视觉特征逐步赋予权重,得到语义监督注意力模型,其中,与语义信息相关性越高的局部视觉特征,对应的权重就越大;用类别语义特征引导映射到隐空间局部视觉特征,得到多层语义监督注意力模型的损失函数;将细粒度图像的全局视觉特征与经过多层语义监督注意力模型赋予权重后的局部视觉特征结合,作为图像的新的视觉特征;最后将类别语义特征嵌入到新的视觉特征空间,将多层语义监督注意力网络输出的视觉特征与语义特征进行对齐,利用softmax函数进行分类,得到图像分类。
本发明的基于多层语义监督式注意力模型的细粒度零样本分类方法,适用于解决跨模态的细粒度零样本学习问题。本发明以视觉特征和语义特征代表来自两个不同模态的特征,用代表图像的局部视觉特征,其中p代表局部视觉特征的维度,m代表局部视觉特征的个数,vi为对应的第i个区域的局部视觉特征向量;用s代表图像的类别语义特征向量,用n代表可见类别的数目,用N代表可见类别图像的数目,用Y∈{0,1}N×n表示所有可见类别图像对应的真实标签集合,用t代表未见类别的数目,在零样本的设定中,n和t是互不相交的,零样本分类的目标即为对未知类别样本进行分类。
如图1所示,发明的基于多层语义监督式注意力模型的细粒度零样本分类方法,具体包括如下步骤:
1)获取来自细粒度图像的n个可见类别的N张图像的局部视觉特征VI,类别语义特征向量s以及真实标签矩阵Y;
2)利用如下公式,通过非线性映射函数f将局部视觉特征VI映射到隐空间,
f(VI)=h(WI,AVI) (1)
式中:代表图像的局部视觉特征,其中p为局部视觉特征的维度,m为局部视觉特征的个数,vi为对应的第i个区域的局部视觉特征向量;h为非线性函数;WI,A∈Rd×p为从局部视觉特征空间到隐空间的映射矩阵,d为隐空间的维度;
3)将局部视觉特征VI压缩为视觉特征向量vG,利用公式g(vG)=h(WG,Ah(WG,SvG))将视觉特征向量vG映射到隐空间;具体是:
将局部视觉特征VI∈Rp×m压缩为一个维度为p的视觉特征向量vG∈Rp,通过非线性映射函数gG,S将vG嵌入到语义特征空间:
gG,S(vG)=h(WG,SvG) (2)
其中,WG,S∈Rq×p为从视觉特征空间到语义空间的映射矩阵,q为语义空间的维度。
再通过非线性映射函数g将映射到语义空间的视觉特征向量gG,S(vG)映射到隐空间:
g(vG)=h(WG,AgG,S(vG))=h(WG,Ah(WG,SvG)) (3)
其中,WG,A∈Rd×q为语义空间到隐空间的映射矩阵。
4)利用如下公式,使用双曲正切函数tanh对由公式(1)和(3)得到的f(VI)和g(vG)进行特征融合,得到融合后m个区域的视觉特征向量hA∈Rm×d:
5)利用softmax函数根据融合后的特征向量hA计算出图像每个局部区域的注意力概率pI∈Rm:
pI=softmax(WphA+bp) (5)
其中,Wp∈Rd为softmax函数的权重向量,bp为常数偏置项。
至此,本发明的注意力模型构建完毕。
6)记pi为每个局部视觉特征对应的注意力概率,则每个图像区域被赋予注意力权重后的视觉特征向量为:
vi′=pi vi (6)
将被赋予注意力权重前后的视觉特征向量vi与vi′相结合,得到单层注意力模型输出的视觉特征向量ui:
ui=vi+vi′ (7)
至此,本发明的单层语义监督注意力网络构建完毕。考虑到对于较复杂的任务,单层注意力模型往往无法精确地选择出与语义信息更相关的局部视觉特征,因此本发明采用语义监督下的多层注意力模型进行图像分类。
7)将局部特征的集合UI和压缩后的视觉特征向量uG分别代替图像的局部视觉特征VI和视觉特征向量vG,重复步骤2)~步骤6)得到多层语义监督注意力网络输出的视觉特征向量ui″,具体是:
将公式(8)所得视觉特征向量ui作为第二层注意力模型的输入,用代表m个视觉区域的局部特征的集合;将UI压缩为一个维度为p的视觉特征向量uG∈Rp;将UI经过公式(1)中的非线性映射函数f进行映射得到f(UI),将uG经过公式(3)中的非线性映射函数g进行映射得到g(uG);将f(UI)和g(uG)根据公式(4)用双曲正切函数tanh进行变换,得到第二层注意力模型融合后的特征向量hA′;再根据公式(5)利用softmax函数计算出图像每个局部区域的注意力概率pI′∈Rm。令pi′为经过第二层注意力模型后每个局部视觉特征对应的注意力概率,则每个图像区域被赋予注意力权重后的视觉特征向量为:
ui′=pi′ui (8)
将被赋予注意力权重前后的视觉特征向量ui与ui′相结合,得到第二层注意力模型输出的视觉特征向量ui″:
ui″=ui+ui′ (9)
至此,本发明的多层语义监督注意力网络构建完毕。
8)为实现以语义信息为监督,引导注意力模型对细粒度图像的局部视觉特征进行选择,将语义信息嵌入到两层注意力网络中,分别得到损失函数Loss1和Loss2:
Loss1=||gG,S(vG)-s||2=||h(WG,SvG)-s||2 (10)
Loss2=||gG,S(uG)-s||2=||h(WG,SuG)-s||2 (11);
9)将每张图像m个区域的多层语义监督注意力网络输出的视觉特征向量ui″依次串联起来得到图像的全局视觉特征向量uG′∈Rl,其中l=m×p,为全局特征向量的长度;
10)使视觉特征和语义特征可以进行比较,本发明通过非线性映射将语义特征嵌入到视觉特征空间,得到语义特征在视觉特征空间的表示vs∈Rl:
vs=h(WEs+bE) (12)
其中,WE∈Rl×q为嵌入矩阵,bE∈Rl为嵌入偏置;
11)为使视觉特征和语义特征在视觉特征空间进行对齐,语义特征在视觉特征空间的表示vs与经过多层语义监督注意力网络处理输出的全局视觉特征向量uG′之间的差异应尽可能小,因此得到Loss3:
Loss3=||vs-uG′||2 (13)
12)用Vs={vs}∈Rn×l代表所有可见类别的语义特征向量嵌入到视觉特征空间的表示的集合;用UG={uG′}∈RN×l代表所有可见类别图像经过多层语义监督注意力网络后得到的全局特征向量的集合。使用softmax函数计算每张可见类别图像属于每个可见类别的预测概率Pc∈RN×n:
Pc=softmax(UGVs T) (14)
利用预测概率Pc与所有可见类别图像的真实标签Y做交叉熵,得到分类损失函数Lossc:
由公式(10)、(11)、(13)、(15)得到最终的损失函数Loss:
min Loss=Loss1+Loss2+Loss3+Lossc (16)
在训练过程中通过多次迭代,使网络的损失函数不断下降,最终达到收敛,训练完成。
13)在测试阶段,输入来自t个未见类别的测试图像的局部视觉特征VU,未见类别的测试图像的视觉特征向量vT,得到多层语义监督注意力网络输出的视觉特征向量ut;将未见类别的类别语义特征ST利用视觉语义对齐网络嵌入到视觉特征空间得到语义嵌入特征VT;根据下式计算多层语义监督注意力网络输出的视觉特征向量ut与语义嵌入特征VT的距离D,距离最小的类别即为测试图像的预测类别:
Claims (2)
1.一种基于多层语义监督式注意力模型的细粒度零样本分类方法,其特征在于,首先,利用卷积神经网络提取在细粒度图像中所选定部位的局部视觉特征,利用类别的文本描述信息作为类别语义特征对所述细粒度图像的局部视觉特征的分类进行监督,为细粒度图像的局部视觉特征逐步赋予权重,得到语义监督注意力模型,其中,与语义信息相关性越高的局部视觉特征,对应的权重就越大;用类别语义特征引导映射到隐空间局部视觉特征,得到多层语义监督注意力模型的损失函数;将细粒度图像的全局视觉特征与经过多层语义监督注意力模型赋予权重后的局部视觉特征结合,作为图像的新的视觉特征;最后将类别语义特征嵌入到新的视觉特征空间,将多层语义监督注意力网络输出的视觉特征与语义特征进行对齐,利用softmax函数进行分类,得到图像分类。
2.根据权利要求1所述的基于多层语义监督式注意力模型的细粒度零样本分类方法,其特征在于,具体包括如下步骤:
1)获取来自细粒度图像的n个可见类别的N张图像的局部视觉特征VI,类别语义特征向量s以及真实标签矩阵Y;
2)利用公式f(VI)=h(WI,AVI)将局部视觉特征VI映射到隐空间;
式中:代表图像的局部视觉特征,其中p为局部视觉特征的维度,m为局部视觉特征的个数,vi为对应的第i个区域的局部视觉特征向量;h为非线性函数;WI,A∈Rd ×p为从局部视觉特征空间到隐空间的映射矩阵,d为隐空间的维度;
3)将局部视觉特征VI压缩为视觉特征向量vG,利用公式g(vG)=h(WG,Ah(WG,SvG))将视觉特征向量vG映射到隐空间;
式中:WG,A∈Rd×q为语义空间到隐空间的映射矩阵;WG,S∈Rq×p为从视觉特征空间到语义空间的映射矩阵,q为语义空间的维度;
4)利用公式将f(VI)和g(vG)进行特征融合,得到融合后的特征向量hA;
5)利用公式pI=softmax(WphA+bp)计算出图像每个局部区域的注意力权重
式中:Wp∈Rd为softmax函数的权重向量;bp为常数偏置项;pi为每个局部视觉特征对应的注意力权重;
6)利用公式ui=vi+pivi计算出单层语义监督注意力网络输出的视觉特征向量ui,进而得到m个视觉区域的局部特征的集合以及单层语义监督注意力网络输出的压缩后的视觉特征向量uG;
7)将局部特征的集合UI和压缩后的视觉特征向量uG分别代替图像的局部视觉特征VI和视觉特征向量vG,重复步骤2)~步骤6)得到多层语义监督注意力网络输出的视觉特征向量ui″;
8)为实现以语义信息为监督,引导注意力模型对细粒度图像的局部视觉特征进行选择,将语义信息嵌入到两层注意力网络中,分别得到损失函数Loss1和Loss2:
Loss1=||h(WG,SvG)-s||2
Loss2=||h(WG,SuG)-s||2;
9)将每张图像m个区域的多层语义监督注意力网络输出的视觉特征向量ui″依次串联起来得到图像的全局视觉特征向量uG′,进而得到N张可见类别图像经过多层语义监督注意力网络后输出的全局视觉特征向量的集合UG={uG′};
10)利用公式vs=h(WEs+bE)将类别语义特征向量s嵌入到视觉特征空间得到vs,进而得到n个可见类别的语义特征向量嵌入到视觉特征空间的集合Vs={vs};
式中:WE∈Rl×q为嵌入矩阵,bE∈Rl为嵌入偏置,其中l=m×p,为全局特征向量的长度;
11)使视觉特征和语义特征在视觉特征空间进行对齐,得到损失函数Loss3:
Loss3=||vs-uG′||2
12)利用公式Pc=softmax(UGVs T)计算每张可见类别图像属于每个可见类别的预测概率Pc;
13)利用公式得到分类损失函数Lossc;
14)整个网络的损失函数为:
min Loss=Loss1+Loss2+Loss3+Lossc
在训练过程中通过多次迭代,使网络的损失函数不断下降,最终达到收敛,训练完成。
15)在测试阶段,输入来自t个未见类别的测试图像的局部视觉特征VU,未见类别的测试图像的视觉特征向量vT,得到多层语义监督注意力网络输出的视觉特征向量ut;将未见类别的类别语义特征ST利用视觉语义对齐网络嵌入到视觉特征空间得到语义嵌入特征VT;根据下式计算多层语义监督注意力网络输出的视觉特征向量ut与语义嵌入特征VT的距离D,距离最小的类别即为测试图像的预测类别:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811115665.1A CN109447115A (zh) | 2018-09-25 | 2018-09-25 | 基于多层语义监督式注意力模型的细粒度零样本分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811115665.1A CN109447115A (zh) | 2018-09-25 | 2018-09-25 | 基于多层语义监督式注意力模型的细粒度零样本分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109447115A true CN109447115A (zh) | 2019-03-08 |
Family
ID=65530699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811115665.1A Pending CN109447115A (zh) | 2018-09-25 | 2018-09-25 | 基于多层语义监督式注意力模型的细粒度零样本分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109447115A (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110097019A (zh) * | 2019-05-10 | 2019-08-06 | 腾讯科技(深圳)有限公司 | 字符识别方法、装置、计算机设备以及存储介质 |
CN110163258A (zh) * | 2019-04-24 | 2019-08-23 | 浙江大学 | 一种基于语义属性注意力重分配机制的零样本学习方法及系统 |
CN110188635A (zh) * | 2019-05-16 | 2019-08-30 | 南开大学 | 一种基于注意力机制和多层次卷积特征的植物病虫害识别方法 |
CN110222771A (zh) * | 2019-06-10 | 2019-09-10 | 成都澳海川科技有限公司 | 一种零样本图片的类别识别方法 |
CN110443277A (zh) * | 2019-06-30 | 2019-11-12 | 天津大学 | 基于注意力模型的少量样本分类方法 |
CN110472652A (zh) * | 2019-06-30 | 2019-11-19 | 天津大学 | 基于语义引导的少量样本分类方法 |
CN110472642A (zh) * | 2019-08-19 | 2019-11-19 | 齐鲁工业大学 | 基于多级注意力的细粒度图像描述方法及系统 |
CN110490254A (zh) * | 2019-08-20 | 2019-11-22 | 山西潞安环保能源开发股份有限公司五阳煤矿 | 一种基于双重注意力机制层次网络的图像语义生成方法 |
CN110598029A (zh) * | 2019-09-06 | 2019-12-20 | 西安电子科技大学 | 基于注意力转移机制的细粒度图像分类方法 |
CN110826638A (zh) * | 2019-11-12 | 2020-02-21 | 福州大学 | 基于重复注意力网络的零样本图像分类模型及其方法 |
CN110826639A (zh) * | 2019-11-12 | 2020-02-21 | 福州大学 | 一种利用全量数据训练零样本图像分类方法 |
CN111126453A (zh) * | 2019-12-05 | 2020-05-08 | 重庆邮电大学 | 基于注意力机制和切割填充的细粒度图像分类方法及系统 |
CN111291803A (zh) * | 2020-01-21 | 2020-06-16 | 中国科学技术大学 | 一种图像分级粒度迁移方法、系统、设备和介质 |
CN111325290A (zh) * | 2020-03-20 | 2020-06-23 | 西安邮电大学 | 一种基于多视融合多示例学习的国画图像分类方法 |
CN111680721A (zh) * | 2019-05-16 | 2020-09-18 | 谷歌有限责任公司 | 利用硬性注意力的准确且可解释的分类 |
CN111914599A (zh) * | 2019-05-09 | 2020-11-10 | 四川大学 | 一种基于语义信息多层特征融合的细粒度鸟类识别方法 |
CN112287159A (zh) * | 2020-12-18 | 2021-01-29 | 北京世纪好未来教育科技有限公司 | 检索方法、电子设备及计算机可读介质 |
CN112418351A (zh) * | 2020-12-11 | 2021-02-26 | 天津大学 | 基于全局与局部上下文感知的零样本学习图像分类方法 |
CN112417890A (zh) * | 2020-11-29 | 2021-02-26 | 中国科学院电子学研究所苏州研究院 | 一种基于多样化语义注意力模型的细粒度实体分类方法 |
CN112528058A (zh) * | 2020-11-23 | 2021-03-19 | 西北工业大学 | 基于图像属性主动学习的细粒度图像分类方法 |
CN112580362A (zh) * | 2020-12-18 | 2021-03-30 | 西安电子科技大学 | 一种基于文本语义监督的视觉行为识别方法、系统及计算机可读介质 |
CN113435531A (zh) * | 2021-07-07 | 2021-09-24 | 中国人民解放军国防科技大学 | 零样本图像分类方法、系统、电子设备及存储介质 |
CN117274717A (zh) * | 2023-10-24 | 2023-12-22 | 中国人民解放军空军预警学院 | 基于全局与局部视觉特征映射网络的弹道目标识别方法 |
CN118072261A (zh) * | 2024-04-25 | 2024-05-24 | 杭州华是智能设备有限公司 | 一种基于多形态监督文本引导的船舶检测方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120254076A1 (en) * | 2011-03-30 | 2012-10-04 | Microsoft Corporation | Supervised re-ranking for visual search |
CN105740402A (zh) * | 2016-01-28 | 2016-07-06 | 百度在线网络技术(北京)有限公司 | 数字图像的语义标签的获取方法及装置 |
US20170177972A1 (en) * | 2015-12-21 | 2017-06-22 | Nokia Technologies Oy | Method for analysing media content |
CN108399158A (zh) * | 2018-02-05 | 2018-08-14 | 华南理工大学 | 基于依存树和注意力机制的属性情感分类方法 |
-
2018
- 2018-09-25 CN CN201811115665.1A patent/CN109447115A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120254076A1 (en) * | 2011-03-30 | 2012-10-04 | Microsoft Corporation | Supervised re-ranking for visual search |
US20170177972A1 (en) * | 2015-12-21 | 2017-06-22 | Nokia Technologies Oy | Method for analysing media content |
CN105740402A (zh) * | 2016-01-28 | 2016-07-06 | 百度在线网络技术(北京)有限公司 | 数字图像的语义标签的获取方法及装置 |
CN108399158A (zh) * | 2018-02-05 | 2018-08-14 | 华南理工大学 | 基于依存树和注意力机制的属性情感分类方法 |
Non-Patent Citations (1)
Title |
---|
JI ZHONG: "Stacked Semantic-Guided Attention Model for Fine-Grained Zero-Shot Learning", 《ARXIV》 * |
Cited By (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163258A (zh) * | 2019-04-24 | 2019-08-23 | 浙江大学 | 一种基于语义属性注意力重分配机制的零样本学习方法及系统 |
CN110163258B (zh) * | 2019-04-24 | 2021-04-09 | 浙江大学 | 一种基于语义属性注意力重分配机制的零样本学习方法及系统 |
CN111914599A (zh) * | 2019-05-09 | 2020-11-10 | 四川大学 | 一种基于语义信息多层特征融合的细粒度鸟类识别方法 |
CN111914599B (zh) * | 2019-05-09 | 2022-09-02 | 四川大学 | 一种基于语义信息多层特征融合的细粒度鸟类识别方法 |
CN110097019A (zh) * | 2019-05-10 | 2019-08-06 | 腾讯科技(深圳)有限公司 | 字符识别方法、装置、计算机设备以及存储介质 |
CN110097019B (zh) * | 2019-05-10 | 2023-01-10 | 腾讯科技(深圳)有限公司 | 字符识别方法、装置、计算机设备以及存储介质 |
CN110188635A (zh) * | 2019-05-16 | 2019-08-30 | 南开大学 | 一种基于注意力机制和多层次卷积特征的植物病虫害识别方法 |
CN111680721A (zh) * | 2019-05-16 | 2020-09-18 | 谷歌有限责任公司 | 利用硬性注意力的准确且可解释的分类 |
CN110188635B (zh) * | 2019-05-16 | 2021-04-30 | 南开大学 | 一种基于注意力机制和多层次卷积特征的植物病虫害识别方法 |
CN111680721B (zh) * | 2019-05-16 | 2024-01-02 | 谷歌有限责任公司 | 利用硬性注意力的准确且可解释的分类 |
CN110222771A (zh) * | 2019-06-10 | 2019-09-10 | 成都澳海川科技有限公司 | 一种零样本图片的类别识别方法 |
CN110472652B (zh) * | 2019-06-30 | 2023-06-09 | 天津大学 | 基于语义引导的少量样本分类方法 |
CN110472652A (zh) * | 2019-06-30 | 2019-11-19 | 天津大学 | 基于语义引导的少量样本分类方法 |
CN110443277A (zh) * | 2019-06-30 | 2019-11-12 | 天津大学 | 基于注意力模型的少量样本分类方法 |
CN110472642A (zh) * | 2019-08-19 | 2019-11-19 | 齐鲁工业大学 | 基于多级注意力的细粒度图像描述方法及系统 |
CN110490254B (zh) * | 2019-08-20 | 2023-04-18 | 山西潞安环保能源开发股份有限公司五阳煤矿 | 一种基于双重注意力机制层次网络的图像语义生成方法 |
CN110490254A (zh) * | 2019-08-20 | 2019-11-22 | 山西潞安环保能源开发股份有限公司五阳煤矿 | 一种基于双重注意力机制层次网络的图像语义生成方法 |
CN110598029A (zh) * | 2019-09-06 | 2019-12-20 | 西安电子科技大学 | 基于注意力转移机制的细粒度图像分类方法 |
CN110598029B (zh) * | 2019-09-06 | 2022-03-22 | 西安电子科技大学 | 基于注意力转移机制的细粒度图像分类方法 |
CN110826639A (zh) * | 2019-11-12 | 2020-02-21 | 福州大学 | 一种利用全量数据训练零样本图像分类方法 |
CN110826638A (zh) * | 2019-11-12 | 2020-02-21 | 福州大学 | 基于重复注意力网络的零样本图像分类模型及其方法 |
CN110826639B (zh) * | 2019-11-12 | 2023-05-12 | 福州大学 | 一种利用全量数据训练零样本图像分类方法 |
CN110826638B (zh) * | 2019-11-12 | 2023-04-18 | 福州大学 | 基于重复注意力网络的零样本图像分类模型及其方法 |
CN111126453A (zh) * | 2019-12-05 | 2020-05-08 | 重庆邮电大学 | 基于注意力机制和切割填充的细粒度图像分类方法及系统 |
CN111126453B (zh) * | 2019-12-05 | 2022-05-03 | 重庆邮电大学 | 基于注意力机制和切割填充的细粒度图像分类方法及系统 |
CN111291803B (zh) * | 2020-01-21 | 2022-07-29 | 中国科学技术大学 | 一种图像分级粒度迁移方法、系统、设备和介质 |
CN111291803A (zh) * | 2020-01-21 | 2020-06-16 | 中国科学技术大学 | 一种图像分级粒度迁移方法、系统、设备和介质 |
CN111325290A (zh) * | 2020-03-20 | 2020-06-23 | 西安邮电大学 | 一种基于多视融合多示例学习的国画图像分类方法 |
CN111325290B (zh) * | 2020-03-20 | 2023-06-06 | 西安邮电大学 | 一种基于多视融合多示例学习的国画图像分类方法 |
CN112528058B (zh) * | 2020-11-23 | 2022-09-02 | 西北工业大学 | 基于图像属性主动学习的细粒度图像分类方法 |
CN112528058A (zh) * | 2020-11-23 | 2021-03-19 | 西北工业大学 | 基于图像属性主动学习的细粒度图像分类方法 |
CN112417890B (zh) * | 2020-11-29 | 2023-11-24 | 中国科学院电子学研究所苏州研究院 | 一种基于多样化语义注意力模型的细粒度实体分类方法 |
CN112417890A (zh) * | 2020-11-29 | 2021-02-26 | 中国科学院电子学研究所苏州研究院 | 一种基于多样化语义注意力模型的细粒度实体分类方法 |
CN112418351B (zh) * | 2020-12-11 | 2023-04-07 | 天津大学 | 基于全局与局部上下文感知的零样本学习图像分类方法 |
CN112418351A (zh) * | 2020-12-11 | 2021-02-26 | 天津大学 | 基于全局与局部上下文感知的零样本学习图像分类方法 |
CN112287159A (zh) * | 2020-12-18 | 2021-01-29 | 北京世纪好未来教育科技有限公司 | 检索方法、电子设备及计算机可读介质 |
CN112580362A (zh) * | 2020-12-18 | 2021-03-30 | 西安电子科技大学 | 一种基于文本语义监督的视觉行为识别方法、系统及计算机可读介质 |
CN112580362B (zh) * | 2020-12-18 | 2024-02-20 | 西安电子科技大学 | 一种基于文本语义监督的视觉行为识别方法、系统及计算机可读介质 |
CN113435531A (zh) * | 2021-07-07 | 2021-09-24 | 中国人民解放军国防科技大学 | 零样本图像分类方法、系统、电子设备及存储介质 |
CN113435531B (zh) * | 2021-07-07 | 2022-06-21 | 中国人民解放军国防科技大学 | 零样本图像分类方法、系统、电子设备及存储介质 |
CN117274717A (zh) * | 2023-10-24 | 2023-12-22 | 中国人民解放军空军预警学院 | 基于全局与局部视觉特征映射网络的弹道目标识别方法 |
CN118072261A (zh) * | 2024-04-25 | 2024-05-24 | 杭州华是智能设备有限公司 | 一种基于多形态监督文本引导的船舶检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109447115A (zh) | 基于多层语义监督式注意力模型的细粒度零样本分类方法 | |
CN108229444B (zh) | 一种基于整体和局部深度特征融合的行人再识别方法 | |
Li et al. | Person search with natural language description | |
CN106228142B (zh) | 基于卷积神经网络和贝叶斯决策的人脸验证方法 | |
CN106407986B (zh) | 一种基于深度模型的合成孔径雷达图像目标识别方法 | |
CN108647583B (zh) | 一种基于多目标学习的人脸识别算法训练方法 | |
CN111666843B (zh) | 一种基于全局特征和局部特征拼接的行人重识别方法 | |
CN108537136A (zh) | 基于姿态归一化图像生成的行人重识别方法 | |
CN108921123A (zh) | 一种基于双重数据增强的人脸识别方法 | |
CN109299657B (zh) | 基于语义注意力保留机制的群体行为识别方法及装置 | |
CN109101865A (zh) | 一种基于深度学习的行人重识别方法 | |
CN110443143A (zh) | 多分支卷积神经网络融合的遥感图像场景分类方法 | |
CN109815801A (zh) | 基于深度学习的人脸识别方法及装置 | |
CN106529499A (zh) | 基于傅里叶描述子和步态能量图融合特征的步态识别方法 | |
CN108334849A (zh) | 一种基于黎曼流形的行人重识别方法 | |
CN109359538A (zh) | 卷积神经网络的训练方法、手势识别方法、装置及设备 | |
CN106447625A (zh) | 基于人脸图像序列的属性识别方法及装置 | |
CN107145842A (zh) | 结合lbp特征图与卷积神经网络的人脸识别方法 | |
CN108805077A (zh) | 一种基于三元组损失函数的深度学习网络的人脸识别系统 | |
CN108520216A (zh) | 一种基于步态图像的身份识别方法 | |
Bhavana et al. | Hand sign recognition using CNN | |
CN109344713B (zh) | 一种姿态鲁棒的人脸识别方法 | |
CN106326857A (zh) | 基于人脸图像的性别识别方法及装置 | |
CN109558810A (zh) | 基于部位分割与融合目标人物识别方法 | |
CN106022241B (zh) | 一种基于小波变换及稀疏表示的人脸识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190308 |