CN104346450A - 一种基于多模态隐性耦合表达的跨媒体排序方法 - Google Patents

一种基于多模态隐性耦合表达的跨媒体排序方法 Download PDF

Info

Publication number
CN104346450A
CN104346450A CN201410593006.4A CN201410593006A CN104346450A CN 104346450 A CN104346450 A CN 104346450A CN 201410593006 A CN201410593006 A CN 201410593006A CN 104346450 A CN104346450 A CN 104346450A
Authority
CN
China
Prior art keywords
document
mrow
candidate
text
msub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410593006.4A
Other languages
English (en)
Other versions
CN104346450B (zh
Inventor
吴飞
李玺
蒋忻洋
汤斯亮
邵健
庄越挺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201410593006.4A priority Critical patent/CN104346450B/zh
Publication of CN104346450A publication Critical patent/CN104346450A/zh
Application granted granted Critical
Publication of CN104346450B publication Critical patent/CN104346450B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于多模态隐性耦合表达的跨媒体排序方法。包括如下步骤:1)将文本检索图像的排序样本或图像检索文本的排序样本构建为训练样本;2)对构建得到的训练样本进行基于隐性耦合表达的跨媒体排序学习,得到跨媒体数据的隐性耦合表达挖掘模型以及跨媒体排序模型;3)构建查询文档和候选文档之间的隐性耦合表达;4)基于隐性耦合表达,使用学习得到的跨媒体排序模型进行跨媒体检索。本发明在排序模型中引入了多模态数据的隐性耦合表达,相比一般的多模态数据隐性表达具有更强判别性。由于同时训练了隐性表达挖掘模型和排序模型,它在图像检索文本或文本检索图像中所取得性能较传统的跨媒体排序模型方法更好。

Description

一种基于多模态隐性耦合表达的跨媒体排序方法
技术领域
本发明涉及跨媒体检索,尤其涉及一种基于隐性耦合表达的跨媒体排序方法。
背景技术
跨媒体数据检索是具有现实意义的重要技术领域,而依据跨媒体数据的关联性对其进行排序是这一领域中的一项重要技术。这项技术在检索过程中,对候选的跨媒体数据按照与用户查询的关联性大小进行排序,并将排序结果展现给用户,在跨媒体数据的搜索应用中有巨大的价值。
传统的跨媒体排序方法,一般先为多模态数据学习一个共享空间,再将查询文档和候选文档分别映射为共享空间中的特征向量,最后使用一个人工指定的相似性度量函数计算查询和候选文档间的关联性,最后再依照关联性对多模态数据进行排序。这种方法将共享空间中的向量作为多模态数据的表示,难以挖掘这一共同表示内部本应存在的复杂依赖关系;同时,由于排序模型的人工指定的相似性度量函数,所以无法通过学习的方法发现多模态的共同表示的不同部分对数据关联性的影响大小。
基于隐性耦合表示的跨媒体排序方法能够有效弥补上述传统方法的不足。隐性耦合表示为每一对查询文档和候选文档学习一个基于主题的共有表示,而不是分别为查询和候选文档学习表示,这种表示方法能够有效建模共有表示内部的复杂依赖关系;同时排序函数通过学习得到,而不是事先制定的相似性度量,这样就能够发现隐性耦合表示中不同部分对关联性的影响大小。
发明内容
基于多模态隐性耦合表达的跨媒体排序方法包括如下步骤:
1)构建排序用的训练样本:在文本检索图像的训练样本中,将文本作为查询文档,将图像作为候选文档;在图像检索文本的训练样本中,将图像作为查询文档,将文本作为候选文档;
2)对构建得到的训练样本进行基于隐性耦合表达的跨媒体排序学习,得到隐性耦合表达挖掘模型以及跨媒体排序模型;
3)用户提交查询文档后,对于每一个候选文档,使用隐性耦合表达挖掘模型构建其和查询文档间的隐性耦合表达;
4)使用学习得到的跨媒体排序模型进行跨媒体检索:基于隐性耦合表达,使用排序模型对查询文档和候选文档的关联性进行评分,根据关联性评分的高低对候选文档进行排序,最后输出这一跨媒体排序结果。
所述的步骤1)包括:
1)对训练样本里的所有文本利用词袋模型进行特征表达,文本最终被表示为其中D1为文本特征空间的维数;
2)将训练样本里的所有图像利用视觉词袋模型进行特征表达,图像最终被表达为其中D2为图像特征空间的维数;
3)对文本检索图像方向而言,对每一个文本,构建一个候选图像的排序列表,其中列表中的图像被标记为与该文本语义相关或者语义不相关,因此每个文本检索图像的训练样本被表示为三元组其中N为训练样本个数,tk为检索文本,pk为图像集合,是图像集合上的排序,Y表示整个排序空间;
4)对图像检索文本方向而言,对每一个图像,构建一个文本的排序列表,其中列表中的文本被标记为与该图像语义相关或者语义不相关,每个图像检索文本的训练样本被表示为三元组N为训练样本个数,pk为检索图像,tk是文本文档集合,是文本文档集合上的排序。
所述的步骤2)包括:
1)给定N个训练样本组成训练集其中x(k)是一个查询文档,是包含P个候选文档的集合,P为文档个数,y(k)是对应查询文档的排序,如式(1)构建损失函数,隐性耦合表示挖掘模型和排序模型的参数需要同时满足这一损失函数:
其中,
其中,w是排序模型的参数,θ是隐性耦合表示挖掘模型的参数;F(·)是一个人工指定的判别函数,用来评估模型预测的排序、查询和候选文档之间的适配度,对于任意查询文档x,其候选文档和排序y,F(·)定义如下:
其中,分别是候选文档集中与查询文档相关和不相关的文档的子集;di,dj分别为候选文档集中的第i个和第j个文档;|·|标记了集合中元素的个数;s(·)是一个评分函数,用来衡量查询文档和一个候选文档之间的关联程度,基于隐性耦合表示对查询文档x和候选文档d间的关联性进行评分,关联评分函数定义如下:
s(x,d)=wTH(x,d)      (16)
其中H(x,d)标记了查询文档和候选文档之间的隐性耦合表示;
将查询文档和候选文档共享的主题记为h={hm|m=1,...,M},h的每一维hm表示了两个多模态文档共享第m个主题的程度,M表示主题个数,隐性耦合表示被定义为,给定一对查询x和候选文档d时,共享主题在条件概率分布p(h|x,d)下的期望:
H(x,d)=Ep(h|x,d)(h).      (17)
3)使用随机梯度下降算法求解式(1),得到隐性耦合表示挖掘模型和排序模型的参数,式(1)等价于如下无约束优化问题:
其中,
损失函数L关于w的梯度为:
损失函数L关于θ的梯度为:
其中, ∂ H m ( x , d i ) ∂ θ = E p ( h m f ( h , x , d i ) ) + E p ( h m E p ( f ( h , x , d i ) )
其中,Ep(·)是期望Ep(h|x,d)(·)的简写形式,使用变分推理得到;f是指示文档和主题之间兼容性的特征向量。
所述的步骤3)包括:
3)如式(4)所示,查询文档和候选文档间的隐性耦合表示被定义为两者在概率分布p(h|x,d)上的共享主题的期望;
给定一对查询文档x和候选文档d,两者共享的主题的条件概率分布建模如下:
p ( h | x , d ) = 1 Z expψ ( h , x , d ) - - - ( 21 )
其中,Z为归一化量,势函数Ψ(h,x,d)定义如下:
ψ ( h , x , d ) = Σ m ( θ m 1 ) T f 1 ( x , h m ) + Σ m ( θ m 2 ) T f 2 ( d , h m ) + Σ mn ( θ mn 3 ) T f 3 ( h m , h n ) + Σ m ( θ m 4 ) T f 4 ( h m ) - - - ( 22 )
特征函数f1和f2是指示主题和文档间兼容性的特征向量;f3是指示两个主题间关联性的特征向量;f4是主题h的先验;是概率模型的参数,它表示参数和第l个特征函数fl关联并以第m个主题hm作为函数输入;m,n分别对应第m和n个主题的下标。式(9)中的特征函数具体定义为如下形式:
ψ ( h , x , d ) = Σ m ( θ m 1 ) T xh m + Σ m ( θ m 2 ) T dh m + Σ mn θ mn 3 h m h n + Σ m 1 2 θ m 4 h m 2 . - - - ( 23 )
4)共享主题的期望使用变分推理方法近似计算,即使用独立高斯分布q(h)近似计算条件概率分布p(h|x,d),近似分布定义为多个高斯分布的乘积形式:
q ( h ) = Π m = 1 M q ( h m | μ m ) - - - ( 24 )
其中q(hmm)是均值为μm方差为1的高斯分布,通过最小化q(h)和p(h|x,d)间的KL距离,得到如下不动点方程:
μ m = - 1 θ m 4 ( Σ n = 1 M θ mn 3 μ n + x T θ m 1 + d T θ m 2 ) - - - ( 25 )
通过迭代计算式(12)来得到μm,易证共享主题的期望可用μm来近似:
E p ( h m | x , d ) h m = ∫ h m q ( h m | x , d ) = μ m - - - ( 26 )
所述的步骤4)包括:
1)给定查询文档和候选文档的隐性耦合表达,使用式(1)对每个候选文档进行评分;
2)对根据评分结构对候选文档进行排序,其结果即为跨媒体排序结果y。
本发明在排序模型中引入了多模态数据的隐性耦合表达,相比一般的多模态数据隐性表达具有更强判别性。由于同时训练了隐性表达挖掘模型和排序模型,它在图像检索文本或文本检索图像中所取得性能较传统的跨媒体排序模型方法更好。
附图说明
图1是基于隐性耦合表示的跨媒体排序方法示意图。
具体实施方式
基于多模态隐性耦合表达的跨媒体排序方法包括如下步骤:
1)构建排序用的训练样本:在文本检索图像的训练样本中,将文本作为查询文档,将图像作为候选文档;在图像检索文本的训练样本中,将图像作为查询文档,将文本作为候选文档;
2)对构建得到的训练样本进行基于隐性耦合表达的跨媒体排序学习,得到隐性耦合表达挖掘模型以及跨媒体排序模型;
3)用户提交查询文档后,对于每一个候选文档,使用隐性耦合表达挖掘模型构建其和查询文档间的隐性耦合表达;
4)使用学习得到的跨媒体排序模型进行跨媒体检索:基于隐性耦合表达,使用排序模型对查询文档和候选文档的关联性进行评分,根据关联性评分的高低对候选文档进行排序,最后输出这一跨媒体排序结果。
所述的步骤1)包括:
1)对训练样本里的所有文本利用词袋模型进行特征表达,文本最终被表示为其中D1为文本特征空间的维数;
2)将训练样本里的所有图像利用视觉词袋模型进行特征表达,图像最终被表达为其中D2为图像特征空间的维数;
3)对文本检索图像方向而言,对每一个文本,构建一个候选图像的排序列表,其中列表中的图像被标记为与该文本语义相关或者语义不相关,因此每个文本检索图像的训练样本被表示为三元组其中N为训练样本个数,tk为检索文本,pk为图像集合,是图像集合上的排序,Y表示整个排序空间;
4)对图像检索文本方向而言,对每一个图像,构建一个文本的排序列表,其中列表中的文本被标记为与该图像语义相关或者语义不相关,每个图像检索文本的训练样本被表示为三元组N为训练样本个数,pk为检索图像,tk是文本文档集合,是文本文档集合上的排序。
所述的步骤2)包括:
1)给定N个训练样本组成训练集其中x(k)是一个查询文档,是包含P个候选文档的集合,P为文档个数,y(k)是对应查询文档的排序,如式(1)构建损失函数,隐性耦合表示挖掘模型和排序模型的参数需要同时满足这一损失函数:
其中,
其中,w是排序模型的参数,θ是隐性耦合表示挖掘模型的参数;F(·)是一个人工指定的判别函数,用来评估模型预测的排序、查询和候选文档之间的适配度,对于任意查询文档x,其候选文档和排序y,F(·)定义如下:
其中,分别是候选文档集中与查询文档相关和不相关的文档的子集;di,dj分别为候选文档集中的第i个和第j个文档;|·|标记了集合中元素的个数;s(·)是一个评分函数,用来衡量查询文档和一个候选文档之间的关联程度,基于隐性耦合表示对查询文档x和候选文档d间的关联性进行评分,关联评分函数定义如下:
s(x,d)=wTH(x,d)      (29)
其中H(x,d)标记了查询文档和候选文档之间的隐性耦合表示;
将查询文档和候选文档共享的主题记为h={hm|m=1,...,M},h的每一维hm表示了两个多模态文档共享第m个主题的程度,M表示主题个数,隐性耦合表示被定义为,给定一对查询x和候选文档d时,共享主题在条件概率分布p(h|x,d)下的期望:
H(x,d)=Ep(h|x,d)(h).      (30)
4)使用随机梯度下降算法求解式(1),得到隐性耦合表示挖掘模型和排序模型的参数,式(1)等价于如下无约束优化问题:
其中,
损失函数L关于w的梯度为:
损失函数L关于θ的梯度为:
其中, ∂ H m ( x , d i ) ∂ θ = E p ( h m f ( h , x , d i ) ) + E p ( h m E p ( f ( h , x , d i ) )
其中,Ep(·)是期望Ep(h|x,d)(·)的简写形式,使用变分推理得到;f是指示文档和主题之间兼容性的特征向量。
所述的步骤3)包括:
5)如式(4)所示,查询文档和候选文档间的隐性耦合表示被定义为两者在概率分布p(h|x,d)上的共享主题的期望;
给定一对查询文档x和候选文档d,两者共享的主题的条件概率分布建模如下:
p ( h | x , d ) = 1 Z expψ ( h , x , d ) - - - ( 21 )
其中,Z为归一化量,势函数Ψ(h,x,d)定义如下:
ψ ( h , x , d ) = Σ m ( θ m 1 ) T f 1 ( x , h m ) + Σ m ( θ m 2 ) T f 2 ( d , h m ) + Σ mn ( θ mn 3 ) T f 3 ( h m , h n ) + Σ m ( θ m 4 ) T f 4 ( h m ) - - - ( 22 )
特征函数f1和f2是指示主题和文档间兼容性的特征向量;f3是指示两个主题间关联性的特征向量;f4是主题h的先验;是概率模型的参数,它表示参数和第l个特征函数fl关联并以第m个主题hm作为函数输入;m,n分别对应第m和n个主题的下标。式(9)中的特征函数具体定义为如下形式:
ψ ( h , x , d ) = Σ m ( θ m 1 ) T xh m + Σ m ( θ m 2 ) T dh m + Σ mn θ mn 3 h m h n + Σ m 1 2 θ m 4 h m 2 . - - - ( 23 )
6)共享主题的期望使用变分推理方法近似计算,即使用独立高斯分布q(h)近似计算条件概率分布p(h|x,d),近似分布定义为多个高斯分布的乘积形式:
q ( h ) = Π m = 1 M q ( h m | μ m ) - - - ( 24 )
其中q(hmm)是均值为μm方差为1的高斯分布,通过最小化q(h)和p(h|x,d)间的KL距离,得到如下不动点方程:
μ m = - 1 θ m 4 ( Σ n = 1 M θ mn 3 μ n + x T θ m 1 + d T θ m 2 ) - - - ( 25 )
通过迭代计算式(12)来得到μm,易证共享主题的期望可用μm来近似:
E p ( h m | x , d ) h m = ∫ h m q ( h m | x , d ) = μ m - - - ( 26 )
所述的步骤4)包括:
1)给定查询文档和候选文档的隐性耦合表达,使用式(1)对每个候选文档进行评分;
2)对根据评分结构对候选文档进行排序,其结果即为跨媒体排序结果y。
实施例
本发明在公开数据集NUS-WIDE上进行了跨媒体排序实验。NUS-WIDE数据包含图像和图像上传者对图像的文本标注构成的跨模态文档,同时包含81个可以作为类别信息的概念标签。如果图像和文本都归属于81类中的一类,则认为图像和文本相关,否则不相关。对于特征提取按照本发明所说步骤进行,数据集中的图像数据被表示为1000维特征向量,对应的文本标注表被示为500维特征向量。为了客观地评价本发明的算法的性能,使用平均准确率(Mean AveragePrecision,MAP)对本发明进行评价。按照具体实施方式中描述的步骤,所得的实验结果如下:
MAP50 MAPall
文本查询图像 0.4739 0.4008
图像查询文本 0.5347 0.4003
表1
其中MAP50是前50个返回结果计算得到的MAP值,MAPall是所有返回结果计算得到的MAP值。

Claims (5)

1.一种基于多模态隐性耦合表达的跨媒体排序方法,其特征在于包括如下步骤: 
1)构建排序用的训练样本:在文本检索图像的训练样本中,将文本作为查询文档,将图像作为候选文档;在图像检索文本的训练样本中,将图像作为查询文档,将文本作为候选文档; 
2)对构建得到的训练样本进行基于隐性耦合表达的跨媒体排序学习,得到隐性耦合表达挖掘模型以及跨媒体排序模型; 
3)用户提交查询文档后,对于每一个候选文档,使用隐性耦合表达挖掘模型构建其和查询文档间的隐性耦合表达; 
4)使用学习得到的跨媒体排序模型进行跨媒体检索:基于隐性耦合表达,使用排序模型对查询文档和候选文档的关联性进行评分,根据关联性评分的高低对候选文档进行排序,最后输出这一跨媒体排序结果。 
2.根据权利要求1所述的一种基于多模态隐性耦合表达的跨媒体排序方法,其特征在于,所述的步骤1)包括: 
1)对训练样本里的所有文本利用词袋模型进行特征表达,文本最终被表示为 其中D1为文本特征空间的维数; 
2)将训练样本里的所有图像利用视觉词袋模型进行特征表达,图像最终被表达为其中D2为图像特征空间的维数; 
3)对文本检索图像方向而言,对每一个文本,构建一个候选图像的排序列表,其中列表中的图像被标记为与该文本语义相关或者语义不相关,因此每个文本检索图像的训练样本被表示为三元组其中N为训练样本个数,tk为检索文本,pk为图像集合,是图像集合上的排序,Y表示整个排序空间; 
4)对图像检索文本方向而言,对每一个图像,构建一个文本的排序列表,其中列表中的文本被标记为与该图像语义相关或者语义不相关,每个图像检索文本的训练样本被表示为三元组N为训练样本个数,pk为检索图像,tk是文本文档集合,是文本文档集合上的排序。 
3.根据权利要求1所述的一种基于多模态隐性耦合表达的跨媒体排序方法,其特征在于,所述的步骤2)包括: 
1)给定N个训练样本组成训练集其中x(k) 是一个查询文档,是包含P个候选文档的集合,P为文档个数,y(k)是对应查询文档的排序,如式(1)构建损失函数,隐性耦合表示挖掘模型和排序模型的参数需要同时满足这一损失函数: 
其中,
其中,w是排序模型的参数,θ是隐性耦合表示挖掘模型的参数;F(·)是一个人工指定的判别函数,用来评估模型预测的排序、查询和候选文档之间的适配度,对于任意查询文档x,其候选文档和排序y,F(·)定义如下: 
其中,分别是候选文档集中与查询文档相关和不相关的文档的子集;di,dj分别为候选文档集中的第i个和第j个文档;|·|标记了集合中元素的个数;s(·)是一个评分函数,用来衡量查询文档和一个候选文档之间的关联程度,基于隐性耦合表示对查询文档x和候选文档d间的关联性进行评分,关联评分函数定义如下: 
s(x,d)=wTH(x,d)                  (3) 
其中H(x,d)标记了查询文档和候选文档之间的隐性耦合表示; 
将查询文档和候选文档共享的主题记为h={hm|m=1,...,M},h的每一维hm表示了两个多模态文档共享第m个主题的程度,M表示主题个数,隐性耦合表示被定义为,给定一对查询x和候选文档d时,共享主题在条件概率分布p(h|x,d)下的期望: 
H(x,d)=Ep(h|x,d)(h).              (4) 
2)使用随机梯度下降算法求解式(1),得到隐性耦合表示挖掘模型和排序模型的参数,式(1)等价于如下无约束优化问题: 
其中,
损失函数L关于w的梯度为: 
损失函数L关于θ的梯度为: 
其中,
其中,Ep(·)是期望Ep(h|x,d)(·)的简写形式,使用变分推理得到;f是指示文档和主题之间兼容性的特征向量。 
4.根据权利要求1所述的一种基于多模态隐性耦合表达的跨媒体排序方法,其特征在于,所述的步骤3)包括: 
1)如式(4)所示,查询文档和候选文档间的隐性耦合表示被定义为两者在概率分布p(h|x,d)上的共享主题的期望; 
给定一对查询文档x和候选文档d,两者共享的主题的条件概率分布建模如下: 
其中,Z为归一化量,势函数Ψ(h,x,d)定义如下: 
特征函数f1和f2是指示主题和文档间兼容性的特征向量;f3是指示两个主题间关联性的特征向量;f4是主题h的先验;是概率模型的参数,它表示参数和第l个特征函数fl关联并以第m个主题hm作为函数输入;m,n分别对应第m和n个主题的下标。式(9)中的特征函数具体定义为如下形式: 
2)共享主题的期望使用变分推理方法近似计算,即使用独立高斯分布q(h)近似计算条件概率分布p(h|x,d),近似分布定义为多个高斯分布的乘积形式: 
其中q(hmm)是均值为μm方差为1的高斯分布,通过最小化q(h)和p(h|x,d)间的KL距离,得到如下不动点方程: 
通过迭代计算式(12)来得到μm,易证共享主题的期望可用μm来近似: 
5.根据权利要求1所述的一种基于多模态隐性耦合表达的跨媒体排序方法,其特征在于,所述的步骤4)包括: 
1)给定查询文档和候选文档的隐性耦合表达,使用式(1)对每个候选文档进行评分; 
2)对根据评分结构对候选文档进行排序,其结果即为跨媒体排序结果y。 
CN201410593006.4A 2014-10-29 2014-10-29 一种基于多模态隐性耦合表达的跨媒体排序方法 Expired - Fee Related CN104346450B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410593006.4A CN104346450B (zh) 2014-10-29 2014-10-29 一种基于多模态隐性耦合表达的跨媒体排序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410593006.4A CN104346450B (zh) 2014-10-29 2014-10-29 一种基于多模态隐性耦合表达的跨媒体排序方法

Publications (2)

Publication Number Publication Date
CN104346450A true CN104346450A (zh) 2015-02-11
CN104346450B CN104346450B (zh) 2017-06-23

Family

ID=52502041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410593006.4A Expired - Fee Related CN104346450B (zh) 2014-10-29 2014-10-29 一种基于多模态隐性耦合表达的跨媒体排序方法

Country Status (1)

Country Link
CN (1) CN104346450B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109213975A (zh) * 2018-08-23 2019-01-15 重庆邮电大学 一种基于字符层级卷积变分自编码的推特文本表示方法
CN117271819A (zh) * 2023-11-17 2023-12-22 上海闪马智能科技有限公司 图像数据的处理方法和装置、存储介质及电子装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1920818A (zh) * 2006-09-14 2007-02-28 浙江大学 基于多模态信息融合分析的跨媒体检索方法
CN103488713A (zh) * 2013-09-10 2014-01-01 浙江大学 一种可直接度量不同模态数据间相似性的跨模态检索方法
CN103559191A (zh) * 2013-09-10 2014-02-05 浙江大学 基于隐空间学习和双向排序学习的跨媒体排序方法
CN103903163A (zh) * 2014-02-27 2014-07-02 中国科学院自动化研究所 一种基于耦合主题模型的协同滤波方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1920818A (zh) * 2006-09-14 2007-02-28 浙江大学 基于多模态信息融合分析的跨媒体检索方法
CN103488713A (zh) * 2013-09-10 2014-01-01 浙江大学 一种可直接度量不同模态数据间相似性的跨模态检索方法
CN103559191A (zh) * 2013-09-10 2014-02-05 浙江大学 基于隐空间学习和双向排序学习的跨媒体排序方法
CN103903163A (zh) * 2014-02-27 2014-07-02 中国科学院自动化研究所 一种基于耦合主题模型的协同滤波方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘扬,郑逢斌,姜保庆,蔡坤: "基于多模态融合和时空上下文语义的跨媒体检索模型的研究", 《计算机应用》 *
庄毅,庄越挺,吴飞: "一种支持海量跨媒体检索的集成索引结构", 《软件学报》 *
范雪峰: "基于跨媒体特征向量的分类及多模态数据分析", 《中国优秀硕士学位论文全文数据库》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109213975A (zh) * 2018-08-23 2019-01-15 重庆邮电大学 一种基于字符层级卷积变分自编码的推特文本表示方法
CN109213975B (zh) * 2018-08-23 2022-04-12 重庆邮电大学 一种基于字符层级卷积变分自编码的推特文本表示方法
CN117271819A (zh) * 2023-11-17 2023-12-22 上海闪马智能科技有限公司 图像数据的处理方法和装置、存储介质及电子装置
CN117271819B (zh) * 2023-11-17 2024-03-01 上海闪马智能科技有限公司 图像数据的处理方法和装置、存储介质及电子装置

Also Published As

Publication number Publication date
CN104346450B (zh) 2017-06-23

Similar Documents

Publication Publication Date Title
CN111966917B (zh) 一种基于预训练语言模型的事件检测与摘要方法
Narasimhan et al. Straight to the facts: Learning knowledge base retrieval for factual visual question answering
CN102902821B (zh) 基于网络热点话题的图像高级语义标注、检索方法及装置
CN104317834B (zh) 一种基于深度神经网络的跨媒体排序方法
CN103559191B (zh) 基于隐空间学习和双向排序学习的跨媒体排序方法
CN108121702B (zh) 数学主观题评阅方法及系统
WO2019015246A1 (zh) 图像特征获取
CN107832662A (zh) 一种获取图片标注数据的方法和系统
CN105205096A (zh) 一种跨文本模态和图像模态的数据检索方法
CN105279495A (zh) 一种基于深度学习和文本总结的视频描述方法
CN109492105B (zh) 一种基于多特征集成学习的文本情感分类方法
CN104346440A (zh) 一种基于神经网络的跨媒体哈希索引方法
CN108052504B (zh) 数学主观题解答结果的结构分析方法及系统
CN102629279B (zh) 一种用于图像或视频搜索重排序的方法
CN102750347B (zh) 一种用于图像或视频搜索重排序的方法
CN105095863A (zh) 基于相似性权值的半监督字典学习的人体行为识别方法
CN104966105A (zh) 一种鲁棒机器错误检索方法与系统
CN106156333A (zh) 一种融合社会化信息的改进单类协同过滤方法
CN104317837B (zh) 一种基于主题模型的跨模态检索方法
CN106485272A (zh) 基于流形约束的跨模态嵌入的零样本分类方法
CN103473309B (zh) 一种基于概率单词选择和监督主题模型的文本分类方法
CN107844531B (zh) 答案输出方法、装置和计算机设备
CN104346450B (zh) 一种基于多模态隐性耦合表达的跨媒体排序方法
CN107506359B (zh) 试题高阶属性挖掘方法及系统
von Davier et al. Scoring graphical responses in TIMSS 2019 using artificial neural networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170623

Termination date: 20181029

CF01 Termination of patent right due to non-payment of annual fee