CN104765878A - 一种适用于多模态信息的稀疏编码算法及其应用 - Google Patents

一种适用于多模态信息的稀疏编码算法及其应用 Download PDF

Info

Publication number
CN104765878A
CN104765878A CN201510205245.2A CN201510205245A CN104765878A CN 104765878 A CN104765878 A CN 104765878A CN 201510205245 A CN201510205245 A CN 201510205245A CN 104765878 A CN104765878 A CN 104765878A
Authority
CN
China
Prior art keywords
represent
image
social media
rarefaction representation
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510205245.2A
Other languages
English (en)
Inventor
刘学亮
刘菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Third Research Institute of the Ministry of Public Security
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201510205245.2A priority Critical patent/CN104765878A/zh
Publication of CN104765878A publication Critical patent/CN104765878A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种适用于多模态信息的稀疏编码算法及其应用,其特征是按如下步骤进行:1提取社会媒体的图像和文本的特征;2对相同模态特征建立图拉普拉斯矩阵;3建立最大化平均散度矩阵;4构建基于稀疏编码的目标函数;5采用特征符号搜索算法更新稀疏编码,得到多模态信息的特征表示;6利用得到的特征表示进行交叉检索。本发明能够充分利用多模态信息进行编码,降低不同模态间的分布差异,从而提高稀疏编码的鲁棒性,提高交叉检索的准确率。

Description

一种适用于多模态信息的稀疏编码算法及其应用
技术领域
本发明涉及多媒体信息检索,尤其涉及一种对多模态信息的稀疏编码算法及其应用。
背景技术
近年来,随着微博,Facebook等社交网络平台的兴起,多媒体信息呈现爆炸式的增长,这为传统的信息检索技术提出了新的要求。单纯的文本检索已经不能满足用户日益复杂的信息检索需求,用户希望能获得文本,图像,音频,视频等不同模态的数据。多模态信息间的交叉检索,如输入一副图像,检索与之相关的文本,或者输入一段文字,检索与之最匹配的图像,成为学术界关注的热点问题。
从现有的多模态信息处理技术中可以看出,其核心问题是对不同模态数据的建模,使得不同模态的数据可以在某一个相同的特征空间下表示,从根本上来说是特征表示的问题。
稀疏编码是一种有效的特征表示方法,在机器学习,模式识别上得到越来越多的重视,也已经成功的应用到了纹理识别,图像分类和人脸识别上,但是在处理多模态信息问题时,传统稀疏编码存在以下缺陷和不足:
第一、过完备的码本和独立的稀疏编码,会导致编码过程中丢失数据间的相似性信息,使得相似的特征被编码为差异较大的稀疏码,导致了稀疏编码的不稳定性。
第二、传统稀疏编码算法没有考虑到对多模态特征进行编码的情况,而在多模态信息交叉检索的问题研究中,查询项和被检索项由不同模态的特征表示,在分布上会有很大的差异性,这也影响了稀疏编码的稳定性,从而降低交叉检索的准确率。
发明内容
本发明是为了避免现存技术所存在的不足之处,提出一种适用于多模态信息的稀疏编码算法及其应用,以期能充分利用多模态信息进行编码,降低不同模态间的分布差异,从而增强稀疏表示的鲁棒性,提高多模态信息检索的准确率。
本发明为解决技术问题采用如下技术方案:
本发明一种适用于多模态信息的稀疏编码算法,所述多模态信息包括社会媒体图像和文本信息,其特征点是按如下步骤进行:
步骤1、对所述多模态信息D进行特征提取,获得多模态信息D的特征矩阵,记为D=(XI,XT);并有表示所述社会媒体图像的特征矩阵;表示第i个社会媒体图像的特征;t1表示所述社会媒体图像特征矩阵的维度;m表示所述社会媒体图像的个数;表示所述文本信息的特征矩阵;表示第i 个文本信息的特征;t2表示所述文本信息特征矩阵的维度;n表示所述文本信息的个数;
步骤2、建立同一模态特征的图拉普拉斯矩阵LI和LT
步骤2.1、对所述m个社会媒体图像利用KNN算法建立一个k近邻图,所述k近邻图包括m个顶点,每个顶点表示一个社会媒体图像的特征;
若所述社会媒体图像的特征矩阵XI中,第j个社会媒体图像特征在第i个社会媒体图像特征的k近邻内,则将第i个顶点和第j个的相似性记为1;若第j个社会媒体图像特征不在第i个社会媒体图像特征的k近邻内,则第i个顶点和第j个的相似性记为0;从而得到所述第i个社会媒体图像的相似性向量进而得到m个社会媒体图像的相似性矩阵WI,1≤j≤m,j≠i;
步骤2.2、利用式(1)获得与第i个社会媒体图像特征相关的相似度的总和即为所述第i个社会媒体图像特征的度,从而获得m个社会媒体图像特征的度  D I = [ d 1 I , d 2 I , . . . , d i I , . . . , d m I ] :
d i I = Σ α = 1 k ( w i , α I ) ′ - - - ( 1 )
步骤2.3、利用式(2)获得m个社会媒体图像特征矩阵XI的图拉普拉斯矩阵LI
LI=diag(DI)-WI      (2)
式(2)中,diag(DI)表示以m个社会媒体图像特征的度DI中的元素作为对角元素求对角矩阵;
步骤2.4、根据所述步骤2.1-步骤2.3,同理获得n个文本信息的图拉普拉斯矩阵LT
步骤3、利用式(3)建立最大均值差异矩阵M:
M p , q = 1 / m 2 , p , q ≤ m 1 / n 2 , p , q > m - 1 / m × n , else - - - ( 3 )
式(3)中,Mp,q表示所述最大均值差异矩阵M中任一元素;
步骤4、建立如式(4)所示的基于稀疏编码的目标函数:
min B I , B T , S I , S T | | X I - B I S I | | F 2 + μ 1 tr ( S I L I ( S I ) ′ ) + λ 1 Σ σ = 1 m | s σ I | + | | X T - B T S T | | F 2 + μ 2 tr ( S T L T ( S T ) ′ ) + λ 2 Σ τ = 1 n | s τ T | + βtr ( SMS ′ ) - - - ( 4 )
式(4)中,表示对应于所述社会媒体图像特征XI的初始码本,表示所述初始图像码本的第u个基向量,1≤u≤r,t1表示所述初始图像码本的维度,r表示所示初始图像码本的大小;BT表示对应于所述文本信息特征XT的初始文本码本,表示所述初始文本码本的第v个基向量,1≤v≤r, t2表示所述初始文本码本的维度,r表示所述初始文本码本的大小;
表示所述社会媒体图像的初始稀疏表示,表示所述初始图像稀疏表示中第σ列,1≤σ≤m,SI∈Rr×m,r表示所述初始图像稀疏表示的维度,m表示所述初始图像稀疏表示的大小;表示所述文本信息的初始稀疏表示,表示所述初始文本稀疏表示中第τ列,1≤τ≤n,ST∈Rr×n,r表示所述初始文本稀疏表示的维度,n表示所述初始文本稀疏表示的大小;S=[SI,ST]表示初始图像稀疏表示SI与初始文本稀疏表示ST的合并矩阵;(SI)′和(ST)′分别表示稀疏表示SI与稀疏表示ST的转置,tr()表示求矩阵的迹;μ1、μ2、β、λ1和λ2分别表示权值;
步骤5、采用特征符号搜索算法更新所述初始图像稀疏表示SI与初始文本稀疏表示ST,获得多模态信息的稀疏表示:
步骤5.1、定义循环变量ω;并初始化ω=1;则第ω次图像码本为所述初始图像码本BI;第ω次图像稀疏表示为所述初始图像稀疏表示SI;所述第ω次文本码本为所述初始文本码本BT;所述第ω次文本稀疏表示为所述初始文本稀疏表示ST
步骤5.2、固定所述第ω次图像码本获得如式(5)所示的第ω次图像稀疏表示的目标更新函数并采用特征符号搜索算法求解式(5)获得第ω次更新后的图像稀疏表示
min S ω I | | X I - B ω I S ω I | | F 2 + μ 1 tr ( S ω I L I ( S ω I ) ′ ) + βtr ( S ω MS ω ′ ) + λ 1 Σ σ = 1 m | ( s σ I ) ω | - - - ( 5 )
步骤5.3、固定所述第ω次文本码本获得如式(6)所示的所述第ω次文本稀疏表示的 目标更新函数并采用特征符号搜索算法求解式(6)获得第ω次更新后的文本稀疏表示
min S ω T | | X T - B ω T S ω T | | F 2 + μ 2 tr ( S ω T L T ( S ω T ) ′ ) + βtr ( S ω MS ω ′ ) + λ 2 Σ τ = 1 n | ( s τ T ) ω | - - - ( 6 )
步骤5.4、固定所述第ω次更新后的图像稀疏表示利用式(7)获得第ω次更新后的图像码本
min B ω I | | X I - B ω I S ω I | | F 2 s . t . | | ( b u I ) ω | | 2 ≤ c , ∀ u = 1 , . . . , r - - - ( 7 )
步骤5.5、固定所述第ω次更新后的文本稀疏表示利用式(8)获得第ω次更新后的文本码本
min B ω I | | X I - B ω I S ω I | | F 2 s . t . | | ( b v I ) ω | | 2 ≤ c , ∀ v = 1 , . . . , r - - - ( 8 )
步骤5.5、将ω+1的值赋给ω,重复步骤5.2-步骤5.5直至式(5)和式(6)所示的目标更新函数最小化,从而获得优化后的图像稀疏表示和文本稀疏表示。
本发明一种对适用于多模态信息的稀疏编码算法的应用的特点是应用于多模态信息的交叉检索。
与已有技术相比,本发明有益效果体现在:
1、本发明将图拉普拉斯的策略和最大均值差异的方法二者加入到传统稀疏编码目标函数中,通过最小化目标函数克服了传统稀疏编码过程丢失特征间相似性的问题以及不同模态特征间存在分布差异带来的稀疏编码不稳定的问题,充分利用了多模态信息进行编码,从而提高了稀疏编码的鲁棒性,进而提高了多模态信息交叉检索的准确率。
2、本发明通过对相同模态特征构建图拉普拉斯矩阵,并形成图拉普拉斯约束,添加此项约束到传统稀疏编码目标函数中,解决了传统稀疏编码过程中丢失特征间相似性的问题,从而使得相似特征的稀疏表示也是相似的,提高了稀疏表示的稳定性。
3、本发明通过采用最大均值差异来度量不同模态特征的分布差异,并添加此项约束至传统稀疏编码目标函数中,通过最小化分布差异,使不同模态特征的稀疏表示更近,从而提高交叉检索的准确率。
4、本发明在目标函数优化过程中,通过采用特征符号搜索算法,使目标函数的优化从不可微的问题转化为无约束二次规划问题,从而加速了函数的优化过程。
附图说明
图1a为本发明算法与传统稀疏编码算法进行文本查询检索图像时获得的MAP值对比图;
图1b为本发明算法与传统稀疏编码算法进行图像查询检索文本时获得的MAP值对比图。
具体实施方式
本实施例中,一种适用于多模态信息的稀疏编码算法是按如下步骤进行:
步骤1、对多模态信息D进行特征提取,获得多模态信息D的特征矩阵,记为D=(XI,XT);并有表示社会媒体图像的特征矩阵;表示第i个社会媒体图像的特征;t1表示社会媒体图像特征矩阵的维度;m表示社会媒体图像的个数;本实施例中,社会媒体图像特征采用Bag of Word模型表示:首先从图像中提取SIFT特征,通过聚类的方法得到SIFT特征的中心点,并把SIFT特征投影到各个不同的聚类中心点,从而得到Bag of Word特征;表示文本信息的特征矩阵;表示第i个文本信息的特征;t2表示文本信息特征矩阵的维度;n表示文本信息的个数;本实施例中,文本信息的特征采用LDA模型,首先生成10个主题,每个文档采用在这10个主题上面的分布来表示;
步骤2、建立同一模态特征的图拉普拉斯矩阵LI和LT
步骤2.1、利用KNN(k-NearestNeighbor)算法,对m个社会媒体图像建立一个k近邻图,k近邻图包括m个顶点,每个顶点表示一个社会媒体图像的特征;
若社会媒体图像的特征矩阵XI中,第j个社会媒体图像特征在第i个社会媒体图像特征的k近邻内,则将第i个顶点和第j个的相似性记为1;若第j个社会媒体图像特征不在第i个社会媒体图像特征的k近邻内,则第i个顶点和第j个的相似性 记为0;从而得到第i个社会媒体图像的相似性向量进而得到m个社会媒体图像的相似性矩阵WI,1≤j≤m,j≠i;
步骤2.2、利用式(1)获得与第i个社会媒体图像特征相关的相似度的总和即为所述第i个社会媒体图像特征的度,从而获得m个社会媒体图像特征的度  D I = [ d 1 I , d 2 I , . . . , d i I , . . . , d m I ] :
d i I = Σ α = 1 k ( w i , α I ) ′ - - - ( 1 )
步骤2.3、利用式(2)获得m个社会媒体图像特征矩阵XI的图拉普拉斯矩阵LI
LI=diag(DI)-WI       (2) 
式(2)中,diag(DI)表示以m个社会媒体图像特征的度DI中的元素作为对角元素求对角矩阵;
步骤2.4、根据所述步骤2.1-步骤2.3,同理获得n个文本信息的图拉普拉斯矩阵LT
步骤3、利用式(3)建立最大均值差异矩阵M:
M p , q = 1 / m 2 , p , q ≤ m 1 / n 2 , p , q > m - 1 / m × n , else - - - ( 3 )
式(3)中,Mp,q表示最大均值差异矩阵M中任一元素;
步骤4、建立如式(6)所示的基于稀疏编码的目标函数:并通过最小化式(6)来达到保持编码过程相似性的目的;
传统稀疏编码目标函数如下,只有一个L1范式约束:
min S , D | | X - BS | | F 2 + λ Σ i = 1 m | s i | s . t . | | d i | | 2 ≤ c , ∀ i = 1 , . . . , θ - - - ( 4 )
步骤4.1、利用得到的拉普拉斯矩阵,给稀疏编码添加图拉普拉斯约束,得到新的目标函数如式(5)所示:
min B I , B T , S I , S T | | X I - B I S I | | F 2 + | | X T - B T S T | | F 2 + μ 1 tr ( S I L I ( S I ) ′ ) + μ 2 tr ( S T L T ( S T ) ′ ) - - - ( 5 )
步骤4.2、利用MMD矩阵,求得不同模态特征间分布差异的度量方式,添加至目标函数,得到如式(4)所示的适用于多模态的稀疏编码的目标函数:
min B I , B T , S I , S T | | X I - B I S I | | F 2 + μ 1 tr ( S I L I ( S I ) ′ ) + λ 1 Σ σ = 1 m | s σ I | + | | X T - B T S T | | F 2 + μ 2 tr ( S T L T ( S T ) ′ ) + λ 2 Σ τ = 1 n | s τ T | + βtr ( SMS ′ ) - - - ( 6 )
式(6)中,表示对应于所述社会媒体图像特征XI的初始码本,表示所述初始图像码本的第u个基向量,1≤u≤r,t1表示所述初始图像码 本的维度,r表示所示初始图像码本的大小;BT表示对应于所述文本信息特征XT的初始文本码本,表示所述初始文本码本的第v个基向量,1≤v≤r, t2表示所述初始文本码本的维度,r表示所述初始文本码本的大小;BI,BT均是由随机函数产生并进行归一化;表示所述社会媒体图像的初始稀疏表示,表示所述初始图像稀疏表示中第σ列,1≤σ≤m,SI∈Rr×m,r表示所述初始图像稀疏表示的维度,m表示所述初始图像稀疏表示的大小;表示所述文本信息的初始稀疏表示,表示所述初始文本稀疏表示中第τ列,1≤τ≤n,ST∈Rr×n,r表示所述初始文本稀疏表示的维度,n表示所述初始文本稀疏表示的大小;SI,ST均赋值为零矩阵;S=[SI,ST]表示初始图像稀疏表示SI与初始文本稀疏表示ST的合并矩阵,(SI)′和(ST)′分别表示稀疏表示SI与稀疏表示ST的转置,tr( )表示求矩阵的迹;μ1、μ2、β、λ1和λ2分别表示权值;本实施例中,选取的最优参数μ1=1.0、μ2=1.0、β=107、λ1=0.1、λ2=0.1;
步骤5、采用特征符号搜索算法更新所述初始图像稀疏表示SI与初始文本稀疏表示ST,使目标函数的优化从不可微的问题转化为无约束二次规划问题,从而加速函数的优化过程,以便快速获得多模态信息最终的稀疏表示:
步骤5.1、定义循环变量ω;并初始化ω=1;则第ω次图像码本为所述初始图像码本BI;第ω次图像稀疏表示为所述初始图像稀疏表示SI;所述第ω次文本码本为所述初始文本码本BT;所述第ω次文本稀疏表示为所述初始文本稀疏表示ST
步骤5.2、固定所述第ω次图像码本获得如式(5)所示的第ω次图像稀疏表示的目标更新函数并采用特征符号搜索算法求解式(5)获得第ω次更新后的图像稀疏表示
min S ω I | | X I - B ω I S ω I | | F 2 + μ 1 tr ( S ω I L I ( S ω I ) ′ ) + βtr ( S ω MS ω ′ ) + λ 1 Σ σ = 1 m | ( s σ I ) ω | - - - ( 7 )
步骤5.3、固定所述第ω次文本码本获得如式(6)所示的所述第ω次文本稀疏表示的目标更新函数并采用特征符号搜索算法求解式(6)获得第ω次更新后的文本稀疏表示
min S ω T | | X T - B ω T S ω T | | F 2 + μ 2 tr ( S ω T L T ( S ω T ) ′ ) + βtr ( S ω MS ω ′ ) + λ 2 Σ τ = 1 n | ( s τ T ) ω | - - - ( 8 )
步骤5.4、固定所述第ω次更新后的图像稀疏表示利用式(7)采用拉格朗日对偶方法获得第ω次更新后的图像码本
min B ω I | | X I - B ω I S ω I | | F 2 s . t . | | ( b u I ) ω | | 2 ≤ c , ∀ u = 1 , . . . , r - - - ( 9 )
步骤5.5、固定所述第ω次更新后的文本稀疏表示利用式(8)采用拉格朗日对偶方法获得第ω次更新后的文本码本
min B ω I | | X I - B ω I S ω I | | F 2 s . t . | | ( b v I ) ω | | 2 ≤ c , ∀ v = 1 , . . . , r - - - ( 10 )
步骤5.5、将ω+1的值赋给ω,重复步骤5.2-步骤5.5直至式(5)和式(6)获得最小值,从而获得优化后的图像稀疏表示和文本稀疏表示。
具体实施中,一种对适用于多模态信息的稀疏编码算法的应用,是应用于多模态信息的交叉检索,如以下实施例:
为了验证本专利中算法的效果,本实施例采用Wikipedia数据集中其测试集的文本图像对进行了文本图像的交叉检索实验。Wikipedia数据集包含10个语义类,分别是艺术,生物,地理,历史,文学,媒体,音乐,皇室,运动,战争,共有2866对数据,分为训练集和测试集。本实施例中分别采用LDA(Latent Dirichlet Allocation),Bag of Word模型表示数据集中的文本和图像信息。根据本实施例的相关描述,对文本图像特征进行稀疏编码得到新的特征表示并进行了两组实验,利用文本检索图像和利用图像检索文本。试验过程中,特征之间的相似性采用归一化相关系数进行度量。
为了客观的评价本专利提出的方案的性能,采用平均准确率,对两组实验的结果进行了评测,同时为了客观说明本专利算法的有效性,在两组试验中分别加入了利用传统稀疏编码算法进行试验的平均准确率用以对比。具体结果如下图1a和图1b所示,以及表1所示:
从图1a和图1b中可以看出,相比传统稀疏编码算法,采用图拉普拉斯和最大均值差异约束后的稀疏编码能够适用于多模态信息的编码,增强稀疏编码的鲁棒性,进而提高多模态信息交叉检索的准确率。
表1交叉模态检索MAP
方法 文本查询 图像查询
稀疏编码 0.1338 0.1159
本文方法 0.1674 0.1290
从表1可以看出,本专利提出的算法,有效提高了交叉模态检索的准确率。

Claims (2)

1.一种适用于多模态信息的稀疏编码算法,所述多模态信息包括社会媒体图像和文本信息,其特征是按如下步骤进行:
步骤1、对所述多模态信息D进行特征提取,获得多模态信息D的特征矩阵,记为D=(XI,XT);并有表示所述社会媒体图像的特征矩阵;表示第i个社会媒体图像的特征;t1表示所述社会媒体图像特征矩阵的维度;m表示所述社会媒体图像的个数;表示所述文本信息的特征矩阵;表示第i个文本信息的特征;t2表示所述文本信息特征矩阵的维度;n表示所述文本信息的个数;
步骤2、建立同一模态特征的图拉普拉斯矩阵LI和LT
步骤2.1、对所述m个社会媒体图像利用KNN算法建立一个k近邻图,所述k近邻图包括m个顶点,每个顶点表示一个社会媒体图像的特征;
若所述社会媒体图像的特征矩阵XI中,第j个社会媒体图像特征在第i个社会媒体图像特征的k近邻内,则将第i个顶点和第j个的相似性记为1;若第j个社会媒体图像特征不在第i个社会媒体图像特征的k近邻内,则第i个顶点和第j个的相似性记为0;从而得到所述第i个社会媒体图像的相似性向量Wi I,进而得到m个社会媒体图像的相似性矩阵WI,1≤j≤m,j≠i;
步骤2.2、利用式(1)获得与第i个社会媒体图像特征相关的相似度的总和即为所述第i个社会媒体图像特征的度,从而获得m个社会媒体图像特征的度 
步骤2.3、利用式(2)获得m个社会媒体图像特征矩阵XI的图拉普拉斯矩阵LI
LI=diag(DI)-WI   (2)
式(2)中,diag(DI)表示以m个社会媒体图像特征的度DI中的元素作为对角元素求对角矩阵;
步骤2.4、根据所述步骤2.1-步骤2.3,同理获得n个文本信息的图拉普拉斯矩阵LT
步骤3、利用式(3)建立最大均值差异矩阵M:
式(3)中,Mp,q表示所述最大均值差异矩阵M中任一元素;
步骤4、建立如式(4)所示的基于稀疏编码的目标函数:
式(4)中,表示对应于所述社会媒体图像特征XI的初始码本,表示所述初始图像码本的第u个基向量,1≤u≤r,t1表示所述初始图像码本的维度,r表示所示初始图像码本的大小;BT表示对应于所述文本信息特征XT的初始文本码本, 表示所述初始文本码本的第v个基向量,1≤v≤r, t2表示所述初始文本码本的维度,r表示所述初始文本码本的大小;
表示所述社会媒体图像的初始稀疏表示,表示所述初始图像稀疏表示中第σ列,1≤σ≤m,SI∈Rr×m,r表示所述初始图像稀疏表示的维度,m表示所述初始图像稀疏表示的大小;表示所述文本信息的初始稀疏表示,表示所述初始文本稀疏表示中第τ列,1≤τ≤n,ST∈Rr×n,r表示所述初始文本稀疏表示的维度,n表示所述初始文本稀疏表示的大小;表示初始图像稀疏表示SI与初始文本稀疏表示ST的合并矩阵;(SI)′和(ST)′分别表示稀疏表示SI与稀疏表示ST的转置,tr()表示求矩阵的迹;μ1、μ2、β、λ1和λ2分别表示权值;
步骤5、采用特征符号搜索算法更新所述初始图像稀疏表示SI与初始文本稀疏表示ST,获得多模态信息的稀疏表示:
步骤5.1、定义循环变量ω;并初始化ω=1;则第ω次图像码本为所述初始图像码本BI;第ω次图像稀疏表示为所述初始图像稀疏表示SI;所述第ω次文本码本为所述初始文本 码本BT;所述第ω次文本稀疏表示为所述初始文本稀疏表示ST
步骤5.2、固定所述第ω次图像码本获得如式(5)所示的第ω次图像稀疏表示的目标更新函数并采用特征符号搜索算法求解式(5)获得第ω次更新后的图像稀疏表示
步骤5.3、固定所述第ω次文本码本获得如式(6)所示的所述第ω次文本稀疏表示的目标更新函数并采用特征符号搜索算法求解式(6)获得第ω次更新后的文本稀疏表示
步骤5.4、固定所述第ω次更新后的图像稀疏表示利用式(7)获得第ω次更新后的图像码本
步骤5.5、固定所述第ω次更新后的文本稀疏表示利用式(8)获得第ω次更新后的文本码本
步骤5.5、将ω+1的值赋给ω,重复步骤5.2-步骤5.5直至式(5)和式(6)所示的目标更新函数最小化,从而获得优化后的图像稀疏表示和文本稀疏表示。
2.一种对适用于多模态信息的稀疏编码算法的应用,其特征是应用于多模态信息的交叉检索。
CN201510205245.2A 2015-04-27 2015-04-27 一种适用于多模态信息的稀疏编码算法及其应用 Pending CN104765878A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510205245.2A CN104765878A (zh) 2015-04-27 2015-04-27 一种适用于多模态信息的稀疏编码算法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510205245.2A CN104765878A (zh) 2015-04-27 2015-04-27 一种适用于多模态信息的稀疏编码算法及其应用

Publications (1)

Publication Number Publication Date
CN104765878A true CN104765878A (zh) 2015-07-08

Family

ID=53647705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510205245.2A Pending CN104765878A (zh) 2015-04-27 2015-04-27 一种适用于多模态信息的稀疏编码算法及其应用

Country Status (1)

Country Link
CN (1) CN104765878A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777318A (zh) * 2017-01-05 2017-05-31 西安电子科技大学 基于协同训练的矩阵分解跨模态哈希检索方法
CN108038080A (zh) * 2017-11-29 2018-05-15 浙江大学 一种利用适应性相似结构规则化进行局部多模态稀疏编码补全的方法
CN110232158A (zh) * 2019-05-06 2019-09-13 重庆大学 基于多模态数据的突发公共安全事件检测方法
CN114417852A (zh) * 2021-12-06 2022-04-29 重庆邮电大学 基于Wasserstein自编码器和高斯混合分布作为先验的主题建模方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120114248A1 (en) * 2010-11-10 2012-05-10 Microsoft Corporation Hierarchical Sparse Representation For Image Retrieval
CN102968635A (zh) * 2012-11-23 2013-03-13 清华大学 一种基于稀疏编码的图像视觉特征提取方法
CN103425768A (zh) * 2013-08-07 2013-12-04 浙江商业职业技术学院 一种视觉与语义相似性约束的图像检索方法
CN104036012A (zh) * 2014-06-24 2014-09-10 中国科学院计算技术研究所 字典学习、视觉词袋特征提取方法及检索系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120114248A1 (en) * 2010-11-10 2012-05-10 Microsoft Corporation Hierarchical Sparse Representation For Image Retrieval
CN102968635A (zh) * 2012-11-23 2013-03-13 清华大学 一种基于稀疏编码的图像视觉特征提取方法
CN103425768A (zh) * 2013-08-07 2013-12-04 浙江商业职业技术学院 一种视觉与语义相似性约束的图像检索方法
CN104036012A (zh) * 2014-06-24 2014-09-10 中国科学院计算技术研究所 字典学习、视觉词袋特征提取方法及检索系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FAN ZHU 等: "Cross-Modality Submodular Dictionary Learning for Information Retrieval", 《CIKM’ 14 PROCEEDINGS OF THE 23TH ACM INTERNATIONAL CONFERENCE ON CONFERENCE ON INFORMATION AND KNOWLEDGE MANAGEMENT》 *
MINGSHENG LONG 等: "Transfer Sparse Coding for Robust Image Representation", 《THE IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION(CVPR)》 *
王瑞霞 等: "拉普拉斯稀疏编码的图像检索算法", 《计算机科学》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777318A (zh) * 2017-01-05 2017-05-31 西安电子科技大学 基于协同训练的矩阵分解跨模态哈希检索方法
CN106777318B (zh) * 2017-01-05 2019-12-10 西安电子科技大学 基于协同训练的矩阵分解跨模态哈希检索方法
CN108038080A (zh) * 2017-11-29 2018-05-15 浙江大学 一种利用适应性相似结构规则化进行局部多模态稀疏编码补全的方法
CN110232158A (zh) * 2019-05-06 2019-09-13 重庆大学 基于多模态数据的突发公共安全事件检测方法
CN114417852A (zh) * 2021-12-06 2022-04-29 重庆邮电大学 基于Wasserstein自编码器和高斯混合分布作为先验的主题建模方法

Similar Documents

Publication Publication Date Title
CN103488713B (zh) 一种可直接度量不同模态数据间相似性的跨模态检索方法
CN111967387A (zh) 表单识别方法、装置、设备及计算机可读存储介质
CN106126751A (zh) 一种具有时间适应性的分类方法及装置
CN112819023A (zh) 样本集的获取方法、装置、计算机设备和存储介质
CN111243601B (zh) 声纹聚类方法、装置、电子设备和计算机可读存储介质
CN107944485B (zh) 基于聚类群组发现的推荐系统及方法、个性化推荐系统
CN104765878A (zh) 一种适用于多模态信息的稀疏编码算法及其应用
CN107729311A (zh) 一种融合文本语气的中文文本特征提取方法
CN114444600A (zh) 基于记忆增强原型网络的小样本图像分类方法
CN108154156B (zh) 基于神经主题模型的图像集成分类方法及装置
CN106156333A (zh) 一种融合社会化信息的改进单类协同过滤方法
US20150294194A1 (en) Method of classifying a multimodal object
CN104820702B (zh) 一种基于决策树的属性加权方法及文本分类方法
CN115311478A (zh) 一种基于图深度聚类的联邦影像分类方法、存储介质
Ballas et al. Irim at TRECVID 2014: Semantic indexing and instance search
CN106997379A (zh) 一种基于图片文本点击量的相近文本的合并方法
EP3452916A1 (en) Large scale social graph segmentation
Pang et al. Improving object retrieval quality by integration of similarity propagation and query expansion
CN103440275A (zh) 一种基于普利姆的k均值聚类方法
CN104318271A (zh) 一种基于适应性编码和几何平滑汇合的图像分类方法
CN110188864B (zh) 基于分布表示和分布度量的小样本学习方法
CN104142978A (zh) 一种基于多特征和稀疏表示的图像检索系统及方法
CN114972959B (zh) 深度学习中样本生成和类内排序损失的遥感图像检索方法
US20230259761A1 (en) Transfer learning system and method for deep neural network
CN108021985A (zh) 一种模型参数训练方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Liu Xueliang

Inventor after: Wang Meng

Inventor after: Hong Richang

Inventor after: Liu Fei

Inventor after: Jin Bo

Inventor before: Liu Xueliang

Inventor before: Liu Fei

CB03 Change of inventor or designer information
TA01 Transfer of patent application right

Effective date of registration: 20170726

Address after: 230002 Tunxi Road, Anhui, China, No. 193, No.

Applicant after: Hefei University of Technology

Applicant after: The Third Research Institute of Ministry of Public Security

Address before: Tunxi road in Baohe District of Hefei city of Anhui Province, No. 193 230009

Applicant before: Hefei University of Technology

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20150708

RJ01 Rejection of invention patent application after publication