CN112487231A - 一种基于双图正则化约束和字典学习的图像自动标注方法 - Google Patents

一种基于双图正则化约束和字典学习的图像自动标注方法 Download PDF

Info

Publication number
CN112487231A
CN112487231A CN202011493799.4A CN202011493799A CN112487231A CN 112487231 A CN112487231 A CN 112487231A CN 202011493799 A CN202011493799 A CN 202011493799A CN 112487231 A CN112487231 A CN 112487231A
Authority
CN
China
Prior art keywords
dictionary
image
sparse
weight
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011493799.4A
Other languages
English (en)
Other versions
CN112487231B (zh
Inventor
王振武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology Beijing CUMTB
Original Assignee
China University of Mining and Technology Beijing CUMTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology Beijing CUMTB filed Critical China University of Mining and Technology Beijing CUMTB
Priority to CN202011493799.4A priority Critical patent/CN112487231B/zh
Publication of CN112487231A publication Critical patent/CN112487231A/zh
Application granted granted Critical
Publication of CN112487231B publication Critical patent/CN112487231B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于双图正则化约束和字典学习的图像自动标注方法,包括以下步骤:根据图像训练集和测试集提取图像特征,得到图像特征集X;采用汉明损失和高斯核函数计算图像间相似度权重Wi,j,得到特征空间正则化图LC;构建初始稀疏字典D,并对图像特征集X进行稀疏重构得到初始稀疏编码A;采用凸优化工具获得字典原子图LD;基于特征空间正则化图LC约束、字典原子图LD约束及稀疏编码A,交替更新得到最优稀疏字典D和分类器W;根据最优稀疏字典D进行特征重构,自适应扩大分类权重并利用分类器W进行标签概率预测,根据标签预测概率进行图像的自动标注。本发明能够有效的关联特征之间和标签之间的高维联系,具有良好的准确性、泛用性和适应性。

Description

一种基于双图正则化约束和字典学习的图像自动标注方法
技术领域
本发明属于图像检索技术领域,具体涉及一种基于双图正则化约束和字典学习的图像自动标注方法。
背景技术
随着数码相机和电子设备的逐渐流行,各种图像的数量正在快速增加。对于图像检索,用户习惯于采用关键字等方式进行检索,但是人工的对图像进行标注的方法不但工作量大,而且不可避免地带来主观性和不精确性,让计算机实现图像自动标注势在必行。
图像自动标注是让计算机自动地给图像加上能够反映其内容的语义关键词,自动标注的使用可以有效地改善目前图像检索的困境。
使用包含样本原子在内的过完备字典,样本由过完备字典原子的稀疏线性组合表示,这是字典学习核心思想。目前研究活动主要集中在根据给定字典分解样本的跟踪算法,通过从一组预先指定的线性变换中选择一个或使字典适应一组训练信号,可以设计更符合上述模型的字典。这就直接指出了字典学习的两个过程:训练字典和稀疏编码。字典学习能够有效的关联特征与特征之间,标签与标签之间的高维联系。
因此,提供一种基于字典学习的自动化的图像标注方法是非常有必要的。
发明内容
针对现有技术存在的问题,本发明提供了一种基于双图正则化约束和字典学习的图像自动标注方法,通过使用特征空间和字典原子空间的拉普拉斯正则化图,通过交替迭代算法求得最优的稀疏字典,使用最优稀疏字典进行特征重构,使用分类器进行标签概率预测,基于标签预测概率构造图像预测标签集,实现图像的自动标注,具有较强的准确性和适用性。
为达到上述目的,本发明提出如下技术方案,本发明提供一种基于双图正则化约束和字典学习的图像自动标注方法,包括以下步骤:
S1、构建图像测试集和训练接,根据图像训练集和测试集提取图像特征,得到图像特征集X;
S2、采用汉明损失和高斯核函数计算图像间相似度权重Wi,j,得到特征空间正则化图LC
S3、构建初始稀疏字典D0根据初始稀疏字典D0对图像特征集X进行稀疏重构得到初始稀疏编码A;
S4、采用凸优化工具获得字典原子图LD;基于特征空间正则化图LC约束、字典原子图LD约束及稀疏编码A,采用交替更新并自适应扩大编码权重得到最优稀疏字典D和分类器W;
S5、根据最优稀疏字典D进行特征重构,自适应扩大分类权重并利用分类器W进行标签概率预测,根据标签预测概率进行图像的自动标注。
优选地,所述测试集和所述训练集分别包含若干个特征向量xi,每个特征向量xi包含若干个连续特征和离散特征。
优选地,所述步骤S2的具体过程为:
S2.1、根据汉明损失计算图像离散特征间相似度的权重
Figure BDA0002841502540000031
S2.2、根据高斯核函数计算图像连续特征间相似度的权重
Figure BDA0002841502540000032
S2.3、根据图像离散特征间相似度的权重
Figure BDA0002841502540000033
和图像连续特征间相似度的权重
Figure BDA0002841502540000034
计算图像间的相似度的权重Wi,j
S2.4、根据图像间的相似度的权重Wi,j得到数据空间正则化图LC
优选地,所述步骤S3的具体过程为:
S3.1、获得初始化的稀疏编码A(0),并设置误差变量Z(0)及缩放变量U(0)
S3.2、对稀疏编码A(0)、误差变量Z(0)及缩放变量U(0)进行迭代更新,直到收敛;
S3.3对误差变量Z(k)及误差变量约束Ωj进行更新,根据最终的误差变量Z(k)得到稀疏编码A。
优选地,所述步骤S4的具体过程为:
S4.1、初始化字典D(0)及分类器W(0),得到联合字典
Figure BDA0002841502540000035
并通过联合字典
Figure BDA0002841502540000036
对特征和标签进行稀疏重构,得到稀疏编码
Figure BDA0002841502540000037
S4.2、根据稀疏限制T0和测试集样本数量M1得到字典原子使用数量阈值
Figure BDA0002841502540000038
并统计各个字典原子的使用数量CD,根据字典原子使用数量阈值
Figure BDA0002841502540000039
及字典原子使用数量CD对字典原子编码权重di进行更新;
S4.3、获得当前更新字典原子项dj,并依次更新字典原子项dj和稀疏编码,直到收敛;
S4.4、根据步骤S4.2对字典原子编码权重di进行更新,得到最终的联合字典
Figure BDA0002841502540000041
即为最优的稀疏字典D和分类器W。
优选地,所述对字典原子编码权重di进行更新的过程为:判断字典原子使用数量CD是否大于字典原子使用数量阈值
Figure BDA0002841502540000042
若字典原子使用数量CD大于字典原子使用数量阈值
Figure BDA0002841502540000043
则将字典原子编码权重di进行更新;若字典原子使用数量CD小于字典原子使用数量阈值
Figure BDA0002841502540000044
则保留原字典原子编码权重di
优选地,所述步骤S5的具体过程为:
S5.1、采用最优稀疏字典D对测试集进行稀疏重构,得到稀疏编码
Figure BDA0002841502540000045
S5.2、根据稀疏限制T0和训练集数量M1得到字典原子使用数量阈值
Figure BDA0002841502540000046
并统计各个字典原子的使用数量CK,根据字典原子使用数量阈值
Figure BDA0002841502540000047
及各个字典原子的使用数量CK对,测试特征的分类权重Atest[k,i]进行更新;
S5.3、采用稀疏编码Atest和分类器W得到预测概率向量
Figure BDA0002841502540000048
S5.4、计算训练集中属于某个标签的图像的标签集的平均长度
Figure BDA0002841502540000049
根据标签集的平均长度
Figure BDA00028415025400000410
计算测试集的标签集的预测长度length(y′i);
S5.5、根据预测概率向量
Figure BDA0002841502540000051
和预测长度length(y′i),得到图像预测标签集合,完成图像的自动标注。
本发明公开了以下技术效果:
本发明通过使用特征空间和特征属性空间的拉普拉斯正则化图,通过交替迭代算法求得最优的稀疏字典,使用最优稀疏字典进行特征重构,能够有效的关联特征和特征之间,标签和标签之间的高维联系;使用分类器进行标签概率预测;基于标签预测概率构造图像预测标签集,实现图像的自动标注,具有较强的准确性;同时本发明能够标注所有类型的图像,具有较强的泛用性;本发明还能够处理包含连续特征和离散特征的图像,具有较强的适应性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于双图正则化和字典学习的图像自动标注方法流程示意图:
图2为本发明的特征空间正则化图LC的计算流程示意图;
图3为本发明的稀疏编码A的计算流程示意图;
图4为本发明的最优稀疏字典D和分类器W的计算流程示意图;
图5为本发明构建图像预测标签集的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供一种基于双图正则化和字典学习的图像自动标注方法,包括以下步骤:
S1、构建图像测试集和训练接,根据图像训练集和测试集提取图像特征,得到图像特征集X;
本实施例提取M幅图像的特征构成训练集Xtrain为Xtrain={{(xi,yi)∈χ×{0,1}Q|i=1,2,...,M1}}和测试集Xtest为Xtest={{(xi,yi)∈χ×{0,1}Q|i=M1+1,M1+2,...,M}}。
其中:图像特征集X=(x1,x2,x3,...,xM)=(Xtrain,Xtest),其中
Figure BDA0002841502540000061
Figure BDA0002841502540000062
其中任意
Figure BDA0002841502540000063
为第i幅图像对应的特征向量,
Figure BDA0002841502540000064
为连续特征,N1为连续特征的个数,
Figure BDA0002841502540000071
为离散特征,N为特征的总个数,其中任意
Figure BDA0002841502540000072
为xi对应的标签向量,
Figure BDA0002841502540000073
q=1,2,...,Q,yi∈L,L={l1,l2,...,lQ}为总标签集,lq为L中的第q标签,Q为标签总数;i为图像的编号;。
设稀疏字典
Figure BDA0002841502540000074
K为稀疏字典D中的字典原子数量,
Figure BDA0002841502540000075
表示矩阵,稀疏编码
Figure BDA0002841502540000076
存在约束||ai||0≤T0,其中ai表示的A中第i项,即xi对应的稀疏编码,T0为稀疏限制,分类器
Figure BDA0002841502540000077
S2、采用汉明损失和高斯核函数计算图像间相似度权重Wi,j,得到特征空间正则化图LC,具体流程如图2所示。
S2.1、基于汉明损失构造xi与xj间各个离散特征的相似度权重
Figure BDA0002841502540000078
具体为:
Figure BDA0002841502540000079
S2.2、基于高斯核函数构造xi与xi间各个连续特征相似度权重
Figure BDA00028415025400000710
具体为:
Figure BDA00028415025400000711
其中:
Figure BDA00028415025400000712
表示向量
Figure BDA00028415025400000713
Figure BDA00028415025400000714
间的距离;σ为调节因子,
Figure BDA00028415025400000715
S2.3、对式(1)和式(2)中的
Figure BDA0002841502540000081
Figure BDA0002841502540000082
加权求和构造xi与xi间的相似度权重Wi,j,具体为:
Figure BDA0002841502540000083
S2.4、基于相似度权重Wi,j确定特征空间正则化图LC,具体为:
Figure BDA0002841502540000084
其中:
Figure BDA0002841502540000085
Figure BDA0002841502540000086
S3、构建初始稀疏字典D0,根据初始稀疏字典D0对图像特征X进行稀疏重构得到稀疏编码A,具体流程如图3所示。
S3.1、初始化稀疏编码
Figure BDA0002841502540000087
稀疏编码存在约束||ai||0≤T0,并设置误差变量Z(0)=A(0),缩放变量U(0)=0,k=1。
S3.2、在稀疏编码的第k次更新中,以(DTD+ρI)A+βALC=DTX+ρ(Z(k-1)-U(k-1))的解更新A(k),其中图度矩阵Δ是一个对角矩阵,且Δii=∑jWij(i,j=1,2,...,M1),与之相关联的特征空间正则化拉普拉斯图LC=Δ-W,规范化拉普拉斯为
Figure BDA0002841502540000088
ρ为迭代速率;β是字典原子图权重参数。
S3.3、更新
Figure BDA0002841502540000089
其中:
Figure BDA00028415025400000810
为投影算子,表示只取(A(k)+U(k-1))中每列前T0大的项。
S3.4、更新U(k)=U(k-1)+X(k)-Z(k),若不收敛,则令k=k+1并返回步骤S3.2。
S3.5、更新Ωj={i|Z(k)[i,j]≠0}(j=1,2...,M1),并更新
Figure BDA0002841502540000091
其中:Ωj为误差变量约束,表示为当更新某个字典原子误差时,只选择和其有关的稀疏编码的误差进行更新,而忽略和其无关的稀疏编码的误差;
Figure BDA0002841502540000092
是D在Ωj约束下的子集。
得到最终的Z(k)即为稀疏编码A。
S4、采用凸优化工具获得字典原子图LD;基于特征空间正则化图LC约束、字典原子图LD约束及稀疏编码A,采用交替更新并自适应扩大编码权重得到最优稀疏字典D和分类器W,具体流程如图4所示。
S4.1、本实施例采用凸优化CVX工具计算字典原子图LD,具体为:
Figure BDA0002841502540000093
由此,存在约束Li,j=Lj,i≤0(i≠j),LD 10,Tr(LD)=N(i,j=1,2,...,M1)。
其中:α是字典原子图的权重参数;Tr(·)是迹函数;||·||F表示F范数;1和0分别表示长度为N的全1列向量和全0列向量。
通过特征空间图约束和字典原子图约束,确定:
Figure BDA0002841502540000094
由此,存在约束||ai||0≤T0(i=1,2,...,M1)。
其中:β是字典原子图权重参数;γ是分类器权重参数。
S4.2、初始化字典
Figure BDA0002841502540000095
分类器
Figure BDA0002841502540000096
Figure BDA0002841502540000101
初始化k=1;
S4.3、在稀疏编码的第k次更新中,根据步骤S3通过字典
Figure BDA0002841502540000102
对训练集的图像特征和原始图像样本分类标签进行稀疏重构得到稀疏编码
Figure BDA0002841502540000103
S4.4、根据稀疏限制T0和测试集样本数量M1,计算获得需要扩大编码权重的字典原子使用数量阈值
Figure BDA0002841502540000104
统计各个字典原子的使用数量CD=(c1,c2,...,ck),其中:
Figure BDA0002841502540000105
扩大字典原子的编码权重,具体为:
Figure BDA0002841502540000106
S4.5、使用dj(j=1,2,...,K)表示当前更新字典原子项,得到误差变量约束
Figure BDA0002841502540000107
S4.6、定义限制算子Pj为使用了第j个字典原子的稀疏编码列的集合,
Figure BDA0002841502540000108
其中的
Figure BDA0002841502540000109
计算误差矩阵,具体为:
Figure BDA00028415025400001010
其中:
Figure BDA0002841502540000111
表示
Figure BDA0002841502540000112
的第i行;
S4.7、更新
Figure BDA0002841502540000113
Figure BDA0002841502540000114
Figure BDA0002841502540000115
表示约束条件下的vj,LC
更新
Figure BDA0002841502540000116
若不收敛,则k=k+1并回到步骤S4.2。
S4.8、根据步骤S4.4再次更新字典原子编码权重,得到最终的
Figure BDA0002841502540000117
即为最优稀疏字典D和分类器W。
S5、使用最优稀疏字典D进行特征重构并自适应扩大分类权重并利用分类器W进行标签概率预测,根据标签预测概率实现图像的自动标注,具体流程如图5所示。
基于稀疏字典D和分类器W预测xi属于lq的概率向量
Figure BDA0002841502540000118
构造图像的预测标签集yi′(i=M1+1,M1+2,...,M,q=1,2,...,Q)。
S5.1、使用最优稀疏字典D对测试图像特征Xtest进行稀疏重构,得到稀疏编码
Figure BDA0002841502540000119
S5.2、根据稀疏限制T0和训练集样本数量M1,计算获得需要扩大分类权重的字典原子使用数量阈值
Figure BDA00028415025400001110
统计各个字典原子的使用数量CK=(c1,c2,...,ck),其中ck=∑i(1|Atest[k,i]≠0)(i=1,2,...,M2;k=1,2,...,K),扩大测试特征的分类权重为:
Figure BDA0002841502540000121
S5.3、使用稀疏编码Atest和分类器W得到预测概率向量
Figure BDA0002841502540000122
Figure BDA0002841502540000123
S5.4、计算Xtrain中属于lq的图像的标签集的平均长度avelen(lq)
Figure BDA0002841502540000124
计算Xtest中图像xi的标签集的预测长度length(y′i):
Figure BDA0002841502540000125
S5.5、对
Figure BDA0002841502540000126
(q=1,2,...,Q)(i=M1+1,M1+2,...,M)由大到小进行排序;在由大到小的排序序列中选取前length(yi′)个概率对应的标签,将这些标签的集合作为图像预测标签集,完成对图像的自动标注。
以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (7)

1.一种基于双图正则化约束和字典学习的图像自动标注方法,其特征在于,包括以下步骤:
S1、构建图像测试集和训练接,根据图像训练集和测试集提取图像特征,得到图像特征集X;
S2、采用汉明损失和高斯核函数计算图像间相似度权重Wi,j,得到特征空间正则化图LC
S3、构建初始稀疏字典D0根据初始稀疏字典D0对图像特征集X进行稀疏重构得到初始稀疏编码A;
S4、采用凸优化工具获得字典原子图LD;基于特征空间正则化图LC约束、字典原子图LD约束及稀疏编码A,采用交替更新并自适应扩大编码权重得到最优稀疏字典D和分类器W;
S5、根据最优稀疏字典D进行特征重构,自适应扩大分类权重并利用分类器W进行标签概率预测,根据标签预测概率进行图像的自动标注。
2.根据权利要求1所述的基于双图正则化约束和字典学习的图像自动标注方法,其特征在于,所述测试集和所述训练集分别包含若干个特征向量xi,每个特征向量xi包含若干个连续特征和离散特征。
3.根据权利要求1所述的基于双图正则化约束和字典学习的图像自动标注方法,其特征在于,所述步骤S2的具体过程为:
S2.1、根据汉明损失计算图像离散特征间相似度的权重
Figure FDA0002841502530000011
S2.2、根据高斯核函数计算图像连续特征间相似度的权重
Figure FDA0002841502530000012
S2.3、根据图像离散特征间相似度的权重
Figure FDA0002841502530000021
和图像连续特征间相似度的权重
Figure FDA0002841502530000022
计算图像间的相似度的权重Wi,j
S2.4、根据图像间的相似度的权重Wi,j得到数据空间正则化图LC
4.根据权利要求1所述的基于双图正则化约束和字典学习的图像自动标注方法,其特征在于,所述步骤S3的具体过程为:
S3.1、获得初始化的稀疏编码A(0),并设置误差变量Z(0)及缩放变量U(0)
S3.2、对稀疏编码A(0)、误差变量Z(0)及缩放变量U(0)进行迭代更新,直到收敛;
S3.3对误差变量Z(k)及误差变量约束Ωj进行更新,根据最终的误差变量Z(k)得到稀疏编码A。
5.根据权利要求1所述的基于双图正则化约束和字典学习的图像自动标注方法,其特征在于,所述步骤S4的具体过程为:
S4.1、初始化字典D(0)及分类器W(0),得到联合字典
Figure FDA0002841502530000023
并通过联合字典
Figure FDA0002841502530000024
对特征和标签进行稀疏重构,得到稀疏编码
Figure FDA0002841502530000025
S4.2、根据稀疏限制T0和测试集样本数量M1得到字典原子使用数量阈值
Figure FDA0002841502530000026
并统计各个字典原子的使用数量CD,根据字典原子使用数量阈值
Figure FDA0002841502530000027
及字典原子使用数量CD对字典原子编码权重di进行更新;
S4.3、获得当前更新字典原子项dj,并依次更新字典原子项dj和稀疏编码,直到收敛;
S4.4、根据步骤S4.2对字典原子编码权重di进行更新,得到最终的联合字典
Figure FDA0002841502530000031
即为最优的稀疏字典D和分类器W。
6.根据权利要求5所述的基于双图正则化约束和字典学习的图像自动标注方法,其特征在于,所述对字典原子编码权重di进行更新的过程为:判断字典原子使用数量CD是否大于字典原子使用数量阈值
Figure FDA0002841502530000032
若字典原子使用数量CD大于字典原子使用数量阈值
Figure FDA0002841502530000033
则将字典原子编码权重di进行更新;若字典原子使用数量CD小于字典原子使用数量阈值
Figure FDA0002841502530000034
则保留原字典原子编码权重di
7.根据权利要求1所述的基于双图正则化约束和字典学习的图像自动标注方法,其特征在于,所述步骤S5的具体过程为:
S5.1、采用最优稀疏字典D对测试集进行稀疏重构,得到稀疏编码
Figure FDA0002841502530000035
S5.2、根据稀疏限制T0和训练集数量M1得到字典原子使用数量阈值
Figure FDA0002841502530000036
并统计各个字典原子的使用数量CK,根据字典原子使用数量阈值
Figure FDA0002841502530000037
及各个字典原子的使用数量CK对测试特征的分类权重Atest[k,i]进行更新;
S5.3、采用稀疏编码Atest和分类器W得到预测概率向量
Figure FDA0002841502530000038
S5.4、计算训练集中属于某个标签的图像的标签集的平均长度
Figure FDA0002841502530000041
根据标签集的平均长度
Figure FDA0002841502530000042
计算测试集的标签集的预测长度length(y′i);
S5.5、根据预测概率向量
Figure FDA0002841502530000043
和预测长度length(y′i),得到图像预测标签集合,完成图像的自动标注。
CN202011493799.4A 2020-12-17 2020-12-17 一种基于双图正则化约束和字典学习的图像自动标注方法 Active CN112487231B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011493799.4A CN112487231B (zh) 2020-12-17 2020-12-17 一种基于双图正则化约束和字典学习的图像自动标注方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011493799.4A CN112487231B (zh) 2020-12-17 2020-12-17 一种基于双图正则化约束和字典学习的图像自动标注方法

Publications (2)

Publication Number Publication Date
CN112487231A true CN112487231A (zh) 2021-03-12
CN112487231B CN112487231B (zh) 2021-08-27

Family

ID=74917416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011493799.4A Active CN112487231B (zh) 2020-12-17 2020-12-17 一种基于双图正则化约束和字典学习的图像自动标注方法

Country Status (1)

Country Link
CN (1) CN112487231B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113260044A (zh) * 2021-04-12 2021-08-13 北京邮电大学 基于双层字典学习的csi指纹定位方法、装置及设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102088606A (zh) * 2011-02-28 2011-06-08 西安电子科技大学 基于稀疏表示的去块效应方法
CN102122386A (zh) * 2011-03-01 2011-07-13 西安电子科技大学 基于字典迁移聚类的sar图像分割方法
CN102129573A (zh) * 2011-03-10 2011-07-20 西安电子科技大学 基于字典学习和稀疏表示的sar图像分割方法
CN104281845A (zh) * 2014-10-29 2015-01-14 中国科学院自动化研究所 基于旋转不变字典学习模型的人脸识别方法
CN104966105A (zh) * 2015-07-13 2015-10-07 苏州大学 一种鲁棒机器错误检索方法与系统
CN106557782A (zh) * 2016-11-22 2017-04-05 青岛理工大学 基于类字典的高光谱图像分类方法及装置
CN108564107A (zh) * 2018-03-21 2018-09-21 温州大学苍南研究院 基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法
CN108985177A (zh) * 2018-06-21 2018-12-11 南京师范大学 一种结合稀疏约束的快速低秩字典学习的人脸图像分类方法
CN110414616A (zh) * 2019-08-02 2019-11-05 南京大学 一种利用空间关系的遥感图像字典学习分类方法
CN111667453A (zh) * 2020-04-21 2020-09-15 浙江工业大学 一种基于局部特征和类标嵌入约束字典学习的胃肠镜图像异常检测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102088606A (zh) * 2011-02-28 2011-06-08 西安电子科技大学 基于稀疏表示的去块效应方法
CN102122386A (zh) * 2011-03-01 2011-07-13 西安电子科技大学 基于字典迁移聚类的sar图像分割方法
CN102129573A (zh) * 2011-03-10 2011-07-20 西安电子科技大学 基于字典学习和稀疏表示的sar图像分割方法
CN104281845A (zh) * 2014-10-29 2015-01-14 中国科学院自动化研究所 基于旋转不变字典学习模型的人脸识别方法
CN104966105A (zh) * 2015-07-13 2015-10-07 苏州大学 一种鲁棒机器错误检索方法与系统
CN106557782A (zh) * 2016-11-22 2017-04-05 青岛理工大学 基于类字典的高光谱图像分类方法及装置
CN108564107A (zh) * 2018-03-21 2018-09-21 温州大学苍南研究院 基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法
CN108985177A (zh) * 2018-06-21 2018-12-11 南京师范大学 一种结合稀疏约束的快速低秩字典学习的人脸图像分类方法
CN110414616A (zh) * 2019-08-02 2019-11-05 南京大学 一种利用空间关系的遥感图像字典学习分类方法
CN111667453A (zh) * 2020-04-21 2020-09-15 浙江工业大学 一种基于局部特征和类标嵌入约束字典学习的胃肠镜图像异常检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
臧淼: ""图像自动标注关键技术研究"", 《中国博士学位论文全文数据库 信息科技辑》 *
邓建国 等: ""监督学习中的损失函数及应用研究"", 《大数据》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113260044A (zh) * 2021-04-12 2021-08-13 北京邮电大学 基于双层字典学习的csi指纹定位方法、装置及设备
CN113260044B (zh) * 2021-04-12 2022-04-05 北京邮电大学 基于双层字典学习的csi指纹定位方法、装置及设备

Also Published As

Publication number Publication date
CN112487231B (zh) 2021-08-27

Similar Documents

Publication Publication Date Title
CN110209823B (zh) 一种多标签文本分类方法及系统
CN110309331B (zh) 一种基于自监督的跨模态深度哈希检索方法
CN110969020B (zh) 基于cnn和注意力机制的中文命名实体识别方法、系统及介质
CN110196980B (zh) 一种基于卷积网络在中文分词任务上的领域迁移
CN108304911A (zh) 基于记忆神经网络的知识抽取方法以及系统和设备
CN110222218B (zh) 基于多尺度NetVLAD和深度哈希的图像检索方法
CN109284411B (zh) 一种基于有监督超图离散化图像二值编码方法
CN110457514A (zh) 一种基于深度哈希的多标签图像检索方法
Pan et al. Product quantization with dual codebooks for approximate nearest neighbor search
CN112861976B (zh) 一种基于孪生图卷积哈希网络的敏感图像识别方法
CN114911958B (zh) 一种基于语义偏好的快速图像检索方法
CN114358188A (zh) 特征提取模型处理、样本检索方法、装置和计算机设备
Wei et al. Compact MQDF classifiers using sparse coding for handwritten Chinese character recognition
CN112163114B (zh) 一种基于特征融合的图像检索方法
CN110689049A (zh) 基于黎曼核字典学习算法的视觉分类方法
CN113821635A (zh) 一种用于金融领域的文本摘要的生成方法及系统
CN113806580A (zh) 基于层次语义结构的跨模态哈希检索方法
CN114281982B (zh) 一种多模态融合技术的图书宣传摘要生成方法和系统
CN115795065A (zh) 基于带权哈希码的多媒体数据跨模态检索方法及系统
Zou et al. Transductive zero-shot hashing for multilabel image retrieval
Guo et al. Improved image clustering with deep semantic embedding
Liu et al. Online optimized product quantization
CN112487231B (zh) 一种基于双图正则化约束和字典学习的图像自动标注方法
Rastegari et al. Computationally bounded retrieval
CN111666375A (zh) 文本相似度的匹配方法、电子设备和计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant