CN112487231A - 一种基于双图正则化约束和字典学习的图像自动标注方法 - Google Patents
一种基于双图正则化约束和字典学习的图像自动标注方法 Download PDFInfo
- Publication number
- CN112487231A CN112487231A CN202011493799.4A CN202011493799A CN112487231A CN 112487231 A CN112487231 A CN 112487231A CN 202011493799 A CN202011493799 A CN 202011493799A CN 112487231 A CN112487231 A CN 112487231A
- Authority
- CN
- China
- Prior art keywords
- dictionary
- image
- sparse
- weight
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于双图正则化约束和字典学习的图像自动标注方法,包括以下步骤:根据图像训练集和测试集提取图像特征,得到图像特征集X;采用汉明损失和高斯核函数计算图像间相似度权重Wi,j,得到特征空间正则化图LC;构建初始稀疏字典D,并对图像特征集X进行稀疏重构得到初始稀疏编码A;采用凸优化工具获得字典原子图LD;基于特征空间正则化图LC约束、字典原子图LD约束及稀疏编码A,交替更新得到最优稀疏字典D和分类器W;根据最优稀疏字典D进行特征重构,自适应扩大分类权重并利用分类器W进行标签概率预测,根据标签预测概率进行图像的自动标注。本发明能够有效的关联特征之间和标签之间的高维联系,具有良好的准确性、泛用性和适应性。
Description
技术领域
本发明属于图像检索技术领域,具体涉及一种基于双图正则化约束和字典学习的图像自动标注方法。
背景技术
随着数码相机和电子设备的逐渐流行,各种图像的数量正在快速增加。对于图像检索,用户习惯于采用关键字等方式进行检索,但是人工的对图像进行标注的方法不但工作量大,而且不可避免地带来主观性和不精确性,让计算机实现图像自动标注势在必行。
图像自动标注是让计算机自动地给图像加上能够反映其内容的语义关键词,自动标注的使用可以有效地改善目前图像检索的困境。
使用包含样本原子在内的过完备字典,样本由过完备字典原子的稀疏线性组合表示,这是字典学习核心思想。目前研究活动主要集中在根据给定字典分解样本的跟踪算法,通过从一组预先指定的线性变换中选择一个或使字典适应一组训练信号,可以设计更符合上述模型的字典。这就直接指出了字典学习的两个过程:训练字典和稀疏编码。字典学习能够有效的关联特征与特征之间,标签与标签之间的高维联系。
因此,提供一种基于字典学习的自动化的图像标注方法是非常有必要的。
发明内容
针对现有技术存在的问题,本发明提供了一种基于双图正则化约束和字典学习的图像自动标注方法,通过使用特征空间和字典原子空间的拉普拉斯正则化图,通过交替迭代算法求得最优的稀疏字典,使用最优稀疏字典进行特征重构,使用分类器进行标签概率预测,基于标签预测概率构造图像预测标签集,实现图像的自动标注,具有较强的准确性和适用性。
为达到上述目的,本发明提出如下技术方案,本发明提供一种基于双图正则化约束和字典学习的图像自动标注方法,包括以下步骤:
S1、构建图像测试集和训练接,根据图像训练集和测试集提取图像特征,得到图像特征集X;
S2、采用汉明损失和高斯核函数计算图像间相似度权重Wi,j,得到特征空间正则化图LC;
S3、构建初始稀疏字典D0根据初始稀疏字典D0对图像特征集X进行稀疏重构得到初始稀疏编码A;
S4、采用凸优化工具获得字典原子图LD;基于特征空间正则化图LC约束、字典原子图LD约束及稀疏编码A,采用交替更新并自适应扩大编码权重得到最优稀疏字典D和分类器W;
S5、根据最优稀疏字典D进行特征重构,自适应扩大分类权重并利用分类器W进行标签概率预测,根据标签预测概率进行图像的自动标注。
优选地,所述测试集和所述训练集分别包含若干个特征向量xi,每个特征向量xi包含若干个连续特征和离散特征。
优选地,所述步骤S2的具体过程为:
S2.4、根据图像间的相似度的权重Wi,j得到数据空间正则化图LC。
优选地,所述步骤S3的具体过程为:
S3.1、获得初始化的稀疏编码A(0),并设置误差变量Z(0)及缩放变量U(0);
S3.2、对稀疏编码A(0)、误差变量Z(0)及缩放变量U(0)进行迭代更新,直到收敛;
S3.3对误差变量Z(k)及误差变量约束Ωj进行更新,根据最终的误差变量Z(k)得到稀疏编码A。
优选地,所述步骤S4的具体过程为:
S4.3、获得当前更新字典原子项dj,并依次更新字典原子项dj和稀疏编码,直到收敛;
优选地,所述对字典原子编码权重di进行更新的过程为:判断字典原子使用数量CD是否大于字典原子使用数量阈值若字典原子使用数量CD大于字典原子使用数量阈值则将字典原子编码权重di进行更新;若字典原子使用数量CD小于字典原子使用数量阈值则保留原字典原子编码权重di。
优选地,所述步骤S5的具体过程为:
S5.2、根据稀疏限制T0和训练集数量M1得到字典原子使用数量阈值并统计各个字典原子的使用数量CK,根据字典原子使用数量阈值及各个字典原子的使用数量CK对,测试特征的分类权重Atest[k,i]进行更新;
本发明公开了以下技术效果:
本发明通过使用特征空间和特征属性空间的拉普拉斯正则化图,通过交替迭代算法求得最优的稀疏字典,使用最优稀疏字典进行特征重构,能够有效的关联特征和特征之间,标签和标签之间的高维联系;使用分类器进行标签概率预测;基于标签预测概率构造图像预测标签集,实现图像的自动标注,具有较强的准确性;同时本发明能够标注所有类型的图像,具有较强的泛用性;本发明还能够处理包含连续特征和离散特征的图像,具有较强的适应性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于双图正则化和字典学习的图像自动标注方法流程示意图:
图2为本发明的特征空间正则化图LC的计算流程示意图;
图3为本发明的稀疏编码A的计算流程示意图;
图4为本发明的最优稀疏字典D和分类器W的计算流程示意图;
图5为本发明构建图像预测标签集的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供一种基于双图正则化和字典学习的图像自动标注方法,包括以下步骤:
S1、构建图像测试集和训练接,根据图像训练集和测试集提取图像特征,得到图像特征集X;
本实施例提取M幅图像的特征构成训练集Xtrain为Xtrain={{(xi,yi)∈χ×{0,1}Q|i=1,2,...,M1}}和测试集Xtest为Xtest={{(xi,yi)∈χ×{0,1}Q|i=M1+1,M1+2,...,M}}。
其中任意为第i幅图像对应的特征向量,为连续特征,N1为连续特征的个数,为离散特征,N为特征的总个数,其中任意为xi对应的标签向量,q=1,2,...,Q,yi∈L,L={l1,l2,...,lQ}为总标签集,lq为L中的第q标签,Q为标签总数;i为图像的编号;。
S2、采用汉明损失和高斯核函数计算图像间相似度权重Wi,j,得到特征空间正则化图LC,具体流程如图2所示。
S2.4、基于相似度权重Wi,j确定特征空间正则化图LC,具体为:
S3、构建初始稀疏字典D0,根据初始稀疏字典D0对图像特征X进行稀疏重构得到稀疏编码A,具体流程如图3所示。
S3.2、在稀疏编码的第k次更新中,以(DTD+ρI)A+βALC=DTX+ρ(Z(k-1)-U(k-1))的解更新A(k),其中图度矩阵Δ是一个对角矩阵,且Δii=∑jWij(i,j=1,2,...,M1),与之相关联的特征空间正则化拉普拉斯图LC=Δ-W,规范化拉普拉斯为ρ为迭代速率;β是字典原子图权重参数。
S3.4、更新U(k)=U(k-1)+X(k)-Z(k),若不收敛,则令k=k+1并返回步骤S3.2。
S3.5、更新Ωj={i|Z(k)[i,j]≠0}(j=1,2...,M1),并更新其中:Ωj为误差变量约束,表示为当更新某个字典原子误差时,只选择和其有关的稀疏编码的误差进行更新,而忽略和其无关的稀疏编码的误差;是D在Ωj约束下的子集。
得到最终的Z(k)即为稀疏编码A。
S4、采用凸优化工具获得字典原子图LD;基于特征空间正则化图LC约束、字典原子图LD约束及稀疏编码A,采用交替更新并自适应扩大编码权重得到最优稀疏字典D和分类器W,具体流程如图4所示。
S4.1、本实施例采用凸优化CVX工具计算字典原子图LD,具体为:
由此,存在约束Li,j=Lj,i≤0(i≠j),LD 1=0,Tr(LD)=N(i,j=1,2,...,M1)。
其中:α是字典原子图的权重参数;Tr(·)是迹函数;||·||F表示F范数;1和0分别表示长度为N的全1列向量和全0列向量。
通过特征空间图约束和字典原子图约束,确定:
由此,存在约束||ai||0≤T0(i=1,2,...,M1)。
其中:β是字典原子图权重参数;γ是分类器权重参数。
计算误差矩阵,具体为:
S5、使用最优稀疏字典D进行特征重构并自适应扩大分类权重并利用分类器W进行标签概率预测,根据标签预测概率实现图像的自动标注,具体流程如图5所示。
S5.2、根据稀疏限制T0和训练集样本数量M1,计算获得需要扩大分类权重的字典原子使用数量阈值统计各个字典原子的使用数量CK=(c1,c2,...,ck),其中ck=∑i(1|Atest[k,i]≠0)(i=1,2,...,M2;k=1,2,...,K),扩大测试特征的分类权重为:
S5.4、计算Xtrain中属于lq的图像的标签集的平均长度avelen(lq):
计算Xtest中图像xi的标签集的预测长度length(y′i):
S5.5、对(q=1,2,...,Q)(i=M1+1,M1+2,...,M)由大到小进行排序;在由大到小的排序序列中选取前length(yi′)个概率对应的标签,将这些标签的集合作为图像预测标签集,完成对图像的自动标注。
以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (7)
1.一种基于双图正则化约束和字典学习的图像自动标注方法,其特征在于,包括以下步骤:
S1、构建图像测试集和训练接,根据图像训练集和测试集提取图像特征,得到图像特征集X;
S2、采用汉明损失和高斯核函数计算图像间相似度权重Wi,j,得到特征空间正则化图LC;
S3、构建初始稀疏字典D0根据初始稀疏字典D0对图像特征集X进行稀疏重构得到初始稀疏编码A;
S4、采用凸优化工具获得字典原子图LD;基于特征空间正则化图LC约束、字典原子图LD约束及稀疏编码A,采用交替更新并自适应扩大编码权重得到最优稀疏字典D和分类器W;
S5、根据最优稀疏字典D进行特征重构,自适应扩大分类权重并利用分类器W进行标签概率预测,根据标签预测概率进行图像的自动标注。
2.根据权利要求1所述的基于双图正则化约束和字典学习的图像自动标注方法,其特征在于,所述测试集和所述训练集分别包含若干个特征向量xi,每个特征向量xi包含若干个连续特征和离散特征。
4.根据权利要求1所述的基于双图正则化约束和字典学习的图像自动标注方法,其特征在于,所述步骤S3的具体过程为:
S3.1、获得初始化的稀疏编码A(0),并设置误差变量Z(0)及缩放变量U(0);
S3.2、对稀疏编码A(0)、误差变量Z(0)及缩放变量U(0)进行迭代更新,直到收敛;
S3.3对误差变量Z(k)及误差变量约束Ωj进行更新,根据最终的误差变量Z(k)得到稀疏编码A。
5.根据权利要求1所述的基于双图正则化约束和字典学习的图像自动标注方法,其特征在于,所述步骤S4的具体过程为:
S4.3、获得当前更新字典原子项dj,并依次更新字典原子项dj和稀疏编码,直到收敛;
7.根据权利要求1所述的基于双图正则化约束和字典学习的图像自动标注方法,其特征在于,所述步骤S5的具体过程为:
S5.2、根据稀疏限制T0和训练集数量M1得到字典原子使用数量阈值并统计各个字典原子的使用数量CK,根据字典原子使用数量阈值及各个字典原子的使用数量CK对测试特征的分类权重Atest[k,i]进行更新;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011493799.4A CN112487231B (zh) | 2020-12-17 | 2020-12-17 | 一种基于双图正则化约束和字典学习的图像自动标注方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011493799.4A CN112487231B (zh) | 2020-12-17 | 2020-12-17 | 一种基于双图正则化约束和字典学习的图像自动标注方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112487231A true CN112487231A (zh) | 2021-03-12 |
CN112487231B CN112487231B (zh) | 2021-08-27 |
Family
ID=74917416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011493799.4A Active CN112487231B (zh) | 2020-12-17 | 2020-12-17 | 一种基于双图正则化约束和字典学习的图像自动标注方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112487231B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113260044A (zh) * | 2021-04-12 | 2021-08-13 | 北京邮电大学 | 基于双层字典学习的csi指纹定位方法、装置及设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102088606A (zh) * | 2011-02-28 | 2011-06-08 | 西安电子科技大学 | 基于稀疏表示的去块效应方法 |
CN102122386A (zh) * | 2011-03-01 | 2011-07-13 | 西安电子科技大学 | 基于字典迁移聚类的sar图像分割方法 |
CN102129573A (zh) * | 2011-03-10 | 2011-07-20 | 西安电子科技大学 | 基于字典学习和稀疏表示的sar图像分割方法 |
CN104281845A (zh) * | 2014-10-29 | 2015-01-14 | 中国科学院自动化研究所 | 基于旋转不变字典学习模型的人脸识别方法 |
CN104966105A (zh) * | 2015-07-13 | 2015-10-07 | 苏州大学 | 一种鲁棒机器错误检索方法与系统 |
CN106557782A (zh) * | 2016-11-22 | 2017-04-05 | 青岛理工大学 | 基于类字典的高光谱图像分类方法及装置 |
CN108564107A (zh) * | 2018-03-21 | 2018-09-21 | 温州大学苍南研究院 | 基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法 |
CN108985177A (zh) * | 2018-06-21 | 2018-12-11 | 南京师范大学 | 一种结合稀疏约束的快速低秩字典学习的人脸图像分类方法 |
CN110414616A (zh) * | 2019-08-02 | 2019-11-05 | 南京大学 | 一种利用空间关系的遥感图像字典学习分类方法 |
CN111667453A (zh) * | 2020-04-21 | 2020-09-15 | 浙江工业大学 | 一种基于局部特征和类标嵌入约束字典学习的胃肠镜图像异常检测方法 |
-
2020
- 2020-12-17 CN CN202011493799.4A patent/CN112487231B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102088606A (zh) * | 2011-02-28 | 2011-06-08 | 西安电子科技大学 | 基于稀疏表示的去块效应方法 |
CN102122386A (zh) * | 2011-03-01 | 2011-07-13 | 西安电子科技大学 | 基于字典迁移聚类的sar图像分割方法 |
CN102129573A (zh) * | 2011-03-10 | 2011-07-20 | 西安电子科技大学 | 基于字典学习和稀疏表示的sar图像分割方法 |
CN104281845A (zh) * | 2014-10-29 | 2015-01-14 | 中国科学院自动化研究所 | 基于旋转不变字典学习模型的人脸识别方法 |
CN104966105A (zh) * | 2015-07-13 | 2015-10-07 | 苏州大学 | 一种鲁棒机器错误检索方法与系统 |
CN106557782A (zh) * | 2016-11-22 | 2017-04-05 | 青岛理工大学 | 基于类字典的高光谱图像分类方法及装置 |
CN108564107A (zh) * | 2018-03-21 | 2018-09-21 | 温州大学苍南研究院 | 基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法 |
CN108985177A (zh) * | 2018-06-21 | 2018-12-11 | 南京师范大学 | 一种结合稀疏约束的快速低秩字典学习的人脸图像分类方法 |
CN110414616A (zh) * | 2019-08-02 | 2019-11-05 | 南京大学 | 一种利用空间关系的遥感图像字典学习分类方法 |
CN111667453A (zh) * | 2020-04-21 | 2020-09-15 | 浙江工业大学 | 一种基于局部特征和类标嵌入约束字典学习的胃肠镜图像异常检测方法 |
Non-Patent Citations (2)
Title |
---|
臧淼: ""图像自动标注关键技术研究"", 《中国博士学位论文全文数据库 信息科技辑》 * |
邓建国 等: ""监督学习中的损失函数及应用研究"", 《大数据》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113260044A (zh) * | 2021-04-12 | 2021-08-13 | 北京邮电大学 | 基于双层字典学习的csi指纹定位方法、装置及设备 |
CN113260044B (zh) * | 2021-04-12 | 2022-04-05 | 北京邮电大学 | 基于双层字典学习的csi指纹定位方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112487231B (zh) | 2021-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110209823B (zh) | 一种多标签文本分类方法及系统 | |
CN110309331B (zh) | 一种基于自监督的跨模态深度哈希检索方法 | |
CN110969020B (zh) | 基于cnn和注意力机制的中文命名实体识别方法、系统及介质 | |
CN110196980B (zh) | 一种基于卷积网络在中文分词任务上的领域迁移 | |
CN108304911A (zh) | 基于记忆神经网络的知识抽取方法以及系统和设备 | |
CN110222218B (zh) | 基于多尺度NetVLAD和深度哈希的图像检索方法 | |
CN109284411B (zh) | 一种基于有监督超图离散化图像二值编码方法 | |
CN110457514A (zh) | 一种基于深度哈希的多标签图像检索方法 | |
Pan et al. | Product quantization with dual codebooks for approximate nearest neighbor search | |
CN112861976B (zh) | 一种基于孪生图卷积哈希网络的敏感图像识别方法 | |
CN114911958B (zh) | 一种基于语义偏好的快速图像检索方法 | |
CN114358188A (zh) | 特征提取模型处理、样本检索方法、装置和计算机设备 | |
Wei et al. | Compact MQDF classifiers using sparse coding for handwritten Chinese character recognition | |
CN112163114B (zh) | 一种基于特征融合的图像检索方法 | |
CN110689049A (zh) | 基于黎曼核字典学习算法的视觉分类方法 | |
CN113821635A (zh) | 一种用于金融领域的文本摘要的生成方法及系统 | |
CN113806580A (zh) | 基于层次语义结构的跨模态哈希检索方法 | |
CN114281982B (zh) | 一种多模态融合技术的图书宣传摘要生成方法和系统 | |
CN115795065A (zh) | 基于带权哈希码的多媒体数据跨模态检索方法及系统 | |
Zou et al. | Transductive zero-shot hashing for multilabel image retrieval | |
Guo et al. | Improved image clustering with deep semantic embedding | |
Liu et al. | Online optimized product quantization | |
CN112487231B (zh) | 一种基于双图正则化约束和字典学习的图像自动标注方法 | |
Rastegari et al. | Computationally bounded retrieval | |
CN111666375A (zh) | 文本相似度的匹配方法、电子设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |