CN103065157A - 一种基于激活扩散理论的图像标注方法 - Google Patents
一种基于激活扩散理论的图像标注方法 Download PDFInfo
- Publication number
- CN103065157A CN103065157A CN2012105663280A CN201210566328A CN103065157A CN 103065157 A CN103065157 A CN 103065157A CN 2012105663280 A CN2012105663280 A CN 2012105663280A CN 201210566328 A CN201210566328 A CN 201210566328A CN 103065157 A CN103065157 A CN 103065157A
- Authority
- CN
- China
- Prior art keywords
- label
- candidate image
- image
- image label
- sigma
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于激活扩散理论的图像标注方法,首先,将图像标签看作语义网络的节点,利用渐进相关性模型得到多个图像标签间的联合概率,产生候选图像标签;然后,通过激活扩散理论计算每个候选图像标签的相关值,细化每个候选图像标签的有效传播性,每个候选图像标签都被赋予一个相应的数值,该数值的大小取决于此候选图像标签与其它候选图像标签间的关系,每幅图像的最终标签就是相关值最高的那些候选图像标签。
Description
技术领域
本发明涉及计算机技术领域的图像标注方法,具体是一种基于激活扩散理论的图像标注方法。
背景技术
随着越来越多的数字图像出现在网络、个人电脑和数字设备上,要求基于图像内容分析技术能够有效地组织、管理和利用如此海量信息的愿望也越来越强烈。其中,图片标注的研究是实现基于内容的图像索引,检索及其它相关应用的最重要和最关键的一步,其目的是要在感性层面的视觉信息和语义层面的语言描述间建立一种精确的对应关系。
从模式识别的角度来看,图像标注问题可以看作模式分类问题,利用机器学习技术和概率建模方法完成,例如翻译模型,连续相关性模型,贝叶斯点机,多实例学习,概率模型,概率协作多标签模型,视觉内容模型等。由于众所周知的语义鸿沟问题,用这些方法进行注释都不能达到令人满意的结果。为减少不精确和不完整语义注释,学者们做出了很多努力来完成标签细化的问题。
经对现有技术文献的检索发现,Jin等人通过基于定义的近义词来估计标签间语义相关性的方法,可在保留那些具有较高相关度标签的同时,过滤掉那些相关度较低的标签。然而这种方法并未考虑视觉信息对标签细化的影响,因此它的成功只是片面的或有限的。为利用视觉信息提高标注质量,Wang等人提出了基于内容标注的细化方案,该方法主要通过视觉信息和文字信息来提高标注性能。Xu等人利用统计标注和视觉图像间的相互关系,提出一个规范、潜在的狄利克雷分布模型。近日,Liu等人提出通过视觉相似性和语义相似性的结合,以达到改善注释质量的目的。Zhu等人通过将用户提供的标签矩阵分解成一个低秩细化矩阵和一个稀疏误差矩阵,来重新排列图像标签。由于在图像内容的底层特征刻画和语义概念描述间存在着很大的差异,使得现有自动图像标注算法性能不甚理想。
发明内容
本发明针对现有技术的问题和不足,提出一种基于激活扩散理论的图像标注方法,采用以下技术方案:
一种基于激活扩散理论的图像标注方法,其特征是:首先,利用渐进相关性模型得到多个标签间的联合概率,产生候选标签;然后,通过激活扩散过程计算每个候选标签的相关值,细化每个候选标签的有效传播性。每幅图像的最终标签就是相关值最高的那些标签。
包括如下具体步骤:
(1)输入未标注的图像集;
(2)确定候选图像标签
确定候选图像标签过程是一个将合适标签分配给未标注图像的过程,在这个过程中要同时考虑视觉信息和标签信息的影响,假设Q为一幅测试图像,S为训练集T中的一幅图像且S的标签集为:
As=(a1,a2,...,am) (1)
其中,m是标签个数;
通过如下过程计算测试图像Q的标签集的联合分布概率AQ:
第一步:从训练集T中选取图像S的均匀概率为:
其中,|T|表示训练集的大小;
第二步:把S选为测试图像Q的概率P(Q|S)为:
其中,Qr和Sr分别表示测试图像Q和训练图像S的第r维特征,σr是一表示第r维特征尺度的正参数,半径参数σr取为图像间对应块间第r维特征的L1距离的中值,d是特征空间维数;
第三步:利用伯努利模型,计算为Q抽取标签为wi的概率:
其中,μ表示平滑参数,当wi包含于As时,βwi,s=1,当wi不在As中时,βwi,s=0,N(wi)表示wi出现在训练集中的频率;
第四步:最有可能获选的候选图像标签w1的推导公式为:
第五步:通过渐进方式推导出其它的候选图像标签:
(3)优化候选图像标签
为充分利用候选图像标签的原始信息及更好反映候选图像标签与图像间的相关性,利用激活扩散算法对候选图像标签进行优化:
节点x和邻近节点y的激活传播过程可表述为:
Iy(t+1)=Ox(t)*Λxy*(1-δ) (7)
其中Iy(t+1)表示t+1时刻由x扩散给节点y的值,Ox(t)表示节点x在t时刻的扩散值,Λxy表示节点x和y间的联系,δ是一衰减因子,用来描述激活扩散过程中的能量损失;
利用简化的激活扩散法计算节点间的相关值,在t+1时刻,节点y的扩散值等于该时刻它的输入值,即Oy(t+1)=Iy(t+1),因此,整个激活扩散传播过程可用下式表示:
O=[Γ-(1-δ)ΛT]-1I (8)
其中是一个n×n的单位矩阵,δ是衰减因子,Λ是一个相关性矩阵,其中的元素Λij表示候选图像标签wi和wj之间的联系,I=[I1,I2,.......,In]T为输入语义网络的候选图像标签的初始值,O=[O1,O2,....,On]T为最终的扩散向量,其元素Oi表示候选图像标签wi经过激活扩散过程后的值;
向量I=[I1,I2,.......,In]T为激活扩散过程的输入,Ii的计算公式如下:
其中num(wi)表示候选图像标签为wi的图像数目;
相关性矩阵Λ的生成过程:首先,从训练集中提取出来候选图像标签为wi和wj间的语义关系γij;其次,矩阵Λ中的元素Λij是γij在训练集中出现的频率:
其中num(wi,wj)表示同时包含候选图像标签wi和wj的图像个数。该公式表示:两个候选图像标签在训练集中共存的频率越高,以及另一单个标签出现在训练集中的频率越低,则这两个标签的相关性越高。最后标准化Λ:
以基于激活扩散理论为基础的优化公式(8),将每个候选图像标签被优化的相关值计算出来。相关值越高,则表示其相关性越强;
(4)最终扩散向量O中值越大的项所对应的候选图像标签就是测试图像的最终标签。
本发明与现有技术相比的显著效果在于:激活扩散算法可以在语义层面更好地描述和反映所有标签之间的相关性,可以改善信息检索的性能。
附图说明
图1为本发明图像标注方法的流程图。
具体实施方式
以下结合附图1和实施例对本发明的技术方案作进一步详细说明,但本发明的保护范围应不限于下述的实施例。
1输入未标注的图像集。
2确定候选标签。
确定候选图像标签过程是一个将合适标签分配给未标注图像的过程,在这个过程中要同时考虑视觉信息和标签信息的影响,假设Q为一幅测试图像,S为训练集T中的一幅图像且S的标签集为:
As=(a1,a2,...,am) (1)
其中,m是标签个数;
通过如下过程计算测试图像Q的标签集的联合分布概率AQ:
第一步:从训练集T中选取图像S的均匀概率为:
其中,|T|表示训练集的大小;
第二步:把S选为测试图像Q的概率P(Q|S)为:
其中,Qr和Sr分别表示测试图像Q和训练图像S的第r维特征,σr是一表示第r维特征尺度的正参数,半径参数σr取为图像间对应块间第r维特征的L1距离的中值,d是特征空间维数;
第三步:利用伯努利模型,计算为Q抽取标签为wi的概率:
其中,μ表示平滑参数,当wi包含于As时,βwi,s=1,当wi不在As中时,βwi,s=0,N(wi)表示wi出现在训练集中的频率;
第四步:最有可能获选的候选图像标签w1的推导公式为:
第五步:通过渐进方式推导出其它的候选图像标签:
3优化候选标签。
为充分利用候选图像标签的原始信息及更好反映候选图像标签与图像间的相关性,利用激活扩散算法对候选图像标签进行优化:
节点x和邻近节点y的激活传播过程可表述为:
Iy(t+1)=Ox(t)*Λxy*(1-δ) (7)
其中Iy(t+1)表示t+1时刻由x扩散给节点y的值,Ox(t)表示节点x在t时刻的扩散值,Λxy表示节点x和y间的联系,δ是一衰减因子,用来描述激活扩散过程中的能量损失;
利用简化的激活扩散法计算节点间的相关值,在t+1时刻,节点y的扩散值等于该时刻它的输入值,即Oy(t+1)=Iy(t+1),因此,整个激活扩散传播过程可用下式表示:
O=[Γ-(1-δ)ΛT]-1I (8)
其中是一个n×n的单位矩阵,δ是衰减因子,Λ是一个相关性矩阵,其中的元素Λij表示候选图像标签wi和wj之间的联系,I=[I1,I2,.......,In]T为输入语义网络的候选图像标签的初始值,O=[O1,O2,....,On]T为最终的扩散向量,其元素Oi表示候选图像标签wi经过激活扩散过程后的值;
向量I=[I1,I2,.......,In]T为激活扩散过程的输入,Ii的计算公式如下:
其中num(wi)表示候选图像标签为wi的图像数目;
相关性矩阵Λ的生成过程:首先,从训练集中提取出来候选图像标签为wi和wj间的语义关系γij;其次,矩阵Λ中的元素Λij是γij在训练集中出现的频率:
其中num(wi,wj)表示同时包含候选图像标签wi和wj的图像个数。该公式表示:两个候选图像标签在训练集中共存的频率越高,以及另一单个标签出现在训练集中的频率越低,则这两个标签的相关性越高。最后标准化Λ:
以基于激活扩散理论为基础的优化公式(8),将每个候选图像标签被优化的相关值计算出来。相关值越高,则表示其相关性越强;
4最终扩散向量O中值越大的项所对应的标签就是测试图像的最终标签。
Claims (1)
1.一种基于激活扩散理论的图像标注方法,其特征是:首先,将图像标签看作语义网络的节点,利用渐进相关性模型得到多个图像标签间的联合概率,产生候选图像标签;然后,通过激活扩散理论计算每个候选图像标签的相关值,细化每个候选图像标签的有效传播性,每个候选图像标签都被赋予一个相应的数值,该数值的大小取决于此候选图像标签与其它候选图像标签间的关系,每幅图像的最终标签就是相关值最高的那些候选图像标签;
包括如下具体步骤:
(1)输入未标注的图像集;
(2)确定候选图像标签
确定候选图像标签过程是一个将合适标签分配给未标注图像的过程,在这个过程中要同时考虑视觉信息和标签信息的影响,假设Q为一幅测试图像,S为训练集T中的一幅图像且S的标签集为:
As=(a1,a2,...,am) (1)
其中,m是标签个数;
通过如下过程计算测试图像Q的标签集的联合分布概率AQ:
第一步:从训练集T中选取图像S的均匀概率为:
其中,|T|表示训练集的大小;
第二步:把S选为测试图像Q的概率P(Q|S)为:
其中,Qr和Sr分别表示测试图像Q和训练图像S的第r维特征,σr是一表示第r维特征尺度的正参数,半径参数σr取为图像间对应块间第r维特征的L1距离的中值,d是特征空间维数;
第三步:利用伯努利模型,计算为Q抽取标签为wi的概率:
其中,μ表示平滑参数,当wi包含于As时,βwi,s=1,当wi不在As中时,βwi,s=0,N(wi)表示wi出现在训练集中的频率;
第四步:最有可能获选的候选图像标签w1的推导公式为:
第五步:通过渐进方式推导出其它的候选图像标签:
(3)优化候选图像标签
为充分利用候选图像标签的原始信息及更好反映候选图像标签与图像间的相关性,利用激活扩散算法对候选图像标签进行优化:
节点x和邻近节点y的激活传播过程可表述为:
Iy(t+1)=Ox(t)*Λxy*(1-δ) (7)
其中Iy(t+1)表示t+1时刻由x扩散给节点y的值,Ox(t)表示节点x在t时刻的扩散值,Λxy表示节点x和y间的联系,δ是一衰减因子,用来描述激活扩散过程中的能量损失;
利用简化的激活扩散法计算节点间的相关值,在升1时刻,节点y的扩散值等于该时刻它的输入值,即Oy(t+1)=Iy(t+1),因此,整个激活扩散传播过程可用下式表示:
O=[Γ-(1-δ)ΛT]-1I (8)
其中是一个n×n的单位矩阵,δ是衰减因子,Λ是一个相关性矩阵,其中的元素Λij表示候选图像标签wi和wj之间的联系,I=[I1,I2,.......,In]T为输入语义网络的候选图像标签的初始值,O=[O1,O2,....,On]T为最终的扩散向量,其元素Oi表示候选图像标签wi经过激活扩散过程后的值;
向量I=[I1,I2,.......,In]T为激活扩散过程的输入,Ii的计算公式如下:
其中num(wi)表示候选图像标签为wi的图像数目;
相关性矩阵Λ的生成过程:首先,从训练集中提取出来候选图像标签为wi和wj间的语义关系γij;其次,矩阵Λ中的元素Λij是γij在训练集中出现的频率:
其中num(wi,wj)表示同时包含候选图像标签wi和wj的图像个数。该公式表示:两个候选图像标签在训练集中共存的频率越高,以及另一单个标签出现在训练集中的频率越低,则这两个标签的相关性越高。最后标准化Λ:
以基于激活扩散理论为基础的优化公式(8),将每个候选图像标签被优化的相关值计算出来。相关值越高,则表示其相关性越强;
(4)最终扩散向量O中值越大的项所对应的候选图像标签就是测试图像的最终标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012105663280A CN103065157A (zh) | 2012-12-24 | 2012-12-24 | 一种基于激活扩散理论的图像标注方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012105663280A CN103065157A (zh) | 2012-12-24 | 2012-12-24 | 一种基于激活扩散理论的图像标注方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103065157A true CN103065157A (zh) | 2013-04-24 |
Family
ID=48107780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012105663280A Pending CN103065157A (zh) | 2012-12-24 | 2012-12-24 | 一种基于激活扩散理论的图像标注方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103065157A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933442A (zh) * | 2015-06-16 | 2015-09-23 | 陕西师范大学 | 一种基于最小代价路径进行图像标签传播的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101315663A (zh) * | 2008-06-25 | 2008-12-03 | 中国人民解放军国防科学技术大学 | 一种基于区域潜在语义特征的自然场景图像分类方法 |
CN101685464A (zh) * | 2009-06-18 | 2010-03-31 | 浙江大学 | 基于社群潜在主题挖掘的自动图像标注的方法 |
CN102750385A (zh) * | 2012-06-29 | 2012-10-24 | 南京邮电大学 | 基于标签检索的相关性—质量排序图像检索方法 |
-
2012
- 2012-12-24 CN CN2012105663280A patent/CN103065157A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101315663A (zh) * | 2008-06-25 | 2008-12-03 | 中国人民解放军国防科学技术大学 | 一种基于区域潜在语义特征的自然场景图像分类方法 |
CN101685464A (zh) * | 2009-06-18 | 2010-03-31 | 浙江大学 | 基于社群潜在主题挖掘的自动图像标注的方法 |
CN102750385A (zh) * | 2012-06-29 | 2012-10-24 | 南京邮电大学 | 基于标签检索的相关性—质量排序图像检索方法 |
Non-Patent Citations (1)
Title |
---|
朱松豪 等: "基于激活扩散理论的图像标注", 《第24届中国控制与决策会议论文集》, 23 May 2012 (2012-05-23), pages 3450 - 3454 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933442A (zh) * | 2015-06-16 | 2015-09-23 | 陕西师范大学 | 一种基于最小代价路径进行图像标签传播的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108573411B (zh) | 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法 | |
Zou et al. | Retrieving similar cases for construction project risk management using Natural Language Processing techniques | |
CN110633409B (zh) | 一种融合规则与深度学习的汽车新闻事件抽取方法 | |
CN102902821B (zh) | 基于网络热点话题的图像高级语义标注、检索方法及装置 | |
CN107705066A (zh) | 一种商品入库时信息录入方法及电子设备 | |
CN106951498A (zh) | 文本聚类方法 | |
CN103886067B (zh) | 使用标签隐含主题进行图书推荐的方法 | |
CN104346440A (zh) | 一种基于神经网络的跨媒体哈希索引方法 | |
CN101127042A (zh) | 一种基于语言模型的情感分类方法 | |
CN106776711A (zh) | 一种基于深度学习的中文医学知识图谱构建方法 | |
CN105205096A (zh) | 一种跨文本模态和图像模态的数据检索方法 | |
CN109871452B (zh) | 确定犯罪特征的方法、装置以及存储介质 | |
CN105844424A (zh) | 基于网络评论的产品质量问题发现及风险评估方法 | |
CN103425687A (zh) | 一种基于关键词的检索方法和系统 | |
CN102004774A (zh) | 基于统一概率模型的个性化用户标签建模与推荐方法 | |
CN102968408A (zh) | 识别用户评论的实体特征方法 | |
Chang et al. | Product concept evaluation and selection using data mining and domain ontology in a crowdsourcing environment | |
CN103226554A (zh) | 基于新闻数据的股票自动匹配分类方法和系统 | |
CN103077157B (zh) | 一种文本集合相似性的可视化方法和装置 | |
CN110428295A (zh) | 商品推荐方法和系统 | |
Yu et al. | A simple and efficient text matching model based on deep interaction | |
CN102262653A (zh) | 一种基于用户动机倾向性的标签推荐方法及系统 | |
CN105787662A (zh) | 基于属性的移动应用软件性能预测方法 | |
CN112182145A (zh) | 文本相似度确定方法、装置、设备和存储介质 | |
CN101763395A (zh) | 采用人工智能技术自动生成网页的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130424 |