CN105260741B - 一种基于高阶图结构p‑Laplacian稀疏编码的数字图像标记方法 - Google Patents
一种基于高阶图结构p‑Laplacian稀疏编码的数字图像标记方法 Download PDFInfo
- Publication number
- CN105260741B CN105260741B CN201510632014.XA CN201510632014A CN105260741B CN 105260741 B CN105260741 B CN 105260741B CN 201510632014 A CN201510632014 A CN 201510632014A CN 105260741 B CN105260741 B CN 105260741B
- Authority
- CN
- China
- Prior art keywords
- image
- laplacian
- sample point
- calculate
- sparse coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明所述的一种基于p‑Laplacian稀疏编码的数字图像标记方法,包括如下步骤:(1)提取图像特征,包括已标记图像、未标记图像、用户输入图像;(2)计算图像库(包括已标记图像和未标记图像)中图像样本的高阶图结构p‑Laplacian信息;(3)基于p‑Laplacian计算图像的稀疏编码;(4)基于图像的稀疏编码学习得到预测模型;(5)基于预测模型对未标记图像及用户输入图像进行标记;(6)结束。本发明中对于图像的表示主要侧重于图像特征的表示,涉及图像样本分布高阶图结构信息,更精确的表示图像样本的内在联系,更加有效的进行图像标记。
Description
技术领域
本发明设计一种数字图像标记方法,特别涉及一种基于高阶图结构信息p-Laplacian的数字图像标记方法。
背景技术
随着计算机的数据处理能力的不断提高以及便携智能设备(例如智能手机数码相机)的普及,大数据量的数字图像的获取也变得越来越容易。数字图像标记技术便是利用已有标记图像信息对图像数据库中未标记图像进行标记。一种有效的图像标记策略是将图像标记过程看作一个学习过程,利用已有训练图像作为学习所需的样本,使用机器学习技术学习得到图像的表示方法,进而获得一个预测模型实现对未标记图像的标记。
目前的图像标记技术中对于图像的表示主要侧重于图像的特征提取,或者只涉及图像样本分布低阶图结构信息。由于目前图像标记技术中图像表示方法没有考虑到图像样本分布高阶图结构信息,因此无法更精确的表示图像样本的内在联系,不利于有效的进行图像标记。
发明内容
针对上述问题,本发明提供了一种一种基于高阶图结构p-Laplacian稀疏编码的数字图像标记方法,所采用的技术方案为:
(1)通过图像标记装置对用户输入的新图像进行标记后,生成图像特征;
(2)结合图像特征计算数字图像库中图像样本的高阶结构信息p-Laplacian进行字典学习;
(3)根据得到的字典计算图像的稀疏编码作为图像表示;
(4)对得到图像稀疏编码使用预设的分类方法进行训练得到所需的预测模型;
(5)根据训练得到的预测模型对数字图像中待标记的数字图像和用户新输入的图像进行标记;
(6)结束。
特别的,所述图像标记装置包括数字图像存储设备、已标记图像库和用户图像输入设备。
优选的,所述待标记数字图像存储于数字图像存储设备内。
优选的,所述已标记图像库中的每个数字图像均对应了一组人工标注的概念标记。
下面具体说明本发明的技术方案:
数字图像存储设备中存放了待标记的数字图像,此外还存在一个已标记的数字图像库,该图像库中包含一些已经标记好的数字图像,每个数字图像均对应了一组人工标注的概念标记,用户亦可以增加图像库中不存在的未标记数字图像。可以使用数字图像处理的经典方法生成适当的图像特征,由此每幅图像可由一个特征向量进行表示,比如SIFT特征等。得到图像的特征表示后,使用预设的分类方法支持向量机训练得到相应的预测模型支持向量模型,基于预测模型对图像存储设备中的待标记图像和用户输入的新图像进行标记。
对用户输入的新图像进行标记后,生成图像特征,然后结合图像库中图像样本的高阶图结构信息p-Laplacian进行字典学习。
结合图像库中图像样本的高阶图结构信息p-Laplacian进行字典学习时,假设X代表图像特征矩阵,D代表学习字典,W代表图像稀疏编码,ΔpW代表图像样本高阶图结构p-Laplacian信息:
a.先初始化操作,设定用来平衡目标函数中的后面两项的比重的γ1,γ2,设定字典元素数目并生成D。
b.固定字典D,通过求解问题
计算图像对应的稀疏编码W。
c.固定稀疏编码W,通过求解问题计算特征字典D。
d.判断是否满足收敛条件,若不满足收敛条件,返回到步骤b继续计算W,若满足收敛条件,则结束。
步骤b至d构成了一个循环体,在循环体内部迭代交替计算特征字典D和稀疏编码W。在上述循环过程结束后,获得了基于图像库的特征字典D,同时也获得了图像库中图像的稀疏编码W。
计算样本的高阶图结构p-Laplacian信息ΔpW的方法如下:
A.起始状态,假设图像库中图像构成的图结构为Gω=(V,E),其中V代表N个图像样本点的组成集合,E代表图像样本点连接的边集合,ω代表样本点邻接关系的权重计算函数,图像样本点与其标记概念间存在函数关系f:V→R。
B.计算样本点的邻接关系权重ω,ω有不同的具体计算形式,这里采用基于Gaussian RBF核函数的任意样本点u和ν的临界关系权重为式中a是参数,控制整个结果不要过大或者过小的,exp(.)是一个指数函数,就是以e为底的指数为括号里的数的函数,χu、χυ分别代表u样本点和v样本点的属性值。
C.计算样本点ν的加权梯度
其中,u~ν表示样本点u是点ν的邻接点,▽υf是加权梯度。
D.计算样本点ν的p-Laplacian信息(Δpf)v=∑u~vruv(fv-fu),
其中
E.ν=ν+1。迭代算法,计算完了第v个点就要计算第v+1个点。
F.比较ν与N,若ν<N则返回步骤C继续计算样本点ν的加权梯度;若ν>N则结束。
步骤C到E是一个循环体,在循环体内部计算每一个样本点p-Laplacian信息。
基于学习的特征字典计算图像的稀疏编码的方法:
第一步:起始状态。假设χ是待标记图像的输入图像特征,ω是其对应的稀疏编码;
第二步:根据学习的特征字典设定D和γ3;
第三步:通过求解问题计算输入图像的稀疏编码,式中F代表的是双数线内部的范数为F范数。
第四步:结束状态。
本发明中对于图像的表示主要侧重于图像特征的表示,涉及图像样本分布高阶图结构信息,p-Laplaican能够描述图像样本分布的高阶结构关系,更精确的表示图像样本的内在联系,能够获得更具有代表意义的图像编码,更准确的表达图像内容和相互联系,提高编码的有效性和可分类性,从而更加有效的进行图像标记。
附图说明
图1所示为图像标记装置的工作流程图
图2所示为本发明方法的流程图
图3所示为本发明所采用的图像样本高阶图结构p-Laplacian信息计算流程图
图4所示为本发明所采用的基于p-Laplacian的图像稀疏编码计算流程图
图5所示为本发明计算样本的高阶图结构p-Laplacian信息ΔpW的流程图
具体实施方式
如图1所示,数字图像存储设备中存放了待标记的数字图像,此外还存在一个已标记的数字图像库,该图像库中包含一些已经标记好的数字图像,每个数字图像均对应了一组人工标注的概念标记,用户亦可以增加图像库中不存在的未标记数字图像。可以使用数字图像处理的经典方法,生成适当的图像特征,比如SIFT特征等,由此每幅图像可由一个特征向量进行表示。得到图像的特征表示后,使用预设的分类方法,训练得到相应的预测模型,基于预测模型对图像存储设备中的待标记图像和用户输入的新图像进行标记。
本发明涉及的方法如图2所示。步骤10是起始动作。步骤11生成图像特征,比如SIFT特征等。
接下来步骤12结合图像特征计算数字图像库中图像样本的高阶结构信息p-Laplacian进行字典学习,其详细说明如图3所示。
图3给出了图2中步骤12的详细描述,具体说明了如何结合图像库中图像样本高阶结构信息p-Laplacian学习字典。步骤1200是起始状态。假设X代表图像特征矩阵,D代表学习字典,W代表图像稀疏编码,ΔpW代表图像样本高阶图结构p-Laplacian信息。步骤1201是初始化操作,设定γ1,γ2,设定字典元素数目并生成D。
步骤1202固定字典D,通过求解问题
计算图像对应的稀疏编码W。
步骤1203固定稀疏编码W,通过求解问题:
计算特征字典D。
步骤1204判断是否满足收敛条件,若不满足收敛条件,返回到步骤1202继续计算W,若满足收敛条件,则达到结束状态1205。
步骤1202至1204构成了一个循环体,在循环体内部迭代交替计算特征字典D和稀疏编码W。在上述循环过程结束后,获得了基于图像库的特征字典D,同时也获得了图像库中图像的稀疏编码W。
步骤12中计算样本的高阶图结构p-Laplacian信息ΔpW的方法如下:
A.起始状态,假设图像库中图像构成的图结构为Gω=(V,E),其中V代表N个图像样本点的组成集合,E代表图像样本点连接的边集合,ω代表样本点邻接关系的权重计算函数,图像样本点与其标记概念间存在函数关系f:V→R。
B.计算样本点的邻接关系权重ω,ω有不同的具体计算形式,例如基于GaussianRBF核函数的任意样本点u和ν的临界关系权重为等。
C.计算样本点ν的加权梯度
其中,u~ν表示样本点u是点ν的邻接点。
D.计算样本点ν的p-Laplacian信息(Δpf)v=∑u~vruv(fv-fu),其中
E.ν=ν+1
F.比较ν与N,若ν<N则返回步骤C继续计算样本点ν的加权梯度;若ν>N则结束。
步骤C到E是一个循环体,在循环体内部计算每一个样本点p-Laplacian信息。
步骤13根据得到的字典计算图像的稀疏编码作为图像表示,其详细说明如图4所示。
图4给出了图2中步骤13基于学习的特征字典计算图像的稀疏编码的详细方法:
第一步:起始状态。假设χ是待标记图像的输入图像特征,ω是其对应的稀疏编码;
第二步:根据学习的特征字典设定D和γ3;
第三步:通过求解问题计算输入图像的稀疏编码;
第四步:结束状态。
步骤14对得到图像稀疏编码使用预设的分类方法,比如支持向量机算法,进行训练得到所需的预测模型。
步骤15利用训练得到的预测模型对数字图像中待标记的图像和用户新输入的图像进行标记。
具体地说,图像标记装置提取待标记图像的图像特征,用与步骤13类似的方法计算待标记图像的稀疏编码,然后将稀疏编码提交给训练所得的模型进行预测,在得到图像的标记后,标记装置进入步骤16所示的结束状态。
熟知本领域的人士将理解,虽然这里为了便于解释已描述了具体实施例,但是可在背离本发明精神和范围内的情况下做出各种改变。因此,除了所附权利要求之外不能用于限制本发明。
Claims (1)
1.一种基于p-Laplacian稀疏编码的数字图像标记方法,包括如下步骤:
(1)通过图像标记装置对用户输入的新图像进行标记后,生成图像特征;
(2)结合图像特征计算数字图像库中图像样本的高阶结构信息p-Laplacian进行字典学习,假设X代表图像特征矩阵,D代表学习字典,W代表图像稀疏编码,ΔpW代表图像样本高阶图结构p-Laplacian信息:
a.先初始化操作,设定用来平衡目标函数中的后面两项的比重的γ1,γ2,设定字典元素数目并生成D;
b.固定字典D,通过求解问题
计算图像对应的稀疏编码W;
c.固定稀疏编码W,通过求解问题计算特征字典D;
d.判断是否满足收敛条件,若不满足收敛条件,返回到步骤b继续计算W,若满足收敛条件,则结束;
步骤b至d构成了一个循环体,在循环体内部迭代交替计算特征字典D和稀疏编码W,在上述循环过程结束后,获得了基于图像库的特征字典D,同时也获得了图像库中图像的稀疏编码W;
e.计算样本的高阶图结构p-Laplacian信息ΔpW的方法如下:
A.起始状态,假设图像库中图像构成的图结构为Gω=(V,E),其中V代表N个图像样本点的组成集合,E代表图像样本点连接的边集合,ω代表样本点邻接关系的权重计算函数,图像样本点与其标记概念间存在函数关系f:V→R;
B.计算样本点的邻接关系权重ω,ω有不同的具体计算形式,这里采用基于GaussianRBF核函数的任意样本点u和ν的临界关系权重为式中a是参数,控制整个结果不要过大或者过小的,exp(.)是一个指数函数,就是以e为底的指数为括号里的数的函数,χu、χυ分别代表u样本点和v样本点的属性值;
C.计算样本点ν的加权梯度
其中,u~ν表示样本点u是点ν的邻接点,是加权梯度;
D.计算样本点ν的p-Laplacian信息(Δpf)v=∑u~vruv(fv-fu),
其中
E.ν=ν+1,迭代算法,计算完了第v个点就要计算第v+1个点;
F.比较ν与N,若ν<N则返回步骤C继续计算样本点ν的加权梯度;若ν>N则结束;
步骤C到E是一个循环体,在循环体内部计算每一个样本点p-Laplacian信息;
(3)根据得到的字典计算图像的稀疏编码作为图像表示;
(4)对得到图像稀疏编码使用预设的分类方法进行训练得到所需的预测模型;
(5)根据训练得到的预测模型对数字图像中待标记的数字图像和用户新输入的图像进行标记;
(6)结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510632014.XA CN105260741B (zh) | 2015-09-29 | 2015-09-29 | 一种基于高阶图结构p‑Laplacian稀疏编码的数字图像标记方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510632014.XA CN105260741B (zh) | 2015-09-29 | 2015-09-29 | 一种基于高阶图结构p‑Laplacian稀疏编码的数字图像标记方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105260741A CN105260741A (zh) | 2016-01-20 |
CN105260741B true CN105260741B (zh) | 2017-03-08 |
Family
ID=55100422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510632014.XA Active CN105260741B (zh) | 2015-09-29 | 2015-09-29 | 一种基于高阶图结构p‑Laplacian稀疏编码的数字图像标记方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105260741B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718914A (zh) * | 2016-01-27 | 2016-06-29 | 中国石油大学(华东) | 一种人脸编码及识别方法 |
CN106875417B (zh) * | 2017-01-10 | 2019-10-08 | 南京邮电大学 | 一种基于高阶图跨时域关联的多目标跟踪方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116762A (zh) * | 2013-03-20 | 2013-05-22 | 南京大学 | 一种基于自调制字典学习的图像分类方法 |
CN104866855A (zh) * | 2015-05-07 | 2015-08-26 | 华为技术有限公司 | 一种图像特征提取方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015125662A (ja) * | 2013-12-27 | 2015-07-06 | 株式会社リコー | 物体識別プログラム及び装置 |
-
2015
- 2015-09-29 CN CN201510632014.XA patent/CN105260741B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116762A (zh) * | 2013-03-20 | 2013-05-22 | 南京大学 | 一种基于自调制字典学习的图像分类方法 |
CN104866855A (zh) * | 2015-05-07 | 2015-08-26 | 华为技术有限公司 | 一种图像特征提取方法及装置 |
Non-Patent Citations (1)
Title |
---|
基于多分离部件稀疏编码的人脸图像分析;刘伟锋 等;《模式识别与人工智能》;20131130;第26卷(第11期);第1073-1078页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105260741A (zh) | 2016-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109711481A (zh) | 用于画作多标签识别的神经网络、相关方法、介质和设备 | |
CN110287312A (zh) | 文本相似度的计算方法、装置、计算机设备及计算机存储介质 | |
CN107066583A (zh) | 一种基于紧凑双线性融合的图文跨模态情感分类方法 | |
CN110688449A (zh) | 基于深度学习的地址文本处理方法、装置、设备及介质 | |
Wei et al. | An improved unsupervised representation learning generative adversarial network for remote sensing image scene classification | |
CN106611015A (zh) | 标签的处理方法及装置 | |
CN107003834B (zh) | 行人检测设备和方法 | |
Zhu et al. | A multiscale object detection approach for remote sensing images based on MSE-DenseNet and the dynamic anchor assignment | |
CN110457677A (zh) | 实体关系识别方法及装置、存储介质、计算机设备 | |
CN115482395B (zh) | 模型训练方法、图像分类方法、装置、电子设备和介质 | |
CN108320026A (zh) | 机器学习模型训练方法和装置 | |
CN108984555A (zh) | 用户状态挖掘和信息推荐方法、装置以及设备 | |
CN109635260A (zh) | 用于生成文章模板的方法、装置、设备和存储介质 | |
CN113468330A (zh) | 信息获取方法、装置、设备及介质 | |
CN110458166A (zh) | 一种基于可变形卷积的危险品检测方法、装置及设备 | |
CN109325178A (zh) | 用于处理信息的方法和装置 | |
CN105260741B (zh) | 一种基于高阶图结构p‑Laplacian稀疏编码的数字图像标记方法 | |
CN110232131A (zh) | 基于创意标签的创意素材搜索方法及装置 | |
CN114330474A (zh) | 一种数据处理方法、装置、计算机设备以及存储介质 | |
CN109359198A (zh) | 一种文本分类方法及装置 | |
CN109597987A (zh) | 一种文本还原方法、装置及电子设备 | |
CN108154153A (zh) | 场景分析方法和系统、电子设备 | |
CN104216882B (zh) | 文件标注方法及装置 | |
CN110363206A (zh) | 数据对象的聚类、数据处理及数据识别方法 | |
CN108830139A (zh) | 人体关键点的深度前后关系预测方法、装置、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
C41 | Transfer of patent application or patent right or utility model | ||
GR01 | Patent grant | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20170213 Address after: 266000 Qingdao Changjiang Road, Huangdao District, Shandong, No. 66 Applicant after: China University of Petroleum Address before: 266000 Qingdao Changjiang Road, Huangdao District, Shandong, No. 66 Applicant before: Liu Weifeng |