CN105740881A - 一种基于矩阵分解的部分标注图像聚类方法及装置 - Google Patents

一种基于矩阵分解的部分标注图像聚类方法及装置 Download PDF

Info

Publication number
CN105740881A
CN105740881A CN201610041234.XA CN201610041234A CN105740881A CN 105740881 A CN105740881 A CN 105740881A CN 201610041234 A CN201610041234 A CN 201610041234A CN 105740881 A CN105740881 A CN 105740881A
Authority
CN
China
Prior art keywords
image
word
feature
matrix decomposition
sparse expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610041234.XA
Other languages
English (en)
Other versions
CN105740881B (zh
Inventor
王亮
吴书
尹奇跃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Zhongke Intelligent Identification Co ltd
Original Assignee
Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co Ltd filed Critical Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co Ltd
Priority to CN201610041234.XA priority Critical patent/CN105740881B/zh
Publication of CN105740881A publication Critical patent/CN105740881A/zh
Application granted granted Critical
Publication of CN105740881B publication Critical patent/CN105740881B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于矩阵分解的部分标注图像聚类方法及装置,该方法包括:提取图像及图像标注词的特征;基于字典学习得到图像稀疏表达;对观测的图像标注词特征矩阵分解获得图像标注词的隐变量表达,以保持图像稀疏表达和图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;结合图像字典学习与部分观测的标注词矩阵分解构建目标函数;优化目标函数学习图像稀疏表达;基于学习到的稀疏表达进行图像聚类。本发明可学习图像完整的稀疏表达及所有图像标注词的隐变量表达,通过图像与图像标注词间共生关系建立上述表达间联系,从而利用标注词所携带的高层语义信息辅助图像特征学习,通过携带有高层语义信息的图像特征以提升图像聚类性能。

Description

一种基于矩阵分解的部分标注图像聚类方法及装置
技术领域
本发明涉及模式识别技术领域,尤其是一种基于矩阵分解的部分标注图像聚类方法及装置。
背景技术
随着图片分享网站如Flickr的迅速发展,互联网上存在着数以亿计的图片信息,如何对这些图片信息进行组织受到越来越多的关注。聚类技术作为一种有效数据组织方式,在图像组织中起着重要的作用。
传统的图像聚类技术一般提取图像本身局部特征(如SIFT特征)或者全局特征(如GIST特征)以实现图像聚类。然而,近些年来,随着图像标注信息的快速增长,如越来越多的用户在Flickr网站上对自己分享的图片进行标注,如何利用标注这一高层语义信息来辅助图像聚类受到越来越多的关注。
为利用标注信息辅助图像聚类,研究者提出了一系列的技术手段,如层次聚类(hierarchicalclustering)、联合聚类(co-clustering)以及多视角聚类(Multi-viewclustering)。然而上述方法一般假设图像具有完整的标注词特征,即每一副图像都有完整的标注词进行描述,这在现实中是难以满足的,比如用户一般仅对部分图像进行标注,或者在图像标注时仅仅给出一部分的标注词。在上述场景中,标注信息是不完整的,使得传统的利用标注信息辅助图像聚类的方法面临着较大的性能下降。因此,需要提出有效的算法实现部分标注图像聚类任务。
发明内容
本发明的目的在于解决上述技术问题而提供一种基于矩阵分解的部分标注图像聚类方法及装置,以解决现有方法不能有效地满足部分标注图像聚类的需求的技术问题。
本发明是这样实现的,一种基于矩阵分解的部分标注图像聚类方法,包括步骤:
提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征;
基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达;
对观测到的图像标注词的特征进行矩阵分解,学习得到图像标注词的隐变量表达,并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;
结合图像字典学习与所述矩阵分解构建优化目标函数;
采用交替优化方式求解所述优化目标函数,得到所有图像最终的稀疏表达;
基于所述稀疏表达利用聚类算法得到预设类别的图像聚类。
本发明的目的还在于提供一种基于矩阵分解的部分标注图像聚类装置,包括:
特征提取模块,用于提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征;
图像稀疏表达获得模块,用于基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达;
标注词隐变量表达获得模块,用于对观测到的图像标注词的特征进行矩阵分解,学习得到图像标注词的隐变量表达,并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;
优化目标函数构建模块,用于结合图像字典学习与所述矩阵分解构建优化目标函数;
最终稀疏表达形成模块,用于采用交替优化方式求解所述优化目标函数,得到所有图像最终的稀疏表达;
图像聚类模块,用于基于所述稀疏表达利用聚类算法得到预设类别的图像聚类。
本发明图像聚类的方法以及装置,基于字典学习的方法,学习得到图像数据集中每一幅图像的稀疏表达,同时通过对图像的部分观测的图像标注词特征进行矩阵分解,学习得到每一个图像标注词的隐变量表达,最终使图像的稀疏表达与图像标注词的隐变量表达通过图像与图像标注词的共生关系建立连接,保持共生关系的一致性,从而可以利用图像标注词的高层语义信息辅助图像特征的学习进行图像的聚类,获得图像聚类的结果,大大地提升了图像聚类性能。
附图说明
图1所示为本发明提供的基于矩阵分解的部分标注图像聚类方法的流程图;
图2是本发明提供的基于矩阵分解的部分标注图像聚类方法原理示意图;
图3所示为本发明提供的基于矩阵分解的部分标注图像聚类装置的结构原理图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明通过利用不完整观测的具有高层语义的图像标注词辅助图像稀疏表达的学习,进而使得图像稀疏表达能够融合图像和标注词两方面的信息,从而以利用图像标注词的高层语义信息辅助图像特征的学习,进行图像聚类,获得图像聚类的结果,大大提高了图像聚类的性能。
参见图1所示,一种基于矩阵分解的部分标注图像聚类方法,包括步骤:
S101:提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征;
S102:基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达;
S103:对观测到的图像标注词的特征进行矩阵分解,学习得到图像标注词的隐变量表达,并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;
S104:结合图像字典学习与所述矩阵分解构建优化目标函数;
S105:采用交替优化方式求解所述优化目标函数,得到所有图像最终的稀疏表达;
S106:基于所述稀疏表达利用kmeans聚类算法得到预设类别的图像聚类。
具体实现上,在步骤S106中,基于上述图像的最终的稀疏表达可以是利用kmeans聚类算法得到预设类别的图像聚类,如通过给定聚类数目,将kmeans聚类算法作用于图像的稀疏表达就可以得到最终的图像聚类,获得图像聚类的结果。
本发明基于字典学习的方法,学习得到图像数据集中每一幅图像的稀疏表达,同时通过对图像的部分观测的图像标注词特征进行矩阵分解,学习得到每一个图像标注词的隐变量表达,最终使图像的稀疏表达与图像标注词的隐变量表达通过图像与图像标注词的共生关系建立连接,从而以利用图像标注词的高层语义信息辅助图像特征的学习,进而能有效地提升图像聚类性能。
需要说明的是,本发明中,所述聚类数据集中的图像的部分图像包含完整的标注词,部分图像没有标注词或者仅有不完整的标注词;在提取图像的标注词特征时,不但对含完整的标注词的特征进行提取,也对不完整的标注词的特征进行提取。
本发明中,所述图像的特征一般是视觉描述算子,具体实现上可以是图像的局部特征如SIFT特征,或者图像的全部特征,如GIST特征,所述图像标注词的特征则有0和1组成,以反应标注词是否存在于图像中。
具体的,本发明中,在步骤S102中,所述所有的图像的稀疏表达建模方式可以为:
其中,X为图像的视觉特征,每一列表示一个图像,D为学习得到的图像字典,所设计约束条件作用于矩阵的每一列防止图像字典过拟合。S为所有图像的稀疏表达所构成的矩阵,si为S的第i列,对应图像i的稀疏表达,||si||1定义为si所有元素绝对值之和,该正则项使得所求得的表达具有稀疏特性。
本发明中,步骤S103中,对图像标注词的特征进行矩阵分解的建模方式可以采用以下:
其中,sj为图像j的稀疏表达,O为观测到的图像与标注词关系,即图像j包含标注词i。T为标注词特征,每一列对应一副图像,由0和1组成,反应图像标注词是否存在于该图像中。参见图2所示,如第一列对应第一幅图像,观测到图像标注词t1和t3(T11=T31=1),利用提取的观测到的图像标注词通过部分矩阵分解得到图像稀疏表达与标注词的隐变量表达的关系。利用提取的图像特征通过图像字典学习得到图像的稀疏表达与图像字典。图像标注词的特征和图像的特征通过图像的稀疏表达建立联系。R是学习得到的图像标注词的隐变量表达,ri为R的第i行,对应图像标注词i的隐变量表达。所设计约束条件作用于矩阵的每一列防止学习得到的隐变量表达过拟合。上述基于矩阵分解建立了图像稀疏表达与图像标注词的隐变量表达的联系,即满足两者与图像和图像标注词共生关系的一致性。
考虑到图像标注词不存在于图像中可能是由于未观测到该图像标注词,即图像是部分标注的,在矩阵分解的建模(2)的基础上增加权重矩阵,形成优化的矩阵分解的建模,即:
其中I为权重矩阵,以对图像是否存在标注词进行权重设定,当图像j包含标注词i时,Iij给定一个较大的值,反之,Iij给定一个较小的值;
该步骤S104:中,所述的优化目标函数可以为:
其中γ1和γ2为预设的比例系数,以控制优化目标函数中不同项的权重;
需要说明的是,本发明中在,在步骤S106,采用交替优化的方式求解上述优化目标函数,以得到图像最终的稀疏表达、字典以及标注词的隐变量表达,所述采用交替优化方式求解D,S和R,直至算法收敛,具体如下:
固定D和R,则优化目标函数改写为:
针对sj,上述优化目标函数可以改写为:
其中lj为L的第j列,且L定义为矩阵I的平方根,tj为矩阵T的第j列。上述优化目标函数为基本稀疏建模问题,可通过SLEP工具包进行求解。
固定S和R,则目标函数改写为:
上述优化目标可通过拉格朗日乘子法进行求解,即:
D=XST(SST+τ)-1
其中τ为对角矩阵,其第i个对角元素τi可以通过优化目标函数得到。
固定S和D,则优化目标函数改写为:
其可以进一步改写为:
因此,R和D具有相似的求解过程。
为了验证本发明的实施效果,接下来以PASCALVOC2007数据库为例进行说明,并以归一化互信息和准确率为评价指标展示本发明的实施效果。该数据库包含20类图片,其中训练和测试图像数目分别为5,011和4,952。具体步骤如下:
步骤S1,将训练和测试两个集合合并得到聚类数据集,并收集图像的标注信息,在此数据库中30副图像不包含任何标注信息。在后续实验中,随机去除具有完整标注的图像的部分标注词以模拟部分图像包含不完整的标注词这一情况。
步骤S2,提取图像的颜色特征X,并构造图像的标注词特征T,若图像j包含标注词i,则Tij=1,否则为0。
步骤S3,基于图像字典学习获得图像的稀疏表达S。
步骤S4,对部分观测的标注词特征T进行矩阵分解,以保持图像稀疏表达S和所求得的图像标注词的隐变量表达R与图像和图像标注词的共生关系的一致性。
步骤S5,结合图像字典学习与部分观测图像标注词的矩阵分解构建最终目标函数。
步骤S6,令γ1和γ2取值为1,并采用交替优化方式求解上述优化目标得到图像稀疏表达S,图像字典D以及图像标注词的隐变量表达R。
步骤S7,将kmeans聚类算法作用于图像的稀疏表达S得到最终的图像聚类。
选用PASCALVOC2007数据库并以归一化互信息和准确率为评价指标,将本发明的聚类方法与其它聚类方法在部分图像没有标注词以及部分图像包含一定比例不完整标注词的情况下的聚类性能进行比较,获得如下表1与表1的比较数据:
NMI 0% 10% 30% 50% 70% 90%
SC 6.26 6.26 6.26 6.26 6.26 6.26
PairwiseSC 52.23 46.65 37.21 28.49 22.50 11.59
CentroidSC 49.86 45.49 36.65 30.64 21.68 10.36
PVC 51.51 39.06 27.02 24.78 13.58 5.51
My 53.37 48.64 41.37 31.81 23.39 11.28
表1
ACC 0% 10% 30% 50% 70% 90%
SC 15.22 15.22 15.22 15.22 15.22 15.22
PairwiseSC 53.20 50.58 43.05 33.58 26.77 19.72
CentroidSC 50.76 48.90 41.88 33.80 26.36 18.02
PVC 52.97 39.96 27.20 22.69 16.74 11.11
My 56.56 51.77 48.05 39.32 28.29 18.84
表2
表中,NMI和ACC分别为归一化互信息和准确率两个指标。SC,PairwiseSC,CentroidSC,PVC和My为不同的图像聚类方法,分别表示基于图像特征构造稀疏表达的聚类方法,基于谱分解正则化的两种聚类方法,基于非负矩阵分解的不完整多视角聚类方法和本发明的方法。0%-90%为不完整标注词的比例。
可以看出,本发明方法在对具有不完整图像标注词的图像的聚类性能上大大优于其它的图像聚类方法的图像聚类性能。
参见图3所示,本发明的目的还在于提供一种矩阵分解的部分标注图像聚类装置,包括:
特征提取模块10,用于提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征;
图像稀疏表达获得模块20,用于基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达;
标注词隐变量表达获得模块30,用于对观测到的图像标注词的特征进行矩阵分解,学习得到图像标注词的隐变量表达,并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;
优化目标函数构建模块40,用于结合图像字典学习与所述矩阵分解构建优化目标函数;
最终稀疏表达形成模块50,用于采用交替优化方式求解所述优化目标函数,得到所有图像最终的稀疏表达;
图像聚类模块60,用于基于所述稀疏表达利用聚类算法得到预设类别的图像聚类的结果。
需要说明的是,本发明中,所述聚类数据集中的图像的部分图像包含完整的标注词,部分图像没有标注词或者仅有不完整的标注词;在提取图像的标注词特征时,不但对含完整的标注词的特征进行提取,也对不完整的标注词的特征进行提取。
本发明中,所述图像的特征一般是视觉描述算子,具体实现上可以是图像的局部特征如SIFT特征,或者图像的全部特征,如GIST特征,所述图像标注词的特征则有0和1组成,以图像反应标注词是否存在于图像中。
具体在,本发明中,所述所有的图像的稀疏表达建模方式可以为:
其中,X为图像的视觉特征,每一列表示一个图像,D为学习得到的图像字典,所设计约束条件作用于矩阵的每一列防止字典过拟合。S为所有图像的稀疏表达所构成的矩阵,si为S的第i列,对应图像i的稀疏表达,||si||1定义为si所有元素绝对值之和,该正则项使得所求得的表达具有稀疏特性。
本发明中,对图像标注词的特征进行矩阵分解的建模方式可以为:
其中,sj为图像j的稀疏表达,O为观测到的图像与标注词关系,即图像j包含标注词i。T为标注词特征,每一列对应一副图像,由0和1组成,反应标注词是否存在于该图像中。参见图2所示,如第一列对应第一幅图像,观测到标注词t1和t3(T11=T31=1),利用观测到标注词通过部分矩阵分解得到图像稀疏表达与图像标注词的隐变量表达间的关系。利用提取的图像特征则通过图像字典学习得到图像的稀疏表达与图像字典。图像标注词特征和图像特征通过图像的稀疏表达建立联系。R是学习得到的标注词的隐变量表达,ri为R的第i行,对应标注词i的隐变量表达。所设计约束条件作用于矩阵的每一列防止学习得到的隐变量表达过拟合。上述基于矩阵分解建立了图像稀疏表达与图像标注词的隐变量表达的联系,即满足两者与图像和标注词共生关系的一致性。
考虑到标注词不存在于图像中可能是由于未观测到该标注词,即图像是部分标注的,在矩阵分解的建模(2)的基础上增加权重矩阵,形成优化的矩阵分解的建模,即:
其中I为权重矩阵,以对图像是否存在标注词进行权重设定,当图像j包含标注词i时,Iij给定一个较大的值,反之,Iij给定一个较小的值;
该步骤S104:中,所述的优化目标函数可以为:
其中γ1和γ2为预设的比例系数,以控制优化目标函数中不同项的权重;
需要说明的是,本发明中在,采用交替优化的方式求解上述优化目标函数,以得到图像最终的稀疏表达、图像字典以及图像标注词的隐变量表达,所述采用交替优化方式求解D,S和R,直至算法收敛,具体如下:
固定D和R,则优化目标函数改写为:
针对sj,上述优化目标函数可以改写为:
其中lj为L的第j列,且L定义为矩阵I的平方根,tj为矩阵T的第j列。上述优化目标函数为基本稀疏建模问题,可通过SLEP工具包进行求解。
固定S和R,则目标函数改写为:
上述优化目标可通过拉格朗日乘子法进行求解,即:
D=XST(SST+τ)-1
其中τ为对角矩阵,其第i个对角元素τi可以通过优化目标函数得到。
固定S和D,则优化目标函数改写为:
其可以进一步改写为:
因此,R和D具有相似的求解过程。
可以看出,本发明图像聚类的方法以及装置,基于字典学习的方法,学习得到图像数据集中每一幅图像的稀疏表达,同时通过对图像的部分观测的图像标注词特征进行矩阵分解,学习得到每一个图像标注词的隐变量表达,最终使图像的稀疏表达与图像标注词的隐变量表达通过图像与图像标注词的共生关系建立连接,保持一致性,从而以利用图像标注词的高层语义信息辅助图像特征的学习进行图像的聚类,获得聚类结果,大大地提升了图像聚类性能。
以上所述的具体实施例,对本发明的目的、技术方案和效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于矩阵分解的部分标注图像聚类方法,其特征在于,包括:
提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征;
基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达;
对观测到的图像标注词的特征进行矩阵分解,学习得到图像标注词的隐变量表达,并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;
结合图像字典学习与所述矩阵分解构建优化目标函数;
采用交替优化方式求解所述优化目标函数,得到所有图像最终的稀疏表达;
基于所述稀疏表达利用kmeans聚类算法得到预设类别的图像聚类。
2.根据权利要求1所述基于矩阵分解的部分标注图像聚类方法,其特征在于,所述聚类数据集中的所述图像中,部分图像具有完整的图像标注词,部分图像没有图像标注词或者仅有不完整的图像标注词。
3.根据权利要求1或2所述基于矩阵分解的部分标注图像聚类方法,其特征在于,所述图像的特征是指视觉描述算子,所述图像标注词的特征由0和1组成。
4.根据权利要求3所述基于矩阵分解的部分标注图像聚类方法,其特征在于,所述视觉描述算子包括图像的局部特征和\或者全局特征。
5.根据权利要求1所述基于矩阵分解的部分标注图像聚类方法,其特征在于,所述优化目标函数表示为:
m i n D , S , R | | X - D S | | 2 + γ 1 Σ i | | s i | | 1 + γ 2 Σ i j I i j ( T i j - r i s j ) 2
s . t . | | d k | | 2 ≤ 1 , | | r k | | 2 ≤ 1 ∀ k
其中,X为图像的特征;D为学习得到的图像字典;S为所有图像的稀疏表达构成的矩阵,si为S的第i列、对应图像i的稀疏表达;I为权重矩阵,以对图像是否存在图像标注词进行权重设定;T为图像标注词特征,R是学习得到的图像标注词的隐变量表达,ri为R的第i行、对应图像标注词i的隐变量表达,γ1和γ2为预设比例系数。
6.一种基于矩阵分解的部分标注图像聚类装置,其特征在于,包括:
特征提取模块,用于提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征;
图像稀疏表达获得模块,用于基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达;
标注词隐变量表达获得模块,用于对观测到的图像标注词的特征进行矩阵分解,学习得到图像标注词的隐变量表达,并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;
优化目标函数构建模块,用于结合图像字典学习与所述矩阵分解构建优化目标函数;
最终稀疏表达形成模块,用于采用交替优化方式求解所述优化目标函数,得到所有图像最终的稀疏表达;
图像聚类模块,用于基于所述稀疏表达利用kmeans聚类算法得到预设类别的图像聚类。
7.根据权利要求6所述基于矩阵分解的部分标注图像聚类装置,其特征在于,所述聚类数据集中的所述图像中,部分图像具有完整的图像标注词,部分图像没有图像标注词或者仅有不完整的图像标注词。
8.根据权利要求6或7所述基于矩阵分解的部分标注图像聚类装置,其特征在于,所述图像的特征是指视觉描述算子,所述图像标注词的特征由0和1组成。
9.根据权利要求8所述基于矩阵分解的部分标注图像聚类装置,其特征在于,所述视觉描述算子包括图像的局部特征和\或者全局特征。
10.根据权利要求6所述基于矩阵分解的部分标注图像聚类装置,其特征在于,所述优化目标函数表示为:
m i n D , S , R | | X - D S | | 2 + γ 1 Σ i | | s i | | 1 + γ 2 Σ i j I i j ( T i j - r i s j ) 2
s . t . | | d k | | 2 ≤ 1 , | | r k | | 2 ≤ 1 ∀ k
其中,X为图像的特征;D为学习得到的图像字典;S为所有图像的稀疏表达矩阵,si为S的第i列、对应图像i的稀疏表达;I为权重矩阵,以对图像是否存在图像标注词进行权重设定;T为图像标注词特征,R是学习得到的图像标注词的隐变量表达,ri为R的第i行、对应图像标注词i的隐变量表达,γ1和γ2为预设比例系数。
CN201610041234.XA 2016-01-22 2016-01-22 一种基于矩阵分解的部分标注图像聚类方法及装置 Active CN105740881B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610041234.XA CN105740881B (zh) 2016-01-22 2016-01-22 一种基于矩阵分解的部分标注图像聚类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610041234.XA CN105740881B (zh) 2016-01-22 2016-01-22 一种基于矩阵分解的部分标注图像聚类方法及装置

Publications (2)

Publication Number Publication Date
CN105740881A true CN105740881A (zh) 2016-07-06
CN105740881B CN105740881B (zh) 2019-04-19

Family

ID=56247348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610041234.XA Active CN105740881B (zh) 2016-01-22 2016-01-22 一种基于矩阵分解的部分标注图像聚类方法及装置

Country Status (1)

Country Link
CN (1) CN105740881B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898166A (zh) * 2018-06-13 2018-11-27 北京信息科技大学 一种图像标注方法
CN109902699A (zh) * 2017-12-08 2019-06-18 北京邮电大学 一种信息处理方法、装置和计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719270A (zh) * 2009-12-25 2010-06-02 武汉大学 一种基于非负矩阵分解的人脸超分辨率处理方法
CN102270241A (zh) * 2011-08-16 2011-12-07 浙江大学 基于稀疏非负矩阵分解的图像检索方法
CN102521227A (zh) * 2011-10-18 2012-06-27 中国科学院自动化研究所 基于用户信息建模的图像标注增强方法
CN103034728A (zh) * 2012-12-19 2013-04-10 北京中加国道科技有限责任公司 利用社会化网络学术资源交互平台进行信息交互的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719270A (zh) * 2009-12-25 2010-06-02 武汉大学 一种基于非负矩阵分解的人脸超分辨率处理方法
CN102270241A (zh) * 2011-08-16 2011-12-07 浙江大学 基于稀疏非负矩阵分解的图像检索方法
CN102521227A (zh) * 2011-10-18 2012-06-27 中国科学院自动化研究所 基于用户信息建模的图像标注增强方法
CN103034728A (zh) * 2012-12-19 2013-04-10 北京中加国道科技有限责任公司 利用社会化网络学术资源交互平台进行信息交互的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
欧卫华: ""基于稀疏表示和非负矩阵分解的部分遮挡人脸识别研究"", 《中国博士学位论文全文数据库 信息科技辑》 *
肖延辉: ""基于矩阵分解的图像表示理论及其应用研究"", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902699A (zh) * 2017-12-08 2019-06-18 北京邮电大学 一种信息处理方法、装置和计算机存储介质
CN109902699B (zh) * 2017-12-08 2023-07-11 北京邮电大学 一种信息处理方法、装置和计算机存储介质
CN108898166A (zh) * 2018-06-13 2018-11-27 北京信息科技大学 一种图像标注方法

Also Published As

Publication number Publication date
CN105740881B (zh) 2019-04-19

Similar Documents

Publication Publication Date Title
Bechtel et al. Quality of crowdsourced data on urban morphology—the human influence experiment (HUMINEX)
Abad-Segura et al. Research analysis on emerging technologies in corporate accounting
Karleuša et al. The application of multi-criteria analysis methods for the determination of priorities in the implementation of irrigation plans
CN110334724B (zh) 基于lstm的遥感对象自然语言描述及多尺度矫正方法
CN111710428B (zh) 一种建模全局和局部上下文交互的生物医学文本表示方法
CN105808757A (zh) 基于多特征融合的bow模型的中草药植物图片检索方法
CN104484347B (zh) 一种基于地理信息的层次化视觉特征提取方法
CN106575380A (zh) 用于分类的总体形式概念分析(fca)框架
Dong et al. L-unet: A landslide extraction model using multi-scale feature fusion and attention mechanism
Ding et al. Non-local feature search network for building and road segmentation of remote sensing image
Khan et al. A low-cost interactive writing board for primary education using distinct augmented reality markers
Jishan et al. Bangla language textual image description by hybrid neural network model
Pallauta et al. Secondary school students’ construction and interpretation of statistical tables
Jing et al. Research landscape of adaptive learning in education: A bibliometric study on research publications from 2000 to 2022
Ji et al. Deep learning model for form recognition and structural member classification of east asian traditional buildings
Li et al. Semi-supervised remote sensing image semantic segmentation method based on deep learning
Sędzicki et al. Computer-aided automated greenery design—towards a green BIM
Shan et al. Application of Intelligent Technology in Facade Style Recognition of Harbin Modern Architecture
Yang et al. Icon generation based on generative adversarial networks
Han et al. Towards classification of architectural styles of Chinese traditional settlements using deep learning: A dataset, a new framework, and its interpretability
CN105740881A (zh) 一种基于矩阵分解的部分标注图像聚类方法及装置
CN103218460B (zh) 基于最优线性稀疏重构的图像标签补全方法
CN111222000B (zh) 一种基于图卷积神经网络的图像分类方法及系统
Wiza et al. Classification Analysis Using C4. 5 Algorithm To Predict The Level of Graduation of Nurul Falah Pekanbaru High School Students
Wang et al. Image colorization algorithm based on deep learning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 300457 unit 1001, block 1, msd-g1, TEDA, No.57, 2nd Street, Binhai New Area Economic and Technological Development Zone, Tianjin

Patentee after: Tianjin Zhongke intelligent identification Co.,Ltd.

Address before: Unit 300465 TEDA MSD-G1-1001, 57 Second Avenue, Tianjin Economic and Technological Development Zone, Binhai New Area, Tianjin

Patentee before: TIANJIN ZHONGKE INTELLIGENT IDENTIFICATION INDUSTRY TECHNOLOGY RESEARCH INSTITUTE Co.,Ltd.

CP03 Change of name, title or address