CN113505838A - 一种图像聚类方法、装置、电子设备及存储介质 - Google Patents

一种图像聚类方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113505838A
CN113505838A CN202110796021.9A CN202110796021A CN113505838A CN 113505838 A CN113505838 A CN 113505838A CN 202110796021 A CN202110796021 A CN 202110796021A CN 113505838 A CN113505838 A CN 113505838A
Authority
CN
China
Prior art keywords
error function
matrix
optimization
clustering
function value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110796021.9A
Other languages
English (en)
Other versions
CN113505838B (zh
Inventor
周郭许
陈岱
邱育宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202110796021.9A priority Critical patent/CN113505838B/zh
Publication of CN113505838A publication Critical patent/CN113505838A/zh
Application granted granted Critical
Publication of CN113505838B publication Critical patent/CN113505838B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像聚类方法、装置、电子设备及存储介质,包括:获取图像数据;构建图像数据的初始数据相似矩阵;基于初始数据相似矩阵和因子矩阵生成优化相似矩阵;采用图像数据、因子矩阵、初始数据相似矩阵和优化相似矩阵生成误差函数;优化误差函数,得到最小误差函数值和优化参数;判断最小误差函数值是否满足预设迭代终止条件;当最小误差函数值不满足预设迭代终止条件时,采用优化参数更新因子矩阵、优化相似矩阵,并返回采用图像数据、因子矩阵、初始数据相似矩阵和优化相似矩阵生成误差函数的步骤;当最小误差函数值满足预设迭代终止条件时,输出优化参数;对优化参数进行聚类,得到图像聚类信息。从而有效提高图像的聚类效果。

Description

一种图像聚类方法、装置、电子设备及存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种图像聚类方法、装置、电子设备及存储介质。
背景技术
随着大数据时代的到来,数据的获取越来越方便,这也使得数据的规模越来越大,多样化的数据的类型也因此显得越来越复杂,如各种类型的贸易交易数据、Web文档、基因表达数据、文档词频数据、用户评分数据、Web使用数据及多媒体数据等。张量通常指二维以上的数组,而在许多实际应用中,数据更自然地以高阶张量的形式被记录下来。例如,一张彩色图像可以视为三阶张量,而脑电图信号可以视为五阶张量。高阶数据固然包含更丰富的信息,然而其带来的是高度冗余的缺陷。
现实数据通常以非负形式存在,这意味着其包含了大量的结构化信息。但是非负高维数据的信息数量众多且杂乱无章,而且还包含着大量冗余的信息。如何在保留数据空间结构信息的前提下,捕获更多的数据信息,已成为当下备受关注的焦点。
目前处理非负高维数据的侧重点是利用特征降维算法提取非负高维数据的非负低维特征,而提取特征的有效性则由特征聚类实验来验证。现有的基于相似图的方法有基于图的非负矩阵分解,基于图的非负张量塔克分解,基于拉普拉斯正则化的非负塔克分解。三者的共同之处都在于把高维数据降维成低维的基于特征的多线性乘积,以达到降维与提取低维特征的目的。然而,上述方法由于固定相似图这一限制,使得分解过程中学习到的图结构信息受相似图的初始化效果的优劣的影响。
发明内容
本发明提供了一种图像聚类方法、装置、电子设备及存储介质,用于解决现有的图像聚类方法由于固定相似图这一限制,使得分解过程中学习到的图结构信息受相似图的初始化效果的优劣的影响,图像聚类效果较差的技术问题。
本发明提供了一种图像聚类方法,包括:
获取图像数据;所述图像数据具有多个维度的因子矩阵;
构建所述图像数据的初始数据相似矩阵;
基于所述初始数据相似矩阵和所述因子矩阵生成优化相似矩阵;
采用所述图像数据、所述因子矩阵、所述初始数据相似矩阵和所述优化相似矩阵生成误差函数;
优化所述误差函数,得到最小误差函数值和优化参数;
判断所述最小误差函数值是否满足预设迭代终止条件;
当所述最小误差函数值不满足预设迭代终止条件时,采用所述优化参数更新所述因子矩阵、所述优化相似矩阵,并返回采用所述图像数据、所述因子矩阵、所述初始数据相似矩阵和所述优化相似矩阵生成误差函数的步骤;
当所述最小误差函数值满足预设迭代终止条件时,输出所述优化参数;
对所述优化参数进行聚类,得到图像聚类信息。
可选地,所述判断所述最小误差函数值是否满足预设迭代终止条件的步骤,包括:
判断所述最小误差函数值与前一次迭代的误差函数值之间的差值的绝对值是否小于预设阈值。
可选地,所述优化所述误差函数,得到最小误差函数值和优化参数的步骤,包括:
将所述误差函数分解为相似图误差函数和塔克分解函数;
求取所述相似图误差函数的闭式解;
通过加速近端梯度算法优化所述塔克分解函数,得到塔克优化参数;
基于所述闭式解和所述塔克优化参数,得到所述误差函数的最小误差函数值和优化参数。
可选地,所述对所述优化参数进行聚类,得到图像聚类信息的步骤,包括:
从所述优化参数中提取目标因子矩阵,并对所述目标因子矩阵进行聚类,得到图像聚类信息。
本发明还提供了一种图像聚类装置,包括:
图像数据获取模块,用于获取图像数据;所述图像数据具有多个维度的因子矩阵;
初始数据相似矩阵构建模块,用于构建所述图像数据的初始数据相似矩阵;
优化相似矩阵生成模块,用于基于所述初始数据相似矩阵和所述因子矩阵生成优化相似矩阵;
误差函数生成模块,用于采用所述图像数据、所述因子矩阵、所述初始数据相似矩阵和所述优化相似矩阵生成误差函数;
优化模块,用于优化所述误差函数,得到最小误差函数值和优化参数;
判断模块,用于判断所述最小误差函数值是否满足预设迭代终止条件;
迭代模块,用于当所述最小误差函数值不满足预设迭代终止条件时,采用所述优化参数更新所述因子矩阵、所述优化相似矩阵,并返回采用所述图像数据、所述因子矩阵、所述初始数据相似矩阵和所述优化相似矩阵生成误差函数的步骤;
输出模块,用于当所述最小误差函数值满足预设迭代终止条件时,输出所述优化参数;
聚类模块,用于对所述优化参数进行聚类,得到图像聚类信息。
可选地,所述判断模块,包括:
判断子模块,用于判断所述最小误差函数值与前一次迭代的误差函数值之间的差值的绝对值是否小于预设阈值。
可选地,所述优化模块,包括:
分解子模块,用于将所述误差函数分解为相似图误差函数和塔克分解函数;
闭式解求取子模块,用于求取所述相似图误差函数的闭式解;
塔克分解子模块,用于通过加速近端梯度算法优化所述塔克分解函数,得到塔克优化参数;
最小误差函数值和优化参数获取子模块,用于基于所述闭式解和所述塔克优化参数,得到所述误差函数的最小误差函数值和优化参数。
可选地,所述聚类模块,包括:
聚类子模块,用于从所述优化参数中提取目标因子矩阵,并对所述目标因子矩阵进行聚类,得到图像聚类信息。
本发明还提供了一种电子设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行如上任一项所述的图像聚类方法。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行如上任一项所述的图像聚类方法。
从以上技术方案可以看出,本发明具有以下优点:本发明通过构建图像数据的初始数据相似矩阵和构建优化相似矩阵来生成误差函数;通过对误差函数进行优化,来获取因子矩阵和优化相似矩阵的优化参数;从而通过优化参数调整误差函数,并通过迭代的方式,实现优化参数的最优化。进而通过迭代完成后输出的优化参数进行图像数据的聚类。由于本发明的优化相似矩阵是随着迭代不断进行优化的,因此,可以避免学习到的信息受相似图的初始化效果的优劣的影响,有效提高图像的聚类效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种图像聚类方法的步骤流程图;
图2为本发明实施例提供的一种图像聚类装置的结构框图。
具体实施方式
本发明实施例提供了一种图像聚类方法、装置、电子设备及存储介质,用于解决现有的图像聚类方法由于固定优化相似矩阵这一限制,使得分解过程中学习到的图结构信息受优化相似矩阵的初始化效果的优劣的影响,图像聚类效果较差的技术问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,图1为本发明实施例提供的一种图像聚类方法的步骤流程图。
本发明提供的一种图像聚类方法,具体可以包括以下步骤:
步骤101,获取图像数据;图像数据具有多个维度的因子矩阵;
在本发明实施例中,图像数据可以包括但不限于人物图、脑电图等不同的图像数据。在实际应用中,非负高维的图像数据更多地是以高阶张量的形式被记录下来,例如,一张彩色图像可以视为三阶张量,而脑电图可以视为五阶张量。每一个非负高维的图像数据,可以拆分为一个非负核张量和不同维度的多个因子矩阵。
步骤102,构建图像数据的初始数据相似矩阵;
在本发明实施例中,初始数据相似矩阵可以是通过HeatKernel方法从图像数据中计算出来。
步骤103,基于初始数据相似矩阵和因子矩阵生成优化相似矩阵;
初始数据相似矩阵基于原始的图像数据计算得到的,是图像数据的初始优化相似矩阵的数学表示,其无法很好地挖掘图像数据的图结构信息,因此,在本发明实施例中,可以设置一个初始数据相似矩阵的自适应优化图作为优化相似图,并将其以矩阵的形式表示出来,得到优化相似矩阵。通过不断优化优化相似矩阵的形式,来避免固定的优化相似矩阵对图结构信息学习的不良影响。
在具体实现中,优化相似矩阵可以基于初始数据相似矩阵和图像数据的因子矩阵计算得到。其计算目标是使得初始数据相似矩阵与优化相似矩阵的误差尽可能小,以保证优化相似矩阵的稳定性。
步骤104,采用图像数据、因子矩阵、初始数据相似矩阵和优化相似矩阵生成误差函数;
在计算得到上述数据之后,可以构建误差函数如下:
Figure BDA0003162848230000061
Figure BDA0003162848230000062
其中,X为非负高维的图像数据;W为初始数据相似矩阵;S为优化相似矩阵;L为S对应的拉普拉斯矩阵;g为非负核张量;A(n)代表各个维度的因子矩阵,n=1,2,...,N;Tr()表示所求矩阵的对角元素之和;T表示转置矩阵;g×nA(n)表示g对nA(n)的n模式乘积,是一种运算符号;Sij表示相似矩阵S的第i行j列的元素;||...||F是一种矩阵范数。比如||A||F是指矩阵A的范数,具体计算为A的所有元素的平方之和开根号。因此
Figure BDA0003162848230000063
表征张量X-g×1A(1)×2…×NA(N)的平方和。
整个误差函数可以分成三个部分,一是塔克分解部分
Figure BDA0003162848230000064
目的是减小张量分解过程中由于误差造成的数据丢失;二是优化相似矩阵的优化
Figure BDA0003162848230000065
目的是使优化相似矩阵和初始数据相似矩阵的误差尽可能小,这意味着学习到的优化相似矩阵具有稳定性。三是优化相似矩阵优化的关键
Figure BDA0003162848230000066
,其可以将塔克分解过程和优化相似矩阵的优化这两个本不相关的过程结合起来,达到交替优化g,A(n)和S,实现自适应更新优化相似矩阵的目的。
步骤105,优化误差函数,得到最小误差函数值和优化参数;
以误差函数值最小为条件,对误差函数进行计算,可以得到最小误差函数值和优化参数。
在一个示例中,优化误差函数,得到最小误差函数值和优化参数的步骤可以包括:
将误差函数分解为相似图误差函数和塔克分解函数;
求取相似图误差函数的闭式解;
通过加速近端梯度算法优化塔克分解函数,得到塔克优化参数;
基于闭式解和塔克优化参数,得到误差函数的最小误差函数值和优化参数。
加速近端梯度算法(Accelerate Proximal Gradient,APG),是一种求解低秩约束问题的一种算法,常用于优化求解机器学习中的非平滑凸优化问题,具有收敛速度快的优点。
在具体实现中,可以将误差函数分解为相似图误差函数和塔克分解函数,对相似图误差函数求解闭式解,对塔克分解函数使用加速近端梯度法进行优化。其中,相似图误差函数如下所示:
Figure BDA0003162848230000071
Figure BDA0003162848230000072
将其展开并凑平方后,对优化相似矩阵S和初始数据相似矩阵的每个列向量进行求解,可将相似图误差函数改写为如下形式:
Figure BDA0003162848230000073
其中,si、wi、di分别表示矩阵S、W、d的第i列向量;矩阵d表示因子矩阵A(N)的样本距离矩阵。
Figure BDA0003162848230000074
dij表示的是A(N)中第i个样本
Figure BDA0003162848230000075
和第j个样本
Figure BDA0003162848230000076
的距离。
Figure BDA0003162848230000077
表示因子矩阵A(N)的第i列;
Figure BDA0003162848230000078
表示因子矩阵A(N)的第j列。
对于上述该写后的相似图误差函数,可以通过其拉格朗日函数结合KKT条件计算其闭式解。
对于塔克分解函数:
Figure BDA0003162848230000079
将最小化误差函数的问题转换层d+1个子问题(d个因子矩阵和1个张量核)来进行求解,在验证其满足李普希兹连续条件后利用加速近端梯度算法对每个子问题逐一进行优化,得到塔克优化参数;其中,塔克优化参数包括优化后的因子矩阵和优化后的非负核张量。
基于上述求得的相似图误差函数的闭式解和塔克优化参数,可以计算得到误差函数的最小误差函数值和优化参数。其中,优化参数包括优化后的优化相似矩阵、优化后的因子矩阵和优化后的非负核张量。
需要说明的是,进行塔克分解之前,需要先设置塔克分解的秩:
塔克分解的秩是指分解后的一系列二维非负因子矩阵第一个维度的自由度所组成的向量(也可以表示为张量核的维度构成的向量),秩越大,塔克分解误差会越小,但计算成本也会越高。例如,第n个因子矩阵
Figure BDA0003162848230000081
和张量核
Figure BDA0003162848230000082
其中rn表示第n个维度的秩(n=1,2,...,d),那么d维张量的秩组成的向量就是该张量的秩:R=[r1,r2,…,rd]。
步骤106,判断最小误差函数值是否满足预设迭代终止条件;
在实际应用中,对误差函数的一次优化未必能够达到最佳优化效果,为了达到较好的优化效果,可以对误差函数进行迭代优化。并设置迭代终止条件。在一个示例中,迭代终止条件可以为:判断最小误差函数值与前一次迭代的误差函数值之间的差值的绝对值是否小于预设阈值。在一个示例中,该预设阈值可以为10的-2次幂。
步骤107,当最小误差函数值不满足预设迭代终止条件时,采用优化参数更新因子矩阵、优化相似矩阵,并返回采用图像数据、因子矩阵、初始数据相似矩阵和优化相似矩阵生成误差函数的步骤;
步骤108,当最小误差函数值满足预设迭代终止条件时,输出优化参数;
当误差函数未满足迭代终止条件时,可以采用档次迭代生成的优化参数更新误差函数中的矩阵因子和优化相似矩阵,重复求解误差函数,以实现对矩阵因子和优化相似矩阵的不断优化。当满足迭代次数时,可以输出优化参数以进行后续的图像聚类操作。
步骤109,对优化参数进行聚类,得到图像聚类信息。
在本发明实施例中,每一个因子矩阵的维度都包括张量某一维度的秩与对应非负高维数据的维度。每个因子矩阵表征的内容并不相同,因此,可以根据实际聚类需求在优化后的因子矩阵中提取目标因子矩阵进行聚类。如求取的低维特征需要表征的是非负高维图像数据第k维各自由度间的区别时,则可以选取最终结果包含非负高维图像数据第k维度的张量秩,即A(k),将带有该维度的因子矩阵作为最后的特征表示,并进行聚类。又比如需要获取局部特征可视化时,获取对应维度的因子矩阵作为特征表示,并进行聚类,得到相应的图像聚类信息。
本发明实施例通过构建图像数据的初始数据相似矩阵和构建优化相似矩阵来生成误差函数;通过对误差函数进行优化,来获取因子矩阵和优化相似矩阵的优化参数;从而通过优化参数调整误差函数,并通过迭代的方式,实现优化参数的最优化。进而通过迭代完成后输出的优化参数进行图像数据的聚类。由于本发明的优化相似矩阵是随着迭代不断进行优化的,因此,可以避免学习到的信息受相似图的初始化效果的优劣的影响,有效提高图像的聚类效果。
请参阅图2,图2为本发明实施例提供的一种图像聚类装置的结构框图。
本发明实施例提供了一种图像聚类装置,包括:
图像数据获取模块201,用于获取图像数据;图像数据具有多个维度的因子矩阵;
初始数据相似矩阵构建模块202,用于构建图像数据的初始数据相似矩阵;
优化相似矩阵生成模块203,用于基于初始数据相似矩阵和因子矩阵生成优化相似矩阵;
误差函数生成模块204,用于采用图像数据、因子矩阵、初始数据相似矩阵和优化相似矩阵生成误差函数;
优化模块205,用于优化误差函数,得到最小误差函数值和优化参数;
判断模块206,用于判断最小误差函数值是否满足预设迭代终止条件;
迭代模块207,用于当最小误差函数值不满足预设迭代终止条件时,采用优化参数更新因子矩阵、优化相似矩阵,并返回采用图像数据、因子矩阵、初始数据相似矩阵和优化相似矩阵生成误差函数的步骤;
输出模块208,用于当最小误差函数值满足预设迭代终止条件时,输出优化参数;
聚类模块209,用于对优化参数进行聚类,得到图像聚类信息。
在本发明实施例中,判断模块206,包括:
判断子模块,用于判断最小误差函数值与前一次迭代的误差函数值之间的差值的绝对值是否小于预设阈值。
在本发明实施例中,优化模块205,包括:
分解子模块,用于将误差函数分解为相似图误差函数和塔克分解函数;
闭式解求取子模块,用于求取相似图误差函数的闭式解;
塔克分解子模块,用于通过加速近端梯度算法优化塔克分解函数,得到塔克优化参数;
最小误差函数值和优化参数获取子模块,用于基于闭式解和塔克优化参数,得到误差函数的最小误差函数值和优化参数。
在本发明实施例中,聚类模块209,包括:
聚类子模块,用于从优化参数中提取目标因子矩阵,并对目标因子矩阵进行聚类,得到图像聚类信息。
本发明实施例还提供了一种电子设备,设备包括处理器以及存储器:
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行本发明实施例的图像聚类方法。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行本发明实施例的图像聚类方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种图像聚类方法,其特征在于,包括:
获取图像数据;所述图像数据具有多个维度的因子矩阵;
构建所述图像数据的初始数据相似矩阵;
基于所述初始数据相似矩阵和所述因子矩阵生成优化相似矩阵;
采用所述图像数据、所述因子矩阵、所述初始数据相似矩阵和所述优化相似矩阵生成误差函数;
优化所述误差函数,得到最小误差函数值和优化参数;
判断所述最小误差函数值是否满足预设迭代终止条件;
当所述最小误差函数值不满足预设迭代终止条件时,采用所述优化参数更新所述因子矩阵、所述优化相似矩阵,并返回采用所述图像数据、所述因子矩阵、所述初始数据相似矩阵和所述优化相似矩阵生成误差函数的步骤;
当所述最小误差函数值满足预设迭代终止条件时,输出所述优化参数;
对所述优化参数进行聚类,得到图像聚类信息。
2.根据权利要求1所述的方法,其特征在于,所述判断所述最小误差函数值是否满足预设迭代终止条件的步骤,包括:
判断所述最小误差函数值与前一次迭代的误差函数值之间的差值的绝对值是否小于预设阈值。
3.根据权利要求2所述的方法,其特征在于,所述优化所述误差函数,得到最小误差函数值和优化参数的步骤,包括:
将所述误差函数分解为相似图误差函数和塔克分解函数;
求取所述相似图误差函数的闭式解;
通过加速近端梯度算法优化所述塔克分解函数,得到塔克优化参数;
基于所述闭式解和所述塔克优化参数,得到所述误差函数的最小误差函数值和优化参数。
4.根据权利要求1所述的方法,其特征在于,所述对所述优化参数进行聚类,得到图像聚类信息的步骤,包括:
从所述优化参数中提取目标因子矩阵,并对所述目标因子矩阵进行聚类,得到图像聚类信息。
5.一种图像聚类装置,其特征在于,包括:
图像数据获取模块,用于获取图像数据;所述图像数据具有多个维度的因子矩阵;
初始数据相似矩阵构建模块,用于构建所述图像数据的初始数据相似矩阵;
优化相似矩阵生成模块,用于基于所述初始数据相似矩阵和所述因子矩阵生成优化相似矩阵;
误差函数生成模块,用于采用所述图像数据、所述因子矩阵、所述初始数据相似矩阵和所述优化相似矩阵生成误差函数;
优化模块,用于优化所述误差函数,得到最小误差函数值和优化参数;
判断模块,用于判断所述最小误差函数值是否满足预设迭代终止条件;
迭代模块,用于当所述最小误差函数值不满足预设迭代终止条件时,采用所述优化参数更新所述因子矩阵、所述优化相似矩阵,并返回采用所述图像数据、所述因子矩阵、所述初始数据相似矩阵和所述优化相似矩阵生成误差函数的步骤;
输出模块,用于当所述最小误差函数值满足预设迭代终止条件时,输出所述优化参数;
聚类模块,用于对所述优化参数进行聚类,得到图像聚类信息。
6.根据权利要求5所述的装置,其特征在于,所述判断模块,包括:
判断子模块,用于判断所述最小误差函数值与前一次迭代的误差函数值之间的差值的绝对值是否小于预设阈值。
7.根据权利要求6所述的装置,其特征在于,所述优化模块,包括:
分解子模块,用于将所述误差函数分解为相似图误差函数和塔克分解函数;
闭式解求取子模块,用于求取所述相似图误差函数的闭式解;
塔克分解子模块,用于通过加速近端梯度算法优化所述塔克分解函数,得到塔克优化参数;
最小误差函数值和优化参数获取子模块,用于基于所述闭式解和所述塔克优化参数,得到所述误差函数的最小误差函数值和优化参数。
8.根据权利要求5所述的装置,其特征在于,所述聚类模块,包括:
聚类子模块,用于从所述优化参数中提取目标因子矩阵,并对所述目标因子矩阵进行聚类,得到图像聚类信息。
9.一种电子设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-4任一项所述的图像聚类方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-4任一项所述的图像聚类方法。
CN202110796021.9A 2021-07-14 2021-07-14 一种图像聚类方法、装置、电子设备及存储介质 Active CN113505838B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110796021.9A CN113505838B (zh) 2021-07-14 2021-07-14 一种图像聚类方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110796021.9A CN113505838B (zh) 2021-07-14 2021-07-14 一种图像聚类方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113505838A true CN113505838A (zh) 2021-10-15
CN113505838B CN113505838B (zh) 2023-05-26

Family

ID=78013225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110796021.9A Active CN113505838B (zh) 2021-07-14 2021-07-14 一种图像聚类方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113505838B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341510A (zh) * 2017-07-05 2017-11-10 西安电子科技大学 基于稀疏正交的双图非负矩阵分解的图像聚类方法
CN110717538A (zh) * 2019-10-08 2020-01-21 广东工业大学 一种基于非负张量环的彩色图片聚类方法
CN111191719A (zh) * 2019-12-27 2020-05-22 北京工业大学 一种基于自表示和图谱约束的非负矩阵分解的图像聚类方法
CN112148911A (zh) * 2020-08-19 2020-12-29 江苏大学 一种多视图本征低秩结构的图像聚类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341510A (zh) * 2017-07-05 2017-11-10 西安电子科技大学 基于稀疏正交的双图非负矩阵分解的图像聚类方法
CN110717538A (zh) * 2019-10-08 2020-01-21 广东工业大学 一种基于非负张量环的彩色图片聚类方法
CN111191719A (zh) * 2019-12-27 2020-05-22 北京工业大学 一种基于自表示和图谱约束的非负矩阵分解的图像聚类方法
CN112148911A (zh) * 2020-08-19 2020-12-29 江苏大学 一种多视图本征低秩结构的图像聚类方法

Also Published As

Publication number Publication date
CN113505838B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
KR102344473B1 (ko) 콘볼루셔널 뉴럴 네트워크들에 대한 슈퍼픽셀 방법들
Wu et al. Multi-label boosting for image annotation by structural grouping sparsity
US8977579B2 (en) Latent factor dependency structure determination
WO2022105108A1 (zh) 一种网络数据分类方法、装置、设备及可读存储介质
CN111898703B (zh) 多标签视频分类方法、模型训练方法、装置及介质
Srivatsan et al. A deep factorization of style and structure in fonts
CN110633421A (zh) 特征提取、推荐以及预测方法、装置、介质和设备
CN109409504A (zh) 一种数据处理方法、装置、计算机及存储介质
CN111782826A (zh) 知识图谱的信息处理方法、装置、设备及存储介质
US8412757B2 (en) Non-negative matrix factorization as a feature selection tool for maximum margin classifiers
US20230185998A1 (en) System and method for ai-assisted system design
US20190311248A1 (en) Method for random sampled convolutions with low cost enhanced expressive power
CN115080749B (zh) 一种基于自监督训练的弱监督文本分类方法、系统和装置
Liu et al. Multitask feature selection by graph-clustered feature sharing
Huai et al. Zerobn: Learning compact neural networks for latency-critical edge systems
CN116883545A (zh) 基于扩散模型的图片数据集扩充方法、介质及设备
Ballani et al. Sparse inverse covariance estimation with hierarchical matrices
US20240012966A1 (en) Method and system for providing a three-dimensional computer aided-design (cad) model in a cad environment
CN113780365A (zh) 样本生成方法和装置
CN109614581B (zh) 基于对偶局部学习的非负矩阵分解聚类方法
Guo et al. Efficient convolutional networks learning through irregular convolutional kernels
US20220374717A1 (en) Method and apparatus for energy-aware deep neural network compression
CN113505838A (zh) 一种图像聚类方法、装置、电子设备及存储介质
CN116030295A (zh) 物品识别方法、装置、电子设备及存储介质
CN112651492A (zh) 一种自连接宽度图卷积神经网络模型及其训练方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant