CN112215275A - 一种适于K-means算法的图像处理系统和方法,及记录介质 - Google Patents

一种适于K-means算法的图像处理系统和方法,及记录介质 Download PDF

Info

Publication number
CN112215275A
CN112215275A CN202011059022.7A CN202011059022A CN112215275A CN 112215275 A CN112215275 A CN 112215275A CN 202011059022 A CN202011059022 A CN 202011059022A CN 112215275 A CN112215275 A CN 112215275A
Authority
CN
China
Prior art keywords
data set
image
unlabeled
training
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011059022.7A
Other languages
English (en)
Inventor
陈锐
张彩霞
袁国文
李纲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan University
Original Assignee
Foshan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan University filed Critical Foshan University
Priority to CN202011059022.7A priority Critical patent/CN112215275A/zh
Publication of CN112215275A publication Critical patent/CN112215275A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种适于K‑means算法的图像处理系统和方法,及其记录介质,所述系统包括:获取单元,用于获取无标签图像的数据集;预处理单元,用于通过获取的无标签图像的数据集将无标签图像规范化处理;分类单元,用于将预处理后的图像的数据集划分为训练集和验证集;训练单元,用于将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;处理单元,用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集;筛选单元,用于使用K‑means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。本公开克服了传统的聚类算法无法直接处理高维度图像的缺点。本发明适用于图像处理技术领域。

Description

一种适于K-means算法的图像处理系统和方法,及记录介质
技术领域
本公开涉及图像处理系统和方法,及其记录介质,并且特别涉及适于K-means算法的图像处理系统和方法,及其记录介质。
背景技术
近年来,随着信息技术的高速发展以及摄像机、手机等图像采集设备的普及,图像信息充斥在世界的每一个角落,用其清晰、简单的方式描述着日常生活的方方面面。比如,用图像描述情感(朋友圈的图像信息),家庭影集的管理,医学图像检索,人脸识别及网络购物、旅游评论等。图像信息的处理也面临了巨大的挑战,比如如何才可以从海量的无标签图像数据中筛选出具有相似性的属性。传统的图像处理方法由于图像数据维度较高,传统的聚类算法无法直接处理。
发明内容
本发明就是在如上所述的这种情况下提出来的,更具体地说,一方面,本公开的处理系统包括:
获取单元,用于获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理单元,用于通过获取的无标签图像的数据集将无标签图像规范化处理;
分类单元,用于将预处理后的图像的数据集划分为训练集和验证集;
训练单元,用于将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行
训练;
处理单元,用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集。
具体的,所述处理系统还包括:
筛选单元,用于使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。
另一方面,本公开的方法包括:获取步骤,获取无标签图像的数据集,所述数据集包括多个无标签图像;预处理步骤,通过获取的无标签图像的数据集将无标签图像规范化处理;分类步骤,将预处理后的图像的数据集划分为训练集和验证集;训练步骤,将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;处理步骤,使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集;和筛选步骤,使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。
具体的,预处理步骤中,通过获取的无标签图像的数据集将无标签图像规范化处理的方法的步骤为:
A1,将所有的无标签图像的尺寸做规范化处理,即将所有的无标签图像的尺寸统一大小;
A2,将所有的无标签图像的像素做规范化处理,即将所有的无标签图像的像素调整为固定的数值区间。
具体的,所述固定的数值区间为[-1,1]或者[0,1]。
具体的,处理步骤中,将预处理后的图像的数据集划分为训练集和验证集的方法为:随机将75%的预处理后的图像的数据集划分为训练集,再将其余25%的预处理后的图像的数据集划分为验证集。
另一方面,采用本公开的介质,以便记录程序,该程序包括:
获取步骤,获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理步骤,通过获取的无标签图像的数据集将无标签图像规范化处理;
分类步骤,将预处理后的图像的数据集划分为训练集和验证集;
训练步骤,将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;
处理步骤,使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集;
筛选步骤,使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图的数据集。
在已经描述的处理系统、处理方法和介质中,确定对应于处理系统的命令,从而,执行对应于确定命令的处理。
本公开的有益效果为:本公开提供了一种结合DCN模型和K-means算法对海量的图像进行处理的系统和方法,及其介质,克服了传统的聚类算法无法直接处理高维度图像的缺点。
要理解的是,前面的一般描述和下面的详细描述两者都是示例性的,并且意图在于提供要求保护的技术的进一步说明。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为本公开实施例提供的一种适于K-means算法的图像处理方法流程图。
具体实施方式
下面将结合本公开实施例中的附图对本公开实施例中技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部实施例。通常在此处幅图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性的劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本公开的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
作为一个实施例,本公开提出了一种适于K-means算法的图像处理系统,所述系统包括:
获取单元,用于获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理单元,用于通过获取的无标签图像的数据集将无标签图像规范化处理;
分类单元,用于将预处理后的图像的数据集划分为训练集和验证集;
训练单元,用于将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;
处理单元,用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集。
具体的,所述处理系统还包括:
筛选单元,用于使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。
作为另一个实施例,本公开还提出了一种适于K-means算法的图像处理方法,图1所示为本公开实施例提供的一种适于K-means算法的图像处理方法流程图,如图1所示,所述方法包括:获取步骤100,获取无标签图像的数据集,所述数据集包括多个无标签图像;预处理步骤200,通过获取的无标签图像的数据集将无标签图像规范化处理;分类步骤300,将预处理后的图像的数据集划分为训练集和验证集;训练步骤400,将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;处理步骤500,使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集;和筛选步骤600,使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。
具体的,预处理步骤中,通过获取的无标签图像的数据集将无标签图像规范化处理的方法的步骤为:
A1,将所有的无标签图像的尺寸做规范化处理,即将所有的无标签图像的尺寸统一大小;
A2,将所有的无标签图像的像素做规范化处理,即将所有的无标签图像的像素调整为固定的数值区间。
具体的,所述固定的数值区间为[-1,1]或者[0,1]。
具体的,处理步骤中,将预处理后的图像的数据集划分为训练集和验证集的方法为:随机将75%的预处理后的图像的数据集划分为训练集,再将其余25%的预处理后的图像的数据集划分为验证集。
具体的,所述DCN模型的损失函数为:
Figure BDA0002711775340000041
Figure BDA0002711775340000042
其中,函数f()和g()分别为DCN模型编码层和解码层的输出函数,W和W’分别表示f()和g()的参数集,Z为隐藏层特征矩阵,M为质心,Si为数值i的赋值向量(assignmentvector),Si,j为Si的第j个元素,i和j为大于0的自然数,λ为重要性参数。具体请参见参考文献:B.Yang,X.Fu,N.D.Sidiropoulos,and M.Hong.Towards K-means-friendly Spaces:Simultaneous Deep Learning and Clustering.In Proceedings of ICML,ICML'17,pages 3861–3870,2017。
作为另一个实施例,本公开还提出了一种介质,以便记录程序,该程序包括:
获取步骤,获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理步骤,通过获取的无标签图像的数据集将无标签图像规范化处理;
分类步骤,将预处理后的图像的数据集划分为训练集和验证集;
训练步骤,将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;
处理步骤,使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集;
筛选步骤,使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图程序可以以无线方式通过用于数字卫星广播的人造卫星从下载站点传送到计算机,或以有线方式通过诸如局域网或因特网网络传送到计算机,并且存储到包括在计算机内的硬盘上。
在该说明书中的介质指包括这些所有介质的广义概念。
此外,在改说明书中,用于描述介质提供的程序的步骤不仅包括以时间序列方式按照上述的次序执行的处理,而且包括即使该程序不以时间序列方式处理也能够并行或单独执行的处理。注意,在该说明书中,系统表示由多个单元构成的整体设备。
尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本公开的预定范围。此外,上文以发明人可预见的实施例对本公开进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。

Claims (8)

1.一种适于K-means算法的图像处理系统,其特征在于,所述系统包括:
获取单元,用于获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理单元,用于通过获取的无标签图像的数据集将无标签图像规范化处理;
分类单元,用于将预处理后的图像的数据集划分为训练集和验证集;
训练单元,用于将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;
处理单元,用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集。
2.根据权利要求1所述的一种适于K-means算法的图像处理系统,其特征在于,所述系统还包括:
筛选单元,用于使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。
3.一种适于K-means算法的图像处理方法,其特征在于,所述方法包括:
获取步骤,获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理步骤,通过获取的无标签图像的数据集将无标签图像规范化处理;
分类步骤,将预处理后的图像的数据集划分为训练集和验证集;
训练步骤,将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;
处理步骤,用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集。
4.根据权利要求3所述的一种适于K-means算法的图像处理方法,其特征在于,所述方法还包括:
筛选步骤,使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。
5.根据权利要求3所述的一种适于K-means算法的图像处理方法,其特征在于,预处理步骤中,通过获取的无标签图像的数据集将无标签图像规范化处理的方法为以下步骤:
A1,将所有的无标签图像的尺寸做规范化处理,即将所有的无标签图像的尺寸统一大小;
A2,将所有的无标签图像的像素做规范化处理,即将所有的无标签图像的像素调整为固定的数值区间。
6.根据权利要求5所述的一种适于K-means算法的图像处理方法,其特征在于,所述固定的数值区间为[-1,1]或者[0,1]。
7.根据权利要求3所述的一种适于K-means算法的图像处理方法,其特征在于,处理步骤中,将预处理后的图像的数据集划分为训练集和验证集的方法为:随机将75%的预处理后的图像的数据集划分为训练集,再将其余25%的预处理后的图像的数据集划分为验证集。
8.一种使计算机执行适于K-means算法的图像处理程序的介质,所述程序包括:
获取步骤,获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理步骤,通过获取的无标签图像的数据集将无标签图像规范化处理;
分类步骤,将预处理后的图像的数据集划分为训练集和验证集;
训练步骤,将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;
处理步骤,使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集;
筛选步骤,使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图的数据集。
CN202011059022.7A 2020-09-30 2020-09-30 一种适于K-means算法的图像处理系统和方法,及记录介质 Pending CN112215275A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011059022.7A CN112215275A (zh) 2020-09-30 2020-09-30 一种适于K-means算法的图像处理系统和方法,及记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011059022.7A CN112215275A (zh) 2020-09-30 2020-09-30 一种适于K-means算法的图像处理系统和方法,及记录介质

Publications (1)

Publication Number Publication Date
CN112215275A true CN112215275A (zh) 2021-01-12

Family

ID=74052424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011059022.7A Pending CN112215275A (zh) 2020-09-30 2020-09-30 一种适于K-means算法的图像处理系统和方法,及记录介质

Country Status (1)

Country Link
CN (1) CN112215275A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117407557A (zh) * 2023-12-13 2024-01-16 江西云眼视界科技股份有限公司 零样本实例分割方法、系统、可读存储介质及计算机

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016118286A1 (en) * 2015-01-22 2016-07-28 Microsoft Technology Licensing, Llc Optimizing multi-class image classification using patch features
CN109299707A (zh) * 2018-10-30 2019-02-01 天津师范大学 一种基于模糊深度聚类的无监督行人再识别方法
US20190080222A1 (en) * 2017-09-12 2019-03-14 Yonatan Glesner Per kernel kmeans compression for neural networks
CN109635946A (zh) * 2018-11-29 2019-04-16 华南理工大学 一种联合深度神经网络和成对约束的聚类方法
US20190164054A1 (en) * 2017-11-29 2019-05-30 International Business Machines Corporation Pre-training neural networks using data clusters
CN110909820A (zh) * 2019-12-02 2020-03-24 齐鲁工业大学 基于自监督学习的图像分类方法及系统
CN111259979A (zh) * 2020-02-10 2020-06-09 大连理工大学 一种基于标签自适应策略的深度半监督图像聚类方法
CN111444955A (zh) * 2020-03-25 2020-07-24 哈尔滨工程大学 一种基于类意识领域自适应的水下声纳图像无监督分类方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016118286A1 (en) * 2015-01-22 2016-07-28 Microsoft Technology Licensing, Llc Optimizing multi-class image classification using patch features
US20190080222A1 (en) * 2017-09-12 2019-03-14 Yonatan Glesner Per kernel kmeans compression for neural networks
US20190164054A1 (en) * 2017-11-29 2019-05-30 International Business Machines Corporation Pre-training neural networks using data clusters
CN109299707A (zh) * 2018-10-30 2019-02-01 天津师范大学 一种基于模糊深度聚类的无监督行人再识别方法
CN109635946A (zh) * 2018-11-29 2019-04-16 华南理工大学 一种联合深度神经网络和成对约束的聚类方法
CN110909820A (zh) * 2019-12-02 2020-03-24 齐鲁工业大学 基于自监督学习的图像分类方法及系统
CN111259979A (zh) * 2020-02-10 2020-06-09 大连理工大学 一种基于标签自适应策略的深度半监督图像聚类方法
CN111444955A (zh) * 2020-03-25 2020-07-24 哈尔滨工程大学 一种基于类意识领域自适应的水下声纳图像无监督分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BO YANG等: "Towards K-means-friendly Spaces: Simultaneous Deep Learning and Clustering", 《ARXIV:1610.04794V2 [CS.LG]》, pages 2 - 4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117407557A (zh) * 2023-12-13 2024-01-16 江西云眼视界科技股份有限公司 零样本实例分割方法、系统、可读存储介质及计算机
CN117407557B (zh) * 2023-12-13 2024-05-07 江西云眼视界科技股份有限公司 零样本实例分割方法、系统、可读存储介质及计算机

Similar Documents

Publication Publication Date Title
Bappy et al. Hybrid lstm and encoder–decoder architecture for detection of image forgeries
CN108664996B (zh) 一种基于深度学习的古文字识别方法及系统
JP5351958B2 (ja) デジタルコンテンツ記録のための意味論的イベント検出
CN110866896B (zh) 基于k-means与水平集超像素分割的图像显著性目标检测方法
Fan et al. Superpixel guided deep-sparse-representation learning for hyperspectral image classification
US20070195344A1 (en) System, apparatus, method, program and recording medium for processing image
CN111062314B (zh) 图像选取方法、装置、计算机可读存储介质及电子设备
CN110188829B (zh) 神经网络的训练方法、目标识别的方法及相关产品
CN112668519A (zh) 基于MCCAE网络和Deep SVDD网络的异常人脸识别活体检测方法及系统
CN113627402A (zh) 一种图像识别方法及相关装置
CN112052687A (zh) 基于深度可分离卷积的语义特征处理方法、装置及介质
CN110929099A (zh) 一种基于多任务学习的短视频帧语义提取方法及系统
Jabeen et al. A deep multimodal system for provenance filtering with universal forgery detection and localization
CN111882034A (zh) 神经网络处理及人脸识别方法、装置、设备和存储介质
Velliangira et al. A novel forgery detection in image frames of the videos using enhanced convolutional neural network in face images
Dagher et al. Improving the SVM gender classification accuracy using clustering and incremental learning
CN112215275A (zh) 一种适于K-means算法的图像处理系统和方法,及记录介质
Dixit et al. Utilization of edge operators for localization of copy-move image forgery using WLD-HOG features with connected component labeling
CN107369450A (zh) 收录方法和收录装置
Pavithra et al. Texture image classification and retrieval using multi-resolution radial gradient binary pattern
CN113554655B (zh) 基于多特征增强的光学遥感图像分割方法及装置
Alreshidi et al. A comparative study of image descriptors in recognizing human faces supported by distributed platforms
CN110427862B (zh) 一种人脸图片收集方法、装置及电子设备
Liu et al. Anti‐noise image source identification
Awad et al. A cbir-based evaluation framework for visual attention models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination