CN112215275A - 一种适于K-means算法的图像处理系统和方法,及记录介质 - Google Patents
一种适于K-means算法的图像处理系统和方法,及记录介质 Download PDFInfo
- Publication number
- CN112215275A CN112215275A CN202011059022.7A CN202011059022A CN112215275A CN 112215275 A CN112215275 A CN 112215275A CN 202011059022 A CN202011059022 A CN 202011059022A CN 112215275 A CN112215275 A CN 112215275A
- Authority
- CN
- China
- Prior art keywords
- data set
- image
- unlabeled
- training
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种适于K‑means算法的图像处理系统和方法,及其记录介质,所述系统包括:获取单元,用于获取无标签图像的数据集;预处理单元,用于通过获取的无标签图像的数据集将无标签图像规范化处理;分类单元,用于将预处理后的图像的数据集划分为训练集和验证集;训练单元,用于将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;处理单元,用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集;筛选单元,用于使用K‑means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。本公开克服了传统的聚类算法无法直接处理高维度图像的缺点。本发明适用于图像处理技术领域。
Description
技术领域
本公开涉及图像处理系统和方法,及其记录介质,并且特别涉及适于K-means算法的图像处理系统和方法,及其记录介质。
背景技术
近年来,随着信息技术的高速发展以及摄像机、手机等图像采集设备的普及,图像信息充斥在世界的每一个角落,用其清晰、简单的方式描述着日常生活的方方面面。比如,用图像描述情感(朋友圈的图像信息),家庭影集的管理,医学图像检索,人脸识别及网络购物、旅游评论等。图像信息的处理也面临了巨大的挑战,比如如何才可以从海量的无标签图像数据中筛选出具有相似性的属性。传统的图像处理方法由于图像数据维度较高,传统的聚类算法无法直接处理。
发明内容
本发明就是在如上所述的这种情况下提出来的,更具体地说,一方面,本公开的处理系统包括:
获取单元,用于获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理单元,用于通过获取的无标签图像的数据集将无标签图像规范化处理;
分类单元,用于将预处理后的图像的数据集划分为训练集和验证集;
训练单元,用于将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行
训练;
处理单元,用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集。
具体的,所述处理系统还包括:
筛选单元,用于使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。
另一方面,本公开的方法包括:获取步骤,获取无标签图像的数据集,所述数据集包括多个无标签图像;预处理步骤,通过获取的无标签图像的数据集将无标签图像规范化处理;分类步骤,将预处理后的图像的数据集划分为训练集和验证集;训练步骤,将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;处理步骤,使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集;和筛选步骤,使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。
具体的,预处理步骤中,通过获取的无标签图像的数据集将无标签图像规范化处理的方法的步骤为:
A1,将所有的无标签图像的尺寸做规范化处理,即将所有的无标签图像的尺寸统一大小;
A2,将所有的无标签图像的像素做规范化处理,即将所有的无标签图像的像素调整为固定的数值区间。
具体的,所述固定的数值区间为[-1,1]或者[0,1]。
具体的,处理步骤中,将预处理后的图像的数据集划分为训练集和验证集的方法为:随机将75%的预处理后的图像的数据集划分为训练集,再将其余25%的预处理后的图像的数据集划分为验证集。
另一方面,采用本公开的介质,以便记录程序,该程序包括:
获取步骤,获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理步骤,通过获取的无标签图像的数据集将无标签图像规范化处理;
分类步骤,将预处理后的图像的数据集划分为训练集和验证集;
训练步骤,将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;
处理步骤,使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集;
筛选步骤,使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图的数据集。
在已经描述的处理系统、处理方法和介质中,确定对应于处理系统的命令,从而,执行对应于确定命令的处理。
本公开的有益效果为:本公开提供了一种结合DCN模型和K-means算法对海量的图像进行处理的系统和方法,及其介质,克服了传统的聚类算法无法直接处理高维度图像的缺点。
要理解的是,前面的一般描述和下面的详细描述两者都是示例性的,并且意图在于提供要求保护的技术的进一步说明。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为本公开实施例提供的一种适于K-means算法的图像处理方法流程图。
具体实施方式
下面将结合本公开实施例中的附图对本公开实施例中技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部实施例。通常在此处幅图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性的劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本公开的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
作为一个实施例,本公开提出了一种适于K-means算法的图像处理系统,所述系统包括:
获取单元,用于获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理单元,用于通过获取的无标签图像的数据集将无标签图像规范化处理;
分类单元,用于将预处理后的图像的数据集划分为训练集和验证集;
训练单元,用于将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;
处理单元,用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集。
具体的,所述处理系统还包括:
筛选单元,用于使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。
作为另一个实施例,本公开还提出了一种适于K-means算法的图像处理方法,图1所示为本公开实施例提供的一种适于K-means算法的图像处理方法流程图,如图1所示,所述方法包括:获取步骤100,获取无标签图像的数据集,所述数据集包括多个无标签图像;预处理步骤200,通过获取的无标签图像的数据集将无标签图像规范化处理;分类步骤300,将预处理后的图像的数据集划分为训练集和验证集;训练步骤400,将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;处理步骤500,使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集;和筛选步骤600,使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。
具体的,预处理步骤中,通过获取的无标签图像的数据集将无标签图像规范化处理的方法的步骤为:
A1,将所有的无标签图像的尺寸做规范化处理,即将所有的无标签图像的尺寸统一大小;
A2,将所有的无标签图像的像素做规范化处理,即将所有的无标签图像的像素调整为固定的数值区间。
具体的,所述固定的数值区间为[-1,1]或者[0,1]。
具体的,处理步骤中,将预处理后的图像的数据集划分为训练集和验证集的方法为:随机将75%的预处理后的图像的数据集划分为训练集,再将其余25%的预处理后的图像的数据集划分为验证集。
具体的,所述DCN模型的损失函数为:
其中,函数f()和g()分别为DCN模型编码层和解码层的输出函数,W和W’分别表示f()和g()的参数集,Z为隐藏层特征矩阵,M为质心,Si为数值i的赋值向量(assignmentvector),Si,j为Si的第j个元素,i和j为大于0的自然数,λ为重要性参数。具体请参见参考文献:B.Yang,X.Fu,N.D.Sidiropoulos,and M.Hong.Towards K-means-friendly Spaces:Simultaneous Deep Learning and Clustering.In Proceedings of ICML,ICML'17,pages 3861–3870,2017。
作为另一个实施例,本公开还提出了一种介质,以便记录程序,该程序包括:
获取步骤,获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理步骤,通过获取的无标签图像的数据集将无标签图像规范化处理;
分类步骤,将预处理后的图像的数据集划分为训练集和验证集;
训练步骤,将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;
处理步骤,使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集;
筛选步骤,使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图程序可以以无线方式通过用于数字卫星广播的人造卫星从下载站点传送到计算机,或以有线方式通过诸如局域网或因特网网络传送到计算机,并且存储到包括在计算机内的硬盘上。
在该说明书中的介质指包括这些所有介质的广义概念。
此外,在改说明书中,用于描述介质提供的程序的步骤不仅包括以时间序列方式按照上述的次序执行的处理,而且包括即使该程序不以时间序列方式处理也能够并行或单独执行的处理。注意,在该说明书中,系统表示由多个单元构成的整体设备。
尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本公开的预定范围。此外,上文以发明人可预见的实施例对本公开进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。
Claims (8)
1.一种适于K-means算法的图像处理系统,其特征在于,所述系统包括:
获取单元,用于获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理单元,用于通过获取的无标签图像的数据集将无标签图像规范化处理;
分类单元,用于将预处理后的图像的数据集划分为训练集和验证集;
训练单元,用于将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;
处理单元,用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集。
2.根据权利要求1所述的一种适于K-means算法的图像处理系统,其特征在于,所述系统还包括:
筛选单元,用于使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。
3.一种适于K-means算法的图像处理方法,其特征在于,所述方法包括:
获取步骤,获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理步骤,通过获取的无标签图像的数据集将无标签图像规范化处理;
分类步骤,将预处理后的图像的数据集划分为训练集和验证集;
训练步骤,将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;
处理步骤,用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集。
4.根据权利要求3所述的一种适于K-means算法的图像处理方法,其特征在于,所述方法还包括:
筛选步骤,使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图像的数据集。
5.根据权利要求3所述的一种适于K-means算法的图像处理方法,其特征在于,预处理步骤中,通过获取的无标签图像的数据集将无标签图像规范化处理的方法为以下步骤:
A1,将所有的无标签图像的尺寸做规范化处理,即将所有的无标签图像的尺寸统一大小;
A2,将所有的无标签图像的像素做规范化处理,即将所有的无标签图像的像素调整为固定的数值区间。
6.根据权利要求5所述的一种适于K-means算法的图像处理方法,其特征在于,所述固定的数值区间为[-1,1]或者[0,1]。
7.根据权利要求3所述的一种适于K-means算法的图像处理方法,其特征在于,处理步骤中,将预处理后的图像的数据集划分为训练集和验证集的方法为:随机将75%的预处理后的图像的数据集划分为训练集,再将其余25%的预处理后的图像的数据集划分为验证集。
8.一种使计算机执行适于K-means算法的图像处理程序的介质,所述程序包括:
获取步骤,获取无标签图像的数据集,所述数据集包括多个无标签图像;
预处理步骤,通过获取的无标签图像的数据集将无标签图像规范化处理;
分类步骤,将预处理后的图像的数据集划分为训练集和验证集;
训练步骤,将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练;
处理步骤,使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集;
筛选步骤,使用K-means算法处理特征数据集,从中筛选出具有相似性的无标签图的数据集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011059022.7A CN112215275A (zh) | 2020-09-30 | 2020-09-30 | 一种适于K-means算法的图像处理系统和方法,及记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011059022.7A CN112215275A (zh) | 2020-09-30 | 2020-09-30 | 一种适于K-means算法的图像处理系统和方法,及记录介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112215275A true CN112215275A (zh) | 2021-01-12 |
Family
ID=74052424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011059022.7A Pending CN112215275A (zh) | 2020-09-30 | 2020-09-30 | 一种适于K-means算法的图像处理系统和方法,及记录介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112215275A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407557A (zh) * | 2023-12-13 | 2024-01-16 | 江西云眼视界科技股份有限公司 | 零样本实例分割方法、系统、可读存储介质及计算机 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016118286A1 (en) * | 2015-01-22 | 2016-07-28 | Microsoft Technology Licensing, Llc | Optimizing multi-class image classification using patch features |
CN109299707A (zh) * | 2018-10-30 | 2019-02-01 | 天津师范大学 | 一种基于模糊深度聚类的无监督行人再识别方法 |
US20190080222A1 (en) * | 2017-09-12 | 2019-03-14 | Yonatan Glesner | Per kernel kmeans compression for neural networks |
CN109635946A (zh) * | 2018-11-29 | 2019-04-16 | 华南理工大学 | 一种联合深度神经网络和成对约束的聚类方法 |
US20190164054A1 (en) * | 2017-11-29 | 2019-05-30 | International Business Machines Corporation | Pre-training neural networks using data clusters |
CN110909820A (zh) * | 2019-12-02 | 2020-03-24 | 齐鲁工业大学 | 基于自监督学习的图像分类方法及系统 |
CN111259979A (zh) * | 2020-02-10 | 2020-06-09 | 大连理工大学 | 一种基于标签自适应策略的深度半监督图像聚类方法 |
CN111444955A (zh) * | 2020-03-25 | 2020-07-24 | 哈尔滨工程大学 | 一种基于类意识领域自适应的水下声纳图像无监督分类方法 |
-
2020
- 2020-09-30 CN CN202011059022.7A patent/CN112215275A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016118286A1 (en) * | 2015-01-22 | 2016-07-28 | Microsoft Technology Licensing, Llc | Optimizing multi-class image classification using patch features |
US20190080222A1 (en) * | 2017-09-12 | 2019-03-14 | Yonatan Glesner | Per kernel kmeans compression for neural networks |
US20190164054A1 (en) * | 2017-11-29 | 2019-05-30 | International Business Machines Corporation | Pre-training neural networks using data clusters |
CN109299707A (zh) * | 2018-10-30 | 2019-02-01 | 天津师范大学 | 一种基于模糊深度聚类的无监督行人再识别方法 |
CN109635946A (zh) * | 2018-11-29 | 2019-04-16 | 华南理工大学 | 一种联合深度神经网络和成对约束的聚类方法 |
CN110909820A (zh) * | 2019-12-02 | 2020-03-24 | 齐鲁工业大学 | 基于自监督学习的图像分类方法及系统 |
CN111259979A (zh) * | 2020-02-10 | 2020-06-09 | 大连理工大学 | 一种基于标签自适应策略的深度半监督图像聚类方法 |
CN111444955A (zh) * | 2020-03-25 | 2020-07-24 | 哈尔滨工程大学 | 一种基于类意识领域自适应的水下声纳图像无监督分类方法 |
Non-Patent Citations (1)
Title |
---|
BO YANG等: "Towards K-means-friendly Spaces: Simultaneous Deep Learning and Clustering", 《ARXIV:1610.04794V2 [CS.LG]》, pages 2 - 4 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407557A (zh) * | 2023-12-13 | 2024-01-16 | 江西云眼视界科技股份有限公司 | 零样本实例分割方法、系统、可读存储介质及计算机 |
CN117407557B (zh) * | 2023-12-13 | 2024-05-07 | 江西云眼视界科技股份有限公司 | 零样本实例分割方法、系统、可读存储介质及计算机 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108664996B (zh) | 一种基于深度学习的古文字识别方法及系统 | |
US9721148B2 (en) | Face detection and recognition | |
US20180046855A1 (en) | Face detection and recognition | |
US7884847B2 (en) | System, apparatus, method, program and recording medium for processing image | |
Fourati et al. | Anti-spoofing in face recognition-based biometric authentication using image quality assessment | |
US20150131872A1 (en) | Face detection and recognition | |
US20070216709A1 (en) | Display control apparatus, display control method, computer program, and recording medium | |
Fan et al. | Superpixel guided deep-sparse-representation learning for hyperspectral image classification | |
US20070195344A1 (en) | System, apparatus, method, program and recording medium for processing image | |
CN111062314B (zh) | 图像选取方法、装置、计算机可读存储介质及电子设备 | |
CN110188829B (zh) | 神经网络的训练方法、目标识别的方法及相关产品 | |
JP2011525012A (ja) | デジタルコンテンツ記録のための意味論的イベント検出 | |
CN110866896A (zh) | 基于k-means与水平集超像素分割的图像显著性目标检测方法 | |
CN113627402B (zh) | 一种图像识别方法及相关装置 | |
CN110502664A (zh) | 视频标签索引库创建方法、视频标签生成方法及装置 | |
CN113762138A (zh) | 伪造人脸图片的识别方法、装置、计算机设备及存储介质 | |
CN113052168A (zh) | 基于多源特征融合的农作物病虫害图像识别方法 | |
CN114419391A (zh) | 目标图像识别方法及装置、电子设备及可读存储介质 | |
Velliangira et al. | A novel forgery detection in image frames of the videos using enhanced convolutional neural network in face images | |
Jabeen et al. | A deep multimodal system for provenance filtering with universal forgery detection and localization | |
CN112215275A (zh) | 一种适于K-means算法的图像处理系统和方法,及记录介质 | |
Strat et al. | Retina enhanced SIFT descriptors for video indexing | |
Dixit et al. | Utilization of edge operators for localization of copy-move image forgery using WLD-HOG features with connected component labeling | |
CN111178409B (zh) | 基于大数据矩阵稳定性分析的图像匹配与识别系统 | |
CN112070009B (zh) | 基于改进的lbp算子的卷积神经网络表情识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |