CN112215275A

CN112215275A - 一种适于K-means算法的图像处理系统和方法，及记录介质

Info

Publication number: CN112215275A
Application number: CN202011059022.7A
Authority: CN
Inventors: 陈锐; 张彩霞; 袁国文; 李纲
Original assignee: Foshan University
Current assignee: Foshan University
Priority date: 2020-09-30
Filing date: 2020-09-30
Publication date: 2021-01-12

Abstract

本发明公开了一种适于K‑means算法的图像处理系统和方法，及其记录介质，所述系统包括：获取单元，用于获取无标签图像的数据集；预处理单元，用于通过获取的无标签图像的数据集将无标签图像规范化处理；分类单元，用于将预处理后的图像的数据集划分为训练集和验证集；训练单元，用于将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练；处理单元，用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集；筛选单元，用于使用K‑means算法处理特征数据集，从中筛选出具有相似性的无标签图像的数据集。本公开克服了传统的聚类算法无法直接处理高维度图像的缺点。本发明适用于图像处理技术领域。

Description

一种适于K-means算法的图像处理系统和方法，及记录介质

技术领域

本公开涉及图像处理系统和方法，及其记录介质，并且特别涉及适于K-means算法的图像处理系统和方法，及其记录介质。

背景技术

近年来，随着信息技术的高速发展以及摄像机、手机等图像采集设备的普及，图像信息充斥在世界的每一个角落，用其清晰、简单的方式描述着日常生活的方方面面。比如，用图像描述情感(朋友圈的图像信息)，家庭影集的管理，医学图像检索，人脸识别及网络购物、旅游评论等。图像信息的处理也面临了巨大的挑战，比如如何才可以从海量的无标签图像数据中筛选出具有相似性的属性。传统的图像处理方法由于图像数据维度较高，传统的聚类算法无法直接处理。

发明内容

本发明就是在如上所述的这种情况下提出来的，更具体地说，一方面，本公开的处理系统包括：

获取单元，用于获取无标签图像的数据集，所述数据集包括多个无标签图像；

预处理单元，用于通过获取的无标签图像的数据集将无标签图像规范化处理；

分类单元，用于将预处理后的图像的数据集划分为训练集和验证集；

训练单元，用于将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行

训练；

处理单元，用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集。

具体的，所述处理系统还包括：

筛选单元，用于使用K-means算法处理特征数据集，从中筛选出具有相似性的无标签图像的数据集。

另一方面，本公开的方法包括：获取步骤，获取无标签图像的数据集，所述数据集包括多个无标签图像；预处理步骤，通过获取的无标签图像的数据集将无标签图像规范化处理；分类步骤，将预处理后的图像的数据集划分为训练集和验证集；训练步骤，将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练；处理步骤，使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集；和筛选步骤，使用K-means算法处理特征数据集，从中筛选出具有相似性的无标签图像的数据集。

具体的，预处理步骤中，通过获取的无标签图像的数据集将无标签图像规范化处理的方法的步骤为：

A1,将所有的无标签图像的尺寸做规范化处理，即将所有的无标签图像的尺寸统一大小；

A2，将所有的无标签图像的像素做规范化处理，即将所有的无标签图像的像素调整为固定的数值区间。

具体的，所述固定的数值区间为[-1,1]或者[0,1]。

具体的，处理步骤中，将预处理后的图像的数据集划分为训练集和验证集的方法为：随机将75％的预处理后的图像的数据集划分为训练集，再将其余25％的预处理后的图像的数据集划分为验证集。

另一方面，采用本公开的介质，以便记录程序，该程序包括：

获取步骤，获取无标签图像的数据集，所述数据集包括多个无标签图像；

预处理步骤，通过获取的无标签图像的数据集将无标签图像规范化处理；

分类步骤，将预处理后的图像的数据集划分为训练集和验证集；

训练步骤，将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练；

处理步骤，使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集；

筛选步骤，使用K-means算法处理特征数据集，从中筛选出具有相似性的无标签图的数据集。

在已经描述的处理系统、处理方法和介质中，确定对应于处理系统的命令，从而，执行对应于确定命令的处理。

本公开的有益效果为：本公开提供了一种结合DCN模型和K-means算法对海量的图像进行处理的系统和方法，及其介质，克服了传统的聚类算法无法直接处理高维度图像的缺点。

要理解的是，前面的一般描述和下面的详细描述两者都是示例性的，并且意图在于提供要求保护的技术的进一步说明。

附图说明

通过对结合附图所示出的实施方式进行详细说明，本公开的上述以及其他特征将更加明显，本公开附图中相同的参考标号表示相同或相似的元素，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，在附图中：

图1所示为本公开实施例提供的一种适于K-means算法的图像处理方法流程图。

具体实施方式

下面将结合本公开实施例中的附图对本公开实施例中技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部实施例。通常在此处幅图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围，而是仅仅表示本公开的选定实施例。基于本公开的实施例，本领域技术人员在没有做出创造性的劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本公开的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

作为一个实施例，本公开提出了一种适于K-means算法的图像处理系统，所述系统包括：

训练单元，用于将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练；

具体的，所述处理系统还包括：

作为另一个实施例，本公开还提出了一种适于K-means算法的图像处理方法，图1所示为本公开实施例提供的一种适于K-means算法的图像处理方法流程图，如图1所示，所述方法包括：获取步骤100，获取无标签图像的数据集，所述数据集包括多个无标签图像；预处理步骤200，通过获取的无标签图像的数据集将无标签图像规范化处理；分类步骤300，将预处理后的图像的数据集划分为训练集和验证集；训练步骤400，将被划分为训练集的预处理后的图像的数据集输入到DCN模型进行训练；处理步骤500，使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集；和筛选步骤600，使用K-means算法处理特征数据集，从中筛选出具有相似性的无标签图像的数据集。

具体的，所述固定的数值区间为[-1,1]或者[0,1]。

具体的，所述DCN模型的损失函数为：

其中，函数f()和g()分别为DCN模型编码层和解码层的输出函数，W和W’分别表示f()和g()的参数集，Z为隐藏层特征矩阵，M为质心，S_i为数值i的赋值向量(assignmentvector)，S_i,j为S_i的第j个元素，i和j为大于0的自然数，λ为重要性参数。具体请参见参考文献：B.Yang,X.Fu,N.D.Sidiropoulos,and M.Hong.Towards K-means-friendly Spaces:Simultaneous Deep Learning and Clustering.In Proceedings of ICML,ICML'17,pages 3861–3870,2017。

作为另一个实施例，本公开还提出了一种介质，以便记录程序，该程序包括：

筛选步骤，使用K-means算法处理特征数据集，从中筛选出具有相似性的无标签图程序可以以无线方式通过用于数字卫星广播的人造卫星从下载站点传送到计算机，或以有线方式通过诸如局域网或因特网网络传送到计算机，并且存储到包括在计算机内的硬盘上。

在该说明书中的介质指包括这些所有介质的广义概念。

此外，在改说明书中，用于描述介质提供的程序的步骤不仅包括以时间序列方式按照上述的次序执行的处理，而且包括即使该程序不以时间序列方式处理也能够并行或单独执行的处理。注意，在该说明书中，系统表示由多个单元构成的整体设备。

尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述，但其并非旨在局限于任何这些细节或实施例或任何特殊实施例，而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释，从而有效地涵盖本公开的预定范围。此外，上文以发明人可预见的实施例对本公开进行描述，其目的是为了提供有用的描述，而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。

Claims

1.一种适于K-means算法的图像处理系统，其特征在于，所述系统包括：

2.根据权利要求1所述的一种适于K-means算法的图像处理系统，其特征在于，所述系统还包括：

3.一种适于K-means算法的图像处理方法，其特征在于，所述方法包括：

处理步骤，用于使用训练好的DCN模型处理新获得的无标签图像的数据集得到特征数据集。

4.根据权利要求3所述的一种适于K-means算法的图像处理方法，其特征在于，所述方法还包括：

筛选步骤，使用K-means算法处理特征数据集，从中筛选出具有相似性的无标签图像的数据集。

5.根据权利要求3所述的一种适于K-means算法的图像处理方法，其特征在于，预处理步骤中，通过获取的无标签图像的数据集将无标签图像规范化处理的方法为以下步骤：

6.根据权利要求5所述的一种适于K-means算法的图像处理方法，其特征在于，所述固定的数值区间为[-1,1]或者[0,1]。

7.根据权利要求3所述的一种适于K-means算法的图像处理方法，其特征在于，处理步骤中，将预处理后的图像的数据集划分为训练集和验证集的方法为：随机将75％的预处理后的图像的数据集划分为训练集，再将其余25％的预处理后的图像的数据集划分为验证集。

8.一种使计算机执行适于K-means算法的图像处理程序的介质，所述程序包括：