CN108985349B

CN108985349B - 一种考虑图像集复杂性的石材纹理图像cnn识别方法

Info

Publication number: CN108985349B
Application number: CN201810673021.8A
Authority: CN
Inventors: 钟尚平; 戴鹏; 陈开志
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2018-06-26
Filing date: 2018-06-26
Publication date: 2021-09-28
Anticipated expiration: 2038-06-26
Also published as: CN108985349A

Abstract

本发明涉及一种考虑图像集复杂性的石材纹理图像CNN识别方法，首先加载石材图像集；接着将石材图像集的复杂性量化为计算石材图像集的本征维数，使用小波图像去噪方法处理石材图像集中的每张石材图像以降低石材图像集复杂性；然后构建卷积神经网络，并使用去噪后的石材图像训练卷积神经网络；接着使用训练好的卷积神经网络模型识别石材图像；最后依据卷积神经网络模型的输出结果，选择最大的前5个值对应的石材类别，将其按照值从大到小的顺序依次作为前5类最相似石材。本发明将小波图像去噪结合卷积神经网络用以石材纹理图像识别，有效提高了识别的准确率。

Description

一种考虑图像集复杂性的石材纹理图像CNN识别方法

技术领域

本发明涉及图像识别领域，特别是一种考虑图像集复杂性的石材纹理图像CNN识别方法。

背景技术

随着中国经济的不断发展，使用石材进行装修装饰成为越来越多人的选择。然而，由于石材行业目前没有划分石材种类的统一标准，加之每年都有大量新的石材种类出现，导致石材类别管理混乱，用户难以获取到准确的石材信息。因此，市场迫切的需要有效的石材自动识别方法。

同时，由于石材纹理图像集具有较高的复杂性，因此，相比于其他图像集，不同类别的图像更难以被准确区分，只使用CNN方法也难以取得较好的识别效果。

发明内容

有鉴于此，本发明的目的是提出一种考虑图像集复杂性的石材纹理图像CNN识别方法。

本发明采用以下方案实现：一种考虑图像集复杂性的石材纹理图像CNN识别方法，具体包括以下步骤：

步骤S1：加载石材图像集；

步骤S2：将石材图像集的复杂性量化为计算石材图像集的本征维数，使用小波图像去噪方法处理石材图像集中的每张石材图像以降低石材图像集复杂性；

步骤S3：构建卷积神经网络，并使用步骤S2去噪后的石材图像训练卷积神经网络；

步骤S4：使用训练好的卷积神经网络模型识别石材图像；

步骤S5：依据步骤S4卷积神经网络模型的输出结果，选择最大的前5个值对应的石材类别，将其按照值从大到小的顺序依次作为前5类最相似石材。

进一步地，步骤S1中，所述石材图像集为各类石材图像所组成的集合，石材图像集中没有重复的石材图像并且每类石材包含的图像数量相同，石材图像集中每张石材图像均为128×128的彩色图像。

进一步地，步骤S2具体包括以下步骤：

步骤S21：采用最大似然估计计算得到石材图像集的本征维数，具体采用以下公式：

式中，x表示图像空间中的一张图像，T_j(x)代表图像x和距离它最近的第j个图像之间的欧氏距离，T_k(x)代表图像x和距离它最近的第k个图像之间的欧氏距离，n为从石材图像集中选出用于计算本征维数的图像x的数量，

表示每张图像x在固定该张图像并取距离它最近的第k个图像时(如：若取距离图像x最近的第6个图像，则k值为6，j为小于6的正整数)所对应的本征维数，X_i表示图像集中第i张图像(如2000张图像集中第一张图像为X₁)，

表示计算图像集中每张图像对应k值的本征维数的平均值，

表示最终的图像集本征维数，k₁表示所取的k值范围的最小值，k₂表示所取的k值范围的最大值(如k值取11-20，则k₁为11，k₂为20，需要计算11-20中每个k值对应的m_k值)；每张图像不重复且均从石材图像集中随机取出；

较佳的，k的取值一般为10-20；n的取值一般为2000.

步骤S22：将原图像矩阵从一个三通道矩阵按R、G、B通道分为三个单通道矩阵；

步骤S23：使用二维一阶小波变换分别处理三个单通道矩阵得到对应的低频分量、垂直高频分量、水平高频分量、以及对角线高频分量；将垂直高频分量、水平高频分量、对角线高频分量看做噪声进行去除，只选择低频分量重构回单通道矩阵；重复步骤S23一次后进入步骤S24；

步骤S24：将经过两次去噪后的三个单通道矩阵合并为一个去噪后三通道图像矩阵。

进一步地，步骤S3具体包括以下步骤：

步骤S31：所述卷积神经网络主体结构由5层卷积池化层加两层全连接层组成；卷积池化层中每个卷积层、池化层的核大小均为3×3，卷积层使用ReLU激活函数，在每个池化层之后进行BatchNormalization算法；全连接层的第一层使用ReLU激活函数，输出层使用softmax激活函数；由于神经网络的结构直接影响到最终的识别准确率，本发明通过大量实验，确定了神经网络结构。卷积池化层特征映射的个数与全连接层中神经元的个数主要取决于石材类别的数量。

步骤S32：使用去噪后石材图像训练步骤S31构建的卷积神经网络，在训练过程中使用SGD优化算法更新卷积神经网络的参数。

进一步地，步骤S4具体包括以下步骤：

步骤S41：选定待识别的石材图像；

步骤S42：对所述待识别的石材图像使用两次2维1阶小波去噪法获取去噪后图像；

步骤S43：使用步骤S3训练好的卷积神经网络识别步骤S42得到的去噪后图像。

较佳的，所述步骤S5即为依据步骤S4输出的结果数组，选择数组中前5个最大值对应石材类别作为前5类最相似石材，并依据数组值按从大到小顺序排列。

与现有技术相比，本发明有以下有益效果：

1、本发明将小波图像去噪结合卷积神经网络进行石材图像识别，首先将石材图像集复杂性量化为计算石材图像集本征维数，并使用小波图像去噪处理石材图像集的每张图像，以降低图像集的复杂性，随后使用去噪后石材图像训练卷积神经网络，有效的提高了识别的准确率。

2、本发明将卷积神经网络用于一对多图像识别，依据softmax激活函数输出结果获取与待识别石材图像最相似前5类石材，使之更贴合用户实际需求。

附图说明

图1为本发明实施例的卷积池化层具体结构。

图2为本发明实施例中石材图像集包含50类石材情况下流程与卷积神经网络结构图。

图3为本发明实施例中石材图像集包含50类石材情况下卷积神经网络输出示意图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

本实施例提供了一种考虑图像集复杂性的石材纹理图像CNN识别方法，具体包括以下步骤：

步骤S1：加载石材图像集；

步骤S4：使用训练好的卷积神经网络模型识别石材图像；

在本实施例中，步骤S1中，所述石材图像集为各类石材图像所组成的集合，石材图像集中没有重复的石材图像并且每类石材包含的图像数量相同，石材图像集中每张石材图像均为128×128的彩色图像。

在本实施例中，步骤S2具体包括以下步骤：

表示计算图像集中每张图像对应k值的本征维数的平均值，

较佳的，在本实施例中，k的取值一般为10-20；n的取值一般为2000.

由于小波变换一般用于处理2维矩阵，而图像加载后为一个三通道矩阵即三维矩阵，因此，首先需要将图像分解为三个单通道2维矩阵。

在本实施例中，步骤S3具体包括以下步骤：

步骤S31：所述卷积神经网络主体结构由5层卷积池化层加两层全连接层组成；卷积池化层中每个卷积层、池化层的核大小均为3×3，卷积层使用ReLU激活函数，在每个池化层之后进行BatchNormalization算法；全连接层的第一层使用ReLU激活函数，输出层使用softmax激活函数；由于神经网络的结构直接影响到最终的识别准确率，本发明通过大量实验，确定了神经网络结构。其中每层卷积池化层具体结构如图1所示。卷积池化层特征映射的个数与全连接层中神经元的个数主要取决于石材类别的数量。以50类石材为例，第1-2层卷积池化层特征映射数量为128，第3-5层卷积池化层的特征映射数量为256。全连接层的第一层包含256个神经元，输出层包含50个神经元，如图2所示。

本实施例推荐SGD算法学习率为0.01，迭代300轮，批大小依据石材类别数量调整，以50类石材为例，批大小为100。

在本实施例中，步骤S4具体包括以下步骤：

步骤S41：选定待识别的石材图像；

较佳的，在本实施例中，所述步骤S5即为依据步骤S4输出的结果数组，其中结果数据如图3所示，选择数组中前5个最大值对应石材类别作为前5类最相似石材，并依据数组值按从大到小顺序排列。

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。