CN108985349B - 一种考虑图像集复杂性的石材纹理图像cnn识别方法 - Google Patents

一种考虑图像集复杂性的石材纹理图像cnn识别方法 Download PDF

Info

Publication number
CN108985349B
CN108985349B CN201810673021.8A CN201810673021A CN108985349B CN 108985349 B CN108985349 B CN 108985349B CN 201810673021 A CN201810673021 A CN 201810673021A CN 108985349 B CN108985349 B CN 108985349B
Authority
CN
China
Prior art keywords
image
stone
image set
neural network
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810673021.8A
Other languages
English (en)
Other versions
CN108985349A (zh
Inventor
钟尚平
戴鹏
陈开志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201810673021.8A priority Critical patent/CN108985349B/zh
Publication of CN108985349A publication Critical patent/CN108985349A/zh
Application granted granted Critical
Publication of CN108985349B publication Critical patent/CN108985349B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及一种考虑图像集复杂性的石材纹理图像CNN识别方法,首先加载石材图像集;接着将石材图像集的复杂性量化为计算石材图像集的本征维数,使用小波图像去噪方法处理石材图像集中的每张石材图像以降低石材图像集复杂性;然后构建卷积神经网络,并使用去噪后的石材图像训练卷积神经网络;接着使用训练好的卷积神经网络模型识别石材图像;最后依据卷积神经网络模型的输出结果,选择最大的前5个值对应的石材类别,将其按照值从大到小的顺序依次作为前5类最相似石材。本发明将小波图像去噪结合卷积神经网络用以石材纹理图像识别,有效提高了识别的准确率。

Description

一种考虑图像集复杂性的石材纹理图像CNN识别方法
技术领域
本发明涉及图像识别领域,特别是一种考虑图像集复杂性的石材纹理图像CNN识别方法。
背景技术
随着中国经济的不断发展,使用石材进行装修装饰成为越来越多人的选择。然而,由于石材行业目前没有划分石材种类的统一标准,加之每年都有大量新的石材种类出现,导致石材类别管理混乱,用户难以获取到准确的石材信息。因此,市场迫切的需要有效的石材自动识别方法。
同时,由于石材纹理图像集具有较高的复杂性,因此,相比于其他图像集,不同类别的图像更难以被准确区分,只使用CNN方法也难以取得较好的识别效果。
发明内容
有鉴于此,本发明的目的是提出一种考虑图像集复杂性的石材纹理图像CNN识别方法。
本发明采用以下方案实现:一种考虑图像集复杂性的石材纹理图像CNN识别方法,具体包括以下步骤:
步骤S1:加载石材图像集;
步骤S2:将石材图像集的复杂性量化为计算石材图像集的本征维数,使用小波图像去噪方法处理石材图像集中的每张石材图像以降低石材图像集复杂性;
步骤S3:构建卷积神经网络,并使用步骤S2去噪后的石材图像训练卷积神经网络;
步骤S4:使用训练好的卷积神经网络模型识别石材图像;
步骤S5:依据步骤S4卷积神经网络模型的输出结果,选择最大的前5个值对应的石材类别,将其按照值从大到小的顺序依次作为前5类最相似石材。
进一步地,步骤S1中,所述石材图像集为各类石材图像所组成的集合,石材图像集中没有重复的石材图像并且每类石材包含的图像数量相同,石材图像集中每张石材图像均为128×128的彩色图像。
进一步地,步骤S2具体包括以下步骤:
步骤S21:采用最大似然估计计算得到石材图像集的本征维数,具体采用以下公式:
Figure BDA0001709021780000021
Figure BDA0001709021780000022
Figure BDA0001709021780000023
式中,x表示图像空间中的一张图像,Tj(x)代表图像x和距离它最近的第j个图像之间的欧氏距离,Tk(x)代表图像x和距离它最近的第k个图像之间的欧氏距离,n为从石材图像集中选出用于计算本征维数的图像x的数量,
Figure BDA0001709021780000024
表示每张图像x在固定该张图像并取距离它最近的第k个图像时(如:若取距离图像x最近的第6个图像,则k值为6,j为小于6的正整数)所对应的本征维数,Xi表示图像集中第i张图像(如2000张图像集中第一张图像为X1),
Figure BDA0001709021780000025
表示计算图像集中每张图像对应k值的本征维数的平均值,
Figure BDA0001709021780000026
表示最终的图像集本征维数,k1表示所取的k值范围的最小值,k2表示所取的k值范围的最大值(如k值取11-20,则k1为11,k2为20,需要计算11-20中每个k值对应的mk值);每张图像不重复且均从石材图像集中随机取出;
较佳的,k的取值一般为10-20;n的取值一般为2000.
步骤S22:将原图像矩阵从一个三通道矩阵按R、G、B通道分为三个单通道矩阵;
步骤S23:使用二维一阶小波变换分别处理三个单通道矩阵得到对应的低频分量、垂直高频分量、水平高频分量、以及对角线高频分量;将垂直高频分量、水平高频分量、对角线高频分量看做噪声进行去除,只选择低频分量重构回单通道矩阵;重复步骤S23一次后进入步骤S24;
步骤S24:将经过两次去噪后的三个单通道矩阵合并为一个去噪后三通道图像矩阵。
进一步地,步骤S3具体包括以下步骤:
步骤S31:所述卷积神经网络主体结构由5层卷积池化层加两层全连接层组成;卷积池化层中每个卷积层、池化层的核大小均为3×3,卷积层使用ReLU激活函数,在每个池化层之后进行BatchNormalization算法;全连接层的第一层使用ReLU激活函数,输出层使用softmax激活函数;由于神经网络的结构直接影响到最终的识别准确率,本发明通过大量实验,确定了神经网络结构。卷积池化层特征映射的个数与全连接层中神经元的个数主要取决于石材类别的数量。
步骤S32:使用去噪后石材图像训练步骤S31构建的卷积神经网络,在训练过程中使用SGD优化算法更新卷积神经网络的参数。
进一步地,步骤S4具体包括以下步骤:
步骤S41:选定待识别的石材图像;
步骤S42:对所述待识别的石材图像使用两次2维1阶小波去噪法获取去噪后图像;
步骤S43:使用步骤S3训练好的卷积神经网络识别步骤S42得到的去噪后图像。
较佳的,所述步骤S5即为依据步骤S4输出的结果数组,选择数组中前5个最大值对应石材类别作为前5类最相似石材,并依据数组值按从大到小顺序排列。
与现有技术相比,本发明有以下有益效果:
1、本发明将小波图像去噪结合卷积神经网络进行石材图像识别,首先将石材图像集复杂性量化为计算石材图像集本征维数,并使用小波图像去噪处理石材图像集的每张图像,以降低图像集的复杂性,随后使用去噪后石材图像训练卷积神经网络,有效的提高了识别的准确率。
2、本发明将卷积神经网络用于一对多图像识别,依据softmax激活函数输出结果获取与待识别石材图像最相似前5类石材,使之更贴合用户实际需求。
附图说明
图1为本发明实施例的卷积池化层具体结构。
图2为本发明实施例中石材图像集包含50类石材情况下流程与卷积神经网络结构图。
图3为本发明实施例中石材图像集包含50类石材情况下卷积神经网络输出示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本实施例提供了一种考虑图像集复杂性的石材纹理图像CNN识别方法,具体包括以下步骤:
步骤S1:加载石材图像集;
步骤S2:将石材图像集的复杂性量化为计算石材图像集的本征维数,使用小波图像去噪方法处理石材图像集中的每张石材图像以降低石材图像集复杂性;
步骤S3:构建卷积神经网络,并使用步骤S2去噪后的石材图像训练卷积神经网络;
步骤S4:使用训练好的卷积神经网络模型识别石材图像;
步骤S5:依据步骤S4卷积神经网络模型的输出结果,选择最大的前5个值对应的石材类别,将其按照值从大到小的顺序依次作为前5类最相似石材。
在本实施例中,步骤S1中,所述石材图像集为各类石材图像所组成的集合,石材图像集中没有重复的石材图像并且每类石材包含的图像数量相同,石材图像集中每张石材图像均为128×128的彩色图像。
在本实施例中,步骤S2具体包括以下步骤:
步骤S21:采用最大似然估计计算得到石材图像集的本征维数,具体采用以下公式:
Figure BDA0001709021780000051
Figure BDA0001709021780000052
Figure BDA0001709021780000053
式中,x表示图像空间中的一张图像,Tj(x)代表图像x和距离它最近的第j个图像之间的欧氏距离,Tk(x)代表图像x和距离它最近的第k个图像之间的欧氏距离,n为从石材图像集中选出用于计算本征维数的图像x的数量,
Figure BDA0001709021780000061
表示每张图像x在固定该张图像并取距离它最近的第k个图像时(如:若取距离图像x最近的第6个图像,则k值为6,j为小于6的正整数)所对应的本征维数,Xi表示图像集中第i张图像(如2000张图像集中第一张图像为X1),
Figure BDA0001709021780000062
表示计算图像集中每张图像对应k值的本征维数的平均值,
Figure BDA0001709021780000063
表示最终的图像集本征维数,k1表示所取的k值范围的最小值,k2表示所取的k值范围的最大值(如k值取11-20,则k1为11,k2为20,需要计算11-20中每个k值对应的mk值);每张图像不重复且均从石材图像集中随机取出;
较佳的,在本实施例中,k的取值一般为10-20;n的取值一般为2000.
步骤S22:将原图像矩阵从一个三通道矩阵按R、G、B通道分为三个单通道矩阵;
由于小波变换一般用于处理2维矩阵,而图像加载后为一个三通道矩阵即三维矩阵,因此,首先需要将图像分解为三个单通道2维矩阵。
步骤S23:使用二维一阶小波变换分别处理三个单通道矩阵得到对应的低频分量、垂直高频分量、水平高频分量、以及对角线高频分量;将垂直高频分量、水平高频分量、对角线高频分量看做噪声进行去除,只选择低频分量重构回单通道矩阵;重复步骤S23一次后进入步骤S24;
步骤S24:将经过两次去噪后的三个单通道矩阵合并为一个去噪后三通道图像矩阵。
在本实施例中,步骤S3具体包括以下步骤:
步骤S31:所述卷积神经网络主体结构由5层卷积池化层加两层全连接层组成;卷积池化层中每个卷积层、池化层的核大小均为3×3,卷积层使用ReLU激活函数,在每个池化层之后进行BatchNormalization算法;全连接层的第一层使用ReLU激活函数,输出层使用softmax激活函数;由于神经网络的结构直接影响到最终的识别准确率,本发明通过大量实验,确定了神经网络结构。其中每层卷积池化层具体结构如图1所示。卷积池化层特征映射的个数与全连接层中神经元的个数主要取决于石材类别的数量。以50类石材为例,第1-2层卷积池化层特征映射数量为128,第3-5层卷积池化层的特征映射数量为256。全连接层的第一层包含256个神经元,输出层包含50个神经元,如图2所示。
步骤S32:使用去噪后石材图像训练步骤S31构建的卷积神经网络,在训练过程中使用SGD优化算法更新卷积神经网络的参数。
本实施例推荐SGD算法学习率为0.01,迭代300轮,批大小依据石材类别数量调整,以50类石材为例,批大小为100。
在本实施例中,步骤S4具体包括以下步骤:
步骤S41:选定待识别的石材图像;
步骤S42:对所述待识别的石材图像使用两次2维1阶小波去噪法获取去噪后图像;
步骤S43:使用步骤S3训练好的卷积神经网络识别步骤S42得到的去噪后图像。
较佳的,在本实施例中,所述步骤S5即为依据步骤S4输出的结果数组,其中结果数据如图3所示,选择数组中前5个最大值对应石材类别作为前5类最相似石材,并依据数组值按从大到小顺序排列。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (4)

1.一种考虑图像集复杂性的石材纹理图像CNN识别方法,其特征在于:包括以下步骤:
步骤S1:加载石材图像集;
步骤S2:将石材图像集的复杂性量化为计算石材图像集的本征维数,使用小波图像去噪方法处理石材图像集中的每张石材图像以降低石材图像集复杂性;
步骤S2具体包括以下步骤:
步骤S21:采用最大似然估计计算得到石材图像集的本征维数,具体采用以下公式:
Figure FDA0003162053980000011
Figure FDA0003162053980000012
Figure FDA0003162053980000013
式中,x表示图像空间中的一张图像,Tj(x)代表图像x和距离它最近的第j个图像之间的欧氏距离,Tk(x)代表图像x和距离它最近的第k个图像之间的欧氏距离,n为从石材图像集中选出用于计算本征维数的图像x的数量,
Figure FDA0003162053980000014
表示每张图像x在固定该张图像并取距离它最近的第k个图像时所对应的本征维数,Xi表示图像集中第i张图像,
Figure FDA0003162053980000015
表示计算图像集中每张图像对应k值的本征维数的平均值,
Figure FDA0003162053980000016
表示最终的图像集本征维数,k1表示所取的k值范围的最小值,k2表示所取的k值范围的最大值;每张图像不重复且均从石材图像集中随机取出;
步骤S22:将原图像矩阵从一个三通道矩阵按R、G、B通道分为三个单通道矩阵;
步骤S23:使用二维一阶小波变换分别处理三个单通道矩阵得到对应的低频分量、垂直高频分量、水平高频分量、以及对角线高频分量;将垂直高频分量、水平高频分量、对角线高频分量看做噪声进行去除,只选择低频分量重构回单通道矩阵;重复步骤S23一次后进入步骤S24;
步骤S24:将经过两次去噪后的三个单通道矩阵合并为一个去噪后三通道图像矩阵;
步骤S3:构建卷积神经网络,并使用步骤S2去噪后的石材图像训练卷积神经网络;
步骤S4:使用训练好的卷积神经网络模型识别石材图像;
步骤S5:依据步骤S4卷积神经网络模型的输出结果,选择最大的前5个值对应的石材类别,将其按照值从大到小的顺序依次作为前5类最相似石材。
2.根据权利要求1所述的一种考虑图像集复杂性的石材纹理图像CNN识别方法,其特征在于:步骤S1中,所述石材图像集为各类石材图像所组成的集合,石材图像集中没有重复的石材图像并且每类石材包含的图像数量相同,石材图像集中每张石材图像均为128×128的彩色图像。
3.根据权利要求1所述的一种考虑图像集复杂性的石材纹理图像CNN识别方法,其特征在于:步骤S3具体包括以下步骤:
步骤S31:所述卷积神经网络主体结构由5层卷积池化层加两层全连接层组成;卷积池化层中每个卷积层、池化层的核大小均为3×3,卷积层使用ReLU激活函数,在每个池化层之后进行Batch Normalization算法;全连接层的第一层使用ReLU激活函数,输出层使用softmax激活函数;
步骤S32:使用去噪后石材图像训练步骤S31构建的卷积神经网络,在训练过程中使用SGD优化算法更新卷积神经网络的参数。
4.根据权利要求1所述的一种考虑图像集复杂性的石材纹理图像CNN识别方法,其特征在于:步骤S4具体包括以下步骤:
步骤S41:选定待识别的石材图像;
步骤S42:对所述待识别的石材图像使用两次2维1阶小波去噪法获取去噪后图像;
步骤S43:使用步骤S3训练好的卷积神经网络识别步骤S42得到的去噪后图像。
CN201810673021.8A 2018-06-26 2018-06-26 一种考虑图像集复杂性的石材纹理图像cnn识别方法 Active CN108985349B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810673021.8A CN108985349B (zh) 2018-06-26 2018-06-26 一种考虑图像集复杂性的石材纹理图像cnn识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810673021.8A CN108985349B (zh) 2018-06-26 2018-06-26 一种考虑图像集复杂性的石材纹理图像cnn识别方法

Publications (2)

Publication Number Publication Date
CN108985349A CN108985349A (zh) 2018-12-11
CN108985349B true CN108985349B (zh) 2021-09-28

Family

ID=64538880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810673021.8A Active CN108985349B (zh) 2018-06-26 2018-06-26 一种考虑图像集复杂性的石材纹理图像cnn识别方法

Country Status (1)

Country Link
CN (1) CN108985349B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093428A (zh) * 2013-01-23 2013-05-08 中南大学 一种时空联合的图像序列多尺度几何变换去噪方法
CN105654445A (zh) * 2016-01-28 2016-06-08 东南大学 一种基于小波变换边缘检测的手机图像去噪方法
CN106991289A (zh) * 2017-04-07 2017-07-28 南通大学 一种胶囊内镜图像辅助判读方法
CN107123114A (zh) * 2017-04-21 2017-09-01 佛山市南海区广工大数控装备协同创新研究院 一种基于机器学习的布匹缺陷检测方法及装置
CN107633486A (zh) * 2017-08-14 2018-01-26 成都大学 基于三维全卷积神经网络的结构磁共振图像去噪方法
CN108053398A (zh) * 2017-12-19 2018-05-18 南京信息工程大学 一种半监督特征学习的黑色素瘤自动检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090024547A1 (en) * 2007-07-17 2009-01-22 Ut-Battelle, Llc Multi-intelligent system for toxicogenomic applications (mista)

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103093428A (zh) * 2013-01-23 2013-05-08 中南大学 一种时空联合的图像序列多尺度几何变换去噪方法
CN105654445A (zh) * 2016-01-28 2016-06-08 东南大学 一种基于小波变换边缘检测的手机图像去噪方法
CN106991289A (zh) * 2017-04-07 2017-07-28 南通大学 一种胶囊内镜图像辅助判读方法
CN107123114A (zh) * 2017-04-21 2017-09-01 佛山市南海区广工大数控装备协同创新研究院 一种基于机器学习的布匹缺陷检测方法及装置
CN107633486A (zh) * 2017-08-14 2018-01-26 成都大学 基于三维全卷积神经网络的结构磁共振图像去噪方法
CN108053398A (zh) * 2017-12-19 2018-05-18 南京信息工程大学 一种半监督特征学习的黑色素瘤自动检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSDeep: A Crushed Stone Image Predictor based on Deep Learning and Intelligently Selected Features;Phasit Charoenkwan等;《2017 2nd International Conference on Information Technology 》;20171231;第1-6页 *
基于局部域超限学习机的石材识别算法;童冰等;《闽南师范大学学报(自然科学版)》;20160331;第27-36页 *

Also Published As

Publication number Publication date
CN108985349A (zh) 2018-12-11

Similar Documents

Publication Publication Date Title
CN110348399B (zh) 基于原型学习机制和多维残差网络的高光谱智能分类方法
EP2724297B1 (en) Method and apparatus for a local competitive learning rule that leads to sparse connectivity
CN111699494A (zh) 使用通过主成分分析和重复频谱聚类进行训练的卷积神经网络的对象识别
CN108985252B (zh) 改进的脉冲深度神经网络的图像分类方法
CN109919204A (zh) 一种面向噪声图像的深度学习聚类方法
CN109753996B (zh) 基于三维轻量化深度网络的高光谱图像分类方法
CN112418261B (zh) 一种基于先验原型注意力机制的人体图像多属性分类方法
CN113095370A (zh) 图像识别方法、装置、电子设备及存储介质
CN110969089A (zh) 噪声环境下的轻量级人脸识别系统及识别方法
CN111190158A (zh) 复杂雷达辐射源识别方法、装置、电子设备及其存储介质
CN111694977A (zh) 一种基于数据增强的车辆图像检索方法
CN114795178A (zh) 一种基于多注意力神经网络的大脑状态解码方法
CN110991554A (zh) 一种基于改进pca的深度网络图像分类方法
CN112967210B (zh) 一种基于全卷积孪生网络的无人机图像去噪方法
CN106909944B (zh) 一种人脸图片聚类的方法
CN108985349B (zh) 一种考虑图像集复杂性的石材纹理图像cnn识别方法
CN112541874A (zh) 基于自编码器的无监督去噪特征学习方法
CN117036806A (zh) 一种基于双重复用残差网络的物体识别方法
CN117036901A (zh) 一种基于视觉自注意力模型的小样本微调方法
CN113255937B (zh) 一种面向智能车间不同智能体之间的联邦学习方法及系统
CN106650678B (zh) Gabor小波子带相关结构人脸识别方法
Saenz et al. Dimensionality-reduction of climate data using deep autoencoders
EP4032028A1 (en) Efficient inferencing with fast pointwise convolution
CN107341485B (zh) 人脸识别方法和装置
Kucuk et al. Performance analysis of neural network topologies and hyperparameters for deep clustering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant