CN113139578A

CN113139578A - 一种基于最优训练集的深度学习图像分类方法及系统

Info

Publication number: CN113139578A
Application number: CN202110305768.XA
Authority: CN
Inventors: 刘伟鑫; 徐晨; 周松斌
Original assignee: Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Current assignee: Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority date: 2021-03-23
Filing date: 2021-03-23
Publication date: 2021-07-20
Anticipated expiration: 2041-03-23
Also published as: CN113139578B

Abstract

本发明提供了一种基于最优训练集的深度学习图像分类方法及系统。该方案包括获取所有的分类图像后，将所述分类图像缩放为长200像素宽200像素的归一化图像，生成样本训练集、样本验证集和样本测试集；获取样本训练集和样本验证集中的所有的所述归一化图像，通过色二值化操作、边缘轮廓提取、梯度运算和三原色分离生成7个训练集和7个验证集；生成单通道训练集、单通道验证集、双通道训练集、双通道验证集、三通道训练集和三通道验证集，分别利用3个神经网络进行训练，生成准确率；获得准确率排名第一的目标分类器后，生成目标图像分类结果。该方案利用数据融合方式组成多种训练集，训练获得最优训练集，保证图像分类准确率，提高图像分类通用性。

Description

一种基于最优训练集的深度学习图像分类方法及系统

技术领域

本发明涉及计算机视觉图像识别技术领域，更具体地，涉及一种基于最优训练集的深度学习图像分类方法及系统。

背景技术

深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。由于深度学习可以通过多层次的运算结构，尽可能的逼近现实的关联关系。近年来深度学习在学术界、科技界应用广泛，尤其在图像领域，目前已经在图像分类领域取得较大进展，取得不错成效。

但目前深度学习网络模型仍然存在诸多问题：1)通用性较差，难以适应各种不同的图像分类任务，经常会出现这种网络模型对某种图像分类效果较好；2)图像分类任务效果较差。因此，亟需对于研究能够适用于不同场景的通用型图像分类方法。

发明内容

鉴于上述问题，本发明提出了一种基于最优训练集的深度学习图像分类方法及系统，利用数据融合方式组成多种训练集，训练获得最优训练集，在保证图像分类准确率下，提高图像分类的通用性。

根据本发明实施例第一方面，提供一种基于最优训练集的深度学习图像分类方法。

所述的一种基于最优训练集的深度学习图像分类方法具体包括：

获取所有的分类图像后，将所述分类图像缩放为长200像素宽200像素的归一化图像，生成样本训练集、样本验证集和样本测试集；

获取样本训练集和样本验证集中的所有的所述归一化图像，通过色二值化操作、边缘轮廓提取、梯度运算和三原色分离生成第一训练集、第二训练集、第三训练集、第四训练集、第五训练集、第六训练集、第七训练集、第一验证集、第二验证集、第三验证集、第四验证集，第五验证集、第六验证集、第七验证集；

按照预设规则对所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集，所述第五训练集、所述第六训练集、所述第七训练集、所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集和所述第七验证集进行整合，生成单通道训练集、单通道验证集、双通道训练集、双通道验证集、三通道训练集和三通道验证集；

将所述单通道训练集、所述单通道验证集、所述双通道训练集、所述双通道验证集、所述三通道训练集和所述三通道训练集分别利用第一神经网络、第二神经网络和第三神经网络进行训练，生成单通道准确率、双通道准确率、三通道准确率；

将所有的所述单通道准确率、所述双通道准确率和所述三通道准确率，获得准确率排名第一的目标分类器后，通过目标分类器对所述样本测试集进行图像分类运算，生成目标图像分类结果。

在一个或多个实施例中，优选地，所述获取样本训练集和样本验证集中的所有的所述归一化图像，通过色二值化操作、边缘轮廓提取、梯度运算和三原色分离生成第一训练集、第二训练集、第三训练集、第四训练集、第五训练集、第六训练集、第七训练集、第一验证集、第二验证集、第三验证集、第四验证集，第五验证集、第六验证集、第七验证集，具体包括：

将所述样本训练集和所述样本验证集中的所有彩色图像转换为灰度图，并分别保存到所述第一训练集和所述第一验证集；

获取所述第一训练集和所述第一验证集，进行二值化操作，分别保存到所述第二训练集和所述第二验证集，其中，二值化操作采用大津二值化算法；

获取所述第一训练集和所述第一验证集，进行边缘轮廓提取，分别保存到所述第三训练集和所述第三验证集，其中，所述边缘轮廓提取采用canny算子；

获取所述第一训练集和所述第一验证集，进行梯度运算，分别保存到所述第四训练集和所述第四验证集，所述梯度运算采用sobel算子；

提取所述样本训练集和所述样本验证集中的所有彩色图像，进行三原色分离，生成所述第五训练集、所述第六训练集、所述第七训练集、所述第五验证集、所述第六验证集和所述第七验证集。

具体的，Sobel算子为离散微分算子，英文名discrete differentiationoperator,用来计算图像灰度的近似梯度,梯度越大越有可能是边缘；canny算子为边缘检测计算理论，英文名computational theory of edge detection，是找到一个最优的边缘检测算法。

在一个或多个实施例中，优选地，所述按照预设规则对所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集，所述第五训练集、所述第六训练集、所述第七训练集、所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集和所述第七验证集进行整合，生成单通道训练集、单通道验证集、双通道训练集、双通道验证集、三通道训练集和三通道验证集，具体包括：

将所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集、所述第五训练集、所述第六训练集、所述第七训练集存储到所述单通道训练集；

将所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集、所述第七验证集存储到所述单通道验证集；

从所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集、所述第五训练集、所述第六训练集和所述第七训练集中选择两个，通过将被选择的2种训练集中每张对应图片组成一个新的双通道的训练集，生成21个训练集，保存到所述双通道训练集内；

从所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集和所述第七验证集中选择两个，通过将被选择的2种验证集中每张对应图片组成一个新的双通道的验证集，生成21个验证集，保存到所述双通道验证集内；

从所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集、所述第五训练集、所述第六训练集和所述第七训练集中选择三个，通过将被选择的3种训练集中每张对应图片组成一个新的三通道的训练集，生成35个训练集，保存到所述三通道训练集内；

从所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集和所述第七验证集中选择三个，通过将被选择的3种验证集中每张对应图片组成一个新的三通道的验证集，生成35个验证集，保存到所述三通道验证集内。

在一个或多个实施例中，优选地，所述将所述单通道训练集、所述单通道验证集、所述双通道训练集、所述双通道验证集、所述三通道训练集和所述三通道训练集分别利用第一神经网络、第二神经网络和第三神经网络进行训练，生成单通道准确率、双通道准确率、三通道准确率，具体包括：

获得所述单通道训练集，通过第一神经网络进行训练，训练完成后，通过所述单通道验证集进行验证，获得单通道精度；

获得所述双通道训练集，通过第二神经网络进行训练，训练完成后，通过所述双通道验证集进行验证，获得双通道精度；

获得所述三通道训练集，通过第三神经网络进行训练，训练完成后，通过所述三通道验证集进行验证，获得三通道精度。

在一个或多个实施例中，优选地，所述第一神经网络，具体包括：

单通道图像输入层，用于输入长度200像素宽度200像素的图片；

单通道图像第一卷积层，用于设置卷积核个数为6，其中，卷积核大小为3*3；

单通道图像第一最大池化层，用于配置核大小为2*2；

单通道图像第二卷积层，用于设置卷积核个数为6，其中，卷积核大小为3*3；

单通道图像第二最大池化层，用于配置核大小为2*2；

单通道图像第三卷积层，用于设置卷积核个数为6，其中，卷积核大小为3*3；

单通道图像第三最大池化层，用于配置核大小为2*2；

单通道图像第一全连接层，用于配置120个神经节点；

单通道图像第二全连接层，用于配置84个神经节点；

单通道图像输出层，用于按照第一预设分类数进行输出。

在一个或多个实施例中，优选地，所述第二神经网络，具体包括：

双通道图像输入层，用于输入长度200像素宽度200像素的图片；

双通道图像第一卷积层，用于设置卷积核个数为16，其中，卷积核大小为3*3；

双通道图像第一最大池化层，用于配置核大小为2*2；

双通道图像第二卷积层，用于设置卷积核个数为16，其中，卷积核大小为3*3；

双通道图像第二最大池化层，用于配置核大小为2*2；

双通道图像第三卷积层，用于设置卷积核个数为16，其中，卷积核大小为3*3；

双通道图像第三最大池化层，用于配置核大小为2*2；

双通道图像第四卷积层，用于设置卷积核个数为16，其中，卷积核大小为3*3；

双通道图像第四最大池化层，用于配置核大小为2*2；

双通道图像第一全连接层，用于配置120个神经节点；

双通道图像第二全连接层，用于配置84个神经节点；

双通道图像输出层，用于按照第二预设分类数进行输出。

在一个或多个实施例中，优选地，所述第三神经网络，具体包括：

三通道图像输入层，用于输入长度200像素宽度200像素的图片；

三通道图像第一卷积层，用于设置卷积核个数为32，其中，卷积核大小为3*3；

三通道图像第一最大池化层，用于配置核大小为2*2；

三通道图像第二卷积层，用于设置卷积核个数为32，其中，卷积核大小为3*3；

三通道图像第二最大池化层，用于配置核大小为2*2；

三通道图像第三卷积层，用于设置卷积核个数为32，其中，卷积核大小为3*3；

三通道图像第三最大池化层，用于配置核大小为2*2；

三通道图像第四卷积层，用于设置卷积核个数为32，其中，卷积核大小为3*3；

三通道图像第四最大池化层，用于配置核大小为2*2；

三通道图像第一全连接层，用于配置120个神经节点；

三通道图像第二全连接层，用于配置84个神经节点；

三通道图像输出层，用于按照第三预设分类数进行输出。

根据本发明实施例第二方面，提供一种基于最优训练集的深度学习图像分类系统。

所述的一种基于最优训练集的深度学习图像分类系统具体包括：

第一获取单元，用于获取所有的分类图像后，将所述分类图像缩放为长200像素宽200像素的归一化图像，生成样本训练集、样本验证集和样本测试集；

第二获取单元，用于获取样本训练集和样本验证集中的所有的所述归一化图像，通过色二值化操作、边缘轮廓提取、梯度运算和三原色分离生成第一训练集、第二训练集、第三训练集、第四训练集、第五训练集、第六训练集、第七训练集、第一验证集、第二验证集、第三验证集、第四验证集，第五验证集、第六验证集、第七验证集；

数据组合单元，用于按照预设规则对所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集，所述第五训练集、所述第六训练集、所述第七训练集、所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集和所述第七验证集进行整合，生成单通道训练集、单通道验证集、双通道训练集、双通道验证集、三通道训练集和三通道验证集；

数据训练单元，用于将所述单通道训练集、所述单通道验证集、所述双通道训练集、所述双通道验证集、所述三通道训练集和所述三通道训练集分别利用第一神经网络、第二神经网络和第三神经网络进行训练，生成单通道准确率、双通道准确率、三通道准确率；

分类测试单元，用于将所有的所述单通道准确率、所述双通道准确率和所述三通道准确率，获得准确率排名第一的目标分类器后，通过目标分类器对所述样本测试集进行图像分类运算，生成目标图像分类结果。

根据本发明实施例第三方面，提供一种计算机可读存储介质，其上存储计算机程序指令，所述计算机程序指令在被处理器执行时实现如本发明实施例第一方面任一项所述的方法。

根据本发明实施例第四方面，提供一种电子设备，包括存储器和处理器，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如本发明实施例第一方面任一项所述的步骤。

本发明的实施例提供的技术方案可以包括以下有益效果：

1)本发明实施例通过求取灰度图、边缘轮廓图、梯度图和色彩区分等多种方式建立初始训练集，并结合多种网络进行集成学习，提高分类图像识别准确率，通用性较高，能实现对图像进行通用的识别和分类。

2)本发明实施例采用单通道、双通道、三通道训练集，分别利用不同神经网络进行集成学习，提高对于图像分类的精度和效果，保证有效的增强图像的特征，提高训练精度。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一个实施例的一种基于最优训练集的深度学习图像分类方法的流程图。

图2是本发明一个实施例的一种基于最优训练集的深度学习图像分类方法中的获取样本训练集和样本验证集中的所有的所述归一化图像，通过色二值化操作、边缘轮廓提取、梯度运算和三原色分离生成第一训练集、第二训练集、第三训练集、第四训练集、第五训练集、第六训练集、第七训练集、第一验证集、第二验证集、第三验证集、第四验证集，第五验证集、第六验证集、第七验证集的流程图。

图3是本发明一个实施例的一种基于最优训练集的深度学习图像分类方法中的按照预设规则对所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集，所述第五训练集、所述第六训练集、所述第七训练集、所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集和所述第七验证集进行整合，生成单通道训练集、单通道验证集、双通道训练集、双通道验证集、三通道训练集和三通道验证集的流程图。

图4是本发明一个实施例的一种基于最优训练集的深度学习图像分类方法中的将所述单通道训练集、所述单通道验证集、所述双通道训练集、所述双通道验证集、所述三通道训练集和所述三通道训练集分别利用第一神经网络、第二神经网络和第三神经网络进行训练，生成单通道准确率、双通道准确率、三通道准确率的流程图。

图5是本发明一个实施例的一种基于最优训练集的深度学习图像分类方法中的第一神经网络的示意图。

图6是本发明一个实施例的一种基于最优训练集的深度学习图像分类方法中的第二神经网络的示意图。

图7是本发明一个实施例的一种基于最优训练集的深度学习图像分类方法中的第三神经网络的示意图。

图8是本发明一个实施例的一种基于最优训练集的深度学习图像分类系统的结构图。

图9是本发明一个实施例中一种电子设备的结构图。

具体实施方式

在本发明的说明书和权利要求书及上述附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号如101、102等，仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。需要说明的是，本文中的“第一”、“第二”等描述，是用于区分不同的消息、设备、模块等，不代表先后顺序，也不限定“第一”和“第二”是不同的类型。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例中，提供了一种基于最优训练集的深度学习图像分类方法及系统。该方案利用数据融合方式组成多种训练集，训练获得最优训练集，在保证图像分类准确率下，提高图像分类的通用性。

如图1所示，所述的一种基于最优训练集的深度学习图像分类方法具体包括：

S101、获取所有的分类图像后，将所述分类图像缩放为长200像素宽200像素的归一化图像，生成样本训练集、样本验证集和样本测试集；

S102、获取样本训练集和样本验证集中的所有的所述归一化图像，通过色二值化操作、边缘轮廓提取、梯度运算和三原色分离生成第一训练集、第二训练集、第三训练集、第四训练集、第五训练集、第六训练集、第七训练集、第一验证集、第二验证集、第三验证集、第四验证集，第五验证集、第六验证集、第七验证集；

S103、按照预设规则对所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集，所述第五训练集、所述第六训练集、所述第七训练集、所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集和所述第七验证集进行整合，生成单通道训练集、单通道验证集、双通道训练集、双通道验证集、三通道训练集和三通道验证集；

S104、将所述单通道训练集、所述单通道验证集、所述双通道训练集、所述双通道验证集、所述三通道训练集和所述三通道训练集分别利用第一神经网络、第二神经网络和第三神经网络进行训练，生成单通道准确率、双通道准确率、三通道准确率；

S105、将所有的所述单通道准确率、所述双通道准确率和所述三通道准确率，获得准确率排名第一的目标分类器后，通过目标分类器对所述样本测试集进行图像分类运算，生成目标图像分类结果。

具体的，在步骤S105过程中，对准确率由高到低进行排序，然后选择准确率第一的目标分类器。在此基础上，每次测试一张图像，按照如下过程：确定准确率第一的分类器对应的训练集，然后测试图片按照步骤S103中对应训练集的图片组合方式组合成新的测试图片，将新的测试图片输入到准确率第一的目标分类器，得到图像分类结果。

在本发明实施例中，通过建立3个不同层级的神经网络，进行了分类图像的精确提取。在提取过程中，分别根据不同程度的训练集融合，实现了不同维度的图像提取。由于，对应的方法不限制输入图像的类型和大小等，因此可以通用的在其他系统中使用该方案，测试效率高，且每次仅需要使用色彩转换、轮廓提取等基础运算，则可实现基于全部的图像样本训练集中数据的快速分类，最终，生成目标分类结果。

如图2所示，在一个或多个实施例中，优选地，所述获取样本训练集和样本验证集中的所有的所述归一化图像，通过色二值化操作、边缘轮廓提取、梯度运算和三原色分离生成第一训练集、第二训练集、第三训练集、第四训练集、第五训练集、第六训练集、第七训练集、第一验证集、第二验证集、第三验证集、第四验证集，第五验证集、第六验证集、第七验证集，具体包括：

S201、将所述样本训练集和所述样本验证集中的所有彩色图像转换为灰度图，并分别保存到所述第一训练集和所述第一验证集；

S202、获取所述第一训练集和所述第一验证集，进行二值化操作，分别保存到所述第二训练集和所述第二验证集，其中，二值化操作采用大津二值化算法；

S203、获取所述第一训练集和所述第一验证集，进行边缘轮廓提取，分别保存到所述第三训练集和所述第三验证集，其中，所述边缘轮廓提取采用canny算子；

S204、获取所述第一训练集和所述第一验证集，进行梯度运算，分别保存到所述第四训练集和所述第四验证集，所述梯度运算采用sobel算子；

S205、提取所述样本训练集和所述样本验证集中的所有彩色图像，进行三原色分离，生成所述第五训练集、所述第六训练集、所述第七训练集、所述第五验证集、所述第六验证集和所述第七验证集。

在本发明实施例中，进一步对训练集和验证集中的数据进行了数据增强的处理，处理方式分别为灰度处理、轮廓提取、梯度运算和RGB三通道图像提取，此时形成了多个维度的数据图片，这些多维度的图片左侧了第一训练集到第七训练集，同时也生成了对应的第一验证集到第七验证集，通过此方式，可以通用的获取图像增强，且不会损失原始图像特征，保证了后续的分类提取。

如图3所示，在一个或多个实施例中，优选地，所述按照预设规则对所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集，所述第五训练集、所述第六训练集、所述第七训练集、所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集和所述第七验证集进行整合，生成单通道训练集、单通道验证集、双通道训练集、双通道验证集、三通道训练集和三通道验证集，具体包括：

S301、将所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集、所述第五训练集、所述第六训练集、所述第七训练集存储到所述单通道训练集；

S302、将所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集、所述第七验证集存储到所述单通道验证集；

S303、从所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集、所述第五训练集、所述第六训练集和所述第七训练集中选择两个，通过将被选择的2种训练集中每张对应图片组成一个新的双通道的训练集，生成21个训练集，保存到所述双通道训练集内；

具体的，包括21个训练集是为了不重复。因此，采用利用概率原理，获得不重复的训练集数量为C₇ ²直接对应21个训练集。

S304、从所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集和所述第七验证集中选择两个，通过将被选择的2种验证集中每张对应图片组成一个新的双通道的验证集，生成21个验证集，保存到所述双通道验证集内；

具体的，21个验证集的数量选用与训练集的数量选取方式一致。

S305、从所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集、所述第五训练集、所述第六训练集和所述第七训练集中选择三个，通过将被选择的3种训练集中每张对应图片组成一个新的三通道的训练集，生成35个训练集，保存到所述三通道训练集内；

具体的，包括35个训练集是为了不重复。因此，采用利用概率原理，获得不重复的训练集数量为C₇ ³直接对应35个训练集。

S306、从所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集和所述第七验证集中选择三个，通过将被选择的3种验证集中每张对应图片组成一个新的三通道的验证集，生成35个验证集，保存到所述三通道验证集内。

具体的，35个验证集的数量选用与训练集的数量选取方式一致。

在本发明实施例中，对获取的全部数据集进行了重新的组合处理。组合处理的目的是为了能够消除原始的数据上存在的一些内在问题，使得最终生成的数据能够具备更加综合的数据信息。不会受到单一个信息源的影响。

如图4所示，在一个或多个实施例中，优选地，所述将所述单通道训练集、所述单通道验证集、所述双通道训练集、所述双通道验证集、所述三通道训练集和所述三通道训练集分别利用第一神经网络、第二神经网络和第三神经网络进行训练，生成单通道准确率、双通道准确率、三通道准确率，具体包括：

S401、获得所述单通道训练集，通过第一神经网络进行训练，训练完成后，通过所述单通道验证集进行验证，获得单通道精度；

S402、获得所述双通道训练集，通过第二神经网络进行训练，训练完成后，通过所述双通道验证集进行验证，获得双通道精度；

S403、获得所述三通道训练集，通过第三神经网络进行训练，训练完成后，通过所述三通道验证集进行验证，获得三通道精度。

在本发明实施例中，分别对单通道训练集、双通道训练集和三通道训练集中的数据进行了神经网络训练，采用了不同神经网络，进而利用单通道验证集、双通道验证集和三通道验证集生成分类精度，为进行后续分类奠定基础。

如图5所示，在一个或多个实施例中，优选地，所述第一神经网络，具体包括：

单通道图像第一最大池化层，用于配置核大小为2*2；

单通道图像第二最大池化层，用于配置核大小为2*2；

单通道图像第三最大池化层，用于配置核大小为2*2；

单通道图像第一全连接层，用于配置120个神经节点；

单通道图像第二全连接层，用于配置84个神经节点；

单通道图像输出层，用于按照第一预设分类数进行输出。

具体的，Outut为输出，FC1为第一全连接层，Maxpool为池化层，Conv为全连接层。

在本发明实施例中，本发明通过多层级的卷积和池化层的训练，最终输出单通道图像的分类数。

如图6所示，在一个或多个实施例中，优选地，所述第二神经网络，具体包括：

双通道图像第一最大池化层，用于配置核大小为2*2；

双通道图像第二最大池化层，用于配置核大小为2*2；

双通道图像第三最大池化层，用于配置核大小为2*2；

双通道图像第四最大池化层，用于配置核大小为2*2；

双通道图像第一全连接层，用于配置120个神经节点；

双通道图像第二全连接层，用于配置84个神经节点；

双通道图像输出层，用于按照第二预设分类数进行输出。

在本发明实施例中，本发明通过多层级的卷积和池化层的训练，最终输出双通道图像的分类数。

如图7所示，在一个或多个实施例中，优选地，所述第三神经网络，具体包括：

三通道图像第一最大池化层，用于配置核大小为2*2；

三通道图像第二最大池化层，用于配置核大小为2*2；

三通道图像第三最大池化层，用于配置核大小为2*2；

三通道图像第四最大池化层，用于配置核大小为2*2；

三通道图像第一全连接层，用于配置120个神经节点；

三通道图像第二全连接层，用于配置84个神经节点；

三通道图像输出层，用于按照第三预设分类数进行输出。

在本发明实施例中，本发明通过多层级的卷积和池化层的训练，最终输出三通道图像的分类数。

如图8所示，所述的一种基于最优训练集的深度学习图像分类系统具体包括：

第一获取单元801，用于获取所有的分类图像后，将所述分类图像缩放为长200像素宽200像素的归一化图像，生成样本训练集、样本验证集和样本测试集；

第二获取单元802，用于获取样本训练集和样本验证集中的所有的所述归一化图像，通过色二值化操作、边缘轮廓提取、梯度运算和三原色分离生成第一训练集、第二训练集、第三训练集、第四训练集、第五训练集、第六训练集、第七训练集、第一验证集、第二验证集、第三验证集、第四验证集，第五验证集、第六验证集、第七验证集；

数据组合单元803，用于按照预设规则对所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集，所述第五训练集、所述第六训练集、所述第七训练集、所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集和所述第七验证集进行整合，生成单通道训练集、单通道验证集、双通道训练集、双通道验证集、三通道训练集和三通道验证集；

数据训练单元804，用于将所述单通道训练集、所述单通道验证集、所述双通道训练集、所述双通道验证集、所述三通道训练集和所述三通道训练集分别利用第一神经网络、第二神经网络和第三神经网络进行训练，生成单通道准确率、双通道准确率、三通道准确率；

分类测试单元805，用于将所有的所述单通道准确率、所述双通道准确率和所述三通道准确率，获得准确率排名第一的目标分类器后，通过目标分类器对所述样本测试集进行图像分类运算，生成目标图像分类结果。

本发明实施例中，通过对图片进行多维度的数据处理，实现了通过数据融合的方式的分类运算。由于，在进行分类过程中加入了单通道、双通道和三通道的组合，使得数据更加具有综合性，组合生成的数据结果保证了数据分类最终结果的完整性和可信度。

根据本发明实施例第三方面，提供一种计算机可读存储介质，其上存储计算机程序指令，所述计算机程序指令在被处理器执行时实现如本发明实施例第一方面中任一项所述的方法。

根据本发明实施例第四方面，提供一种电子设备。图9是本发明一个实施例中一种电子设备的结构图。图9所示的电子设备为通用图像分类装置，其包括通用的计算机硬件结构，其至少包括处理器901和存储器902。处理器901和存储器902通过总线903连接。存储器902适于存储处理器901可执行的指令或程序。处理器901可以是独立的微处理器，也可以是一个或者多个微处理器集合。由此，处理器901通过执行存储器902所存储的指令，从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其它装置的控制。总线903将上述多个组件连接在一起，同时将上述组件连接到显示控制器904和显示装置以及输入/输出(I/O)装置905。输入/输出(I/O)装置905可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地，输入/输出装置905通过输入/输出(I/O)控制器906与系统相连。

本发明的实施例提供的技术方案可以包括以下有益效果：

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于最优训练集的深度学习图像分类方法，其特征在于，该方法包括：

2.如权利要求1所述的一种基于最优训练集的深度学习图像分类方法，其特征在于，所述获取样本训练集和样本验证集中的所有的所述归一化图像，通过色二值化操作、边缘轮廓提取、梯度运算和三原色分离生成第一训练集、第二训练集、第三训练集、第四训练集、第五训练集、第六训练集、第七训练集、第一验证集、第二验证集、第三验证集、第四验证集，第五验证集、第六验证集、第七验证集，具体包括：

3.如权利要求1所述的一种基于最优训练集的深度学习图像分类方法，其特征在于，所述按照预设规则对所述第一训练集、所述第二训练集、所述第三训练集、所述第四训练集，所述第五训练集、所述第六训练集、所述第七训练集、所述第一验证集、所述第二验证集、所述第三验证集、所述第四验证集、所述第五验证集、所述第六验证集和所述第七验证集进行整合，生成单通道训练集、单通道验证集、双通道训练集、双通道验证集、三通道训练集和三通道验证集，具体包括：

4.如权利要求1所述的一种基于最优训练集的深度学习图像分类方法，其特征在于，所述将所述单通道训练集、所述单通道验证集、所述双通道训练集、所述双通道验证集、所述三通道训练集和所述三通道训练集分别利用第一神经网络、第二神经网络和第三神经网络进行训练，生成单通道准确率、双通道准确率、三通道准确率，具体包括：

5.如权利要求4所述的一种基于最优训练集的深度学习图像分类方法，其特征在于，所述第一神经网络，具体包括：

单通道图像第一最大池化层，用于配置核大小为2*2；

单通道图像第二最大池化层，用于配置核大小为2*2；

单通道图像第三最大池化层，用于配置核大小为2*2；

单通道图像第一全连接层，用于配置120个神经节点；

单通道图像第二全连接层，用于配置84个神经节点；

单通道图像输出层，用于按照第一预设分类数进行输出。

6.如权利要求4所述的一种基于最优训练集的深度学习图像分类方法，其特征在于，所述第二神经网络，具体包括：

双通道图像第一最大池化层，用于配置核大小为2*2；

双通道图像第二最大池化层，用于配置核大小为2*2；

双通道图像第三最大池化层，用于配置核大小为2*2；

双通道图像第四最大池化层，用于配置核大小为2*2；

双通道图像第一全连接层，用于配置120个神经节点；

双通道图像第二全连接层，用于配置84个神经节点；

双通道图像输出层，用于按照第二预设分类数进行输出。

7.如权利要求4所述的一种基于最优训练集的深度学习图像分类方法，其特征在于，所述第三神经网络，具体包括：

三通道图像第一最大池化层，用于配置核大小为2*2；

三通道图像第二最大池化层，用于配置核大小为2*2；

三通道图像第三最大池化层，用于配置核大小为2*2；

三通道图像第四最大池化层，用于配置核大小为2*2；

三通道图像第一全连接层，用于配置120个神经节点；

三通道图像第二全连接层，用于配置84个神经节点；

三通道图像输出层，用于按照第三预设分类数进行输出。

8.一种基于最优训练集的深度学习图像分类系统，其特征在于，该系统包括：

9.一种计算机可读存储介质，其上存储计算机程序指令，其特征在于，所述计算机程序指令在被处理器执行时实现如权利要求1-7中任一项所述的方法。

10.一种电子设备，包括存储器和处理器，其特征在于，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-7任一项所述的步骤。