CN114708452A

CN114708452A - 一种基于深度学习的产品图像分类方法及系统

Info

Publication number: CN114708452A
Application number: CN202111613970.5A
Authority: CN
Inventors: 郑志力; 陈馨
Original assignee: Wuhan Silpeng Technology Co ltd
Current assignee: Wuhan Silpeng Technology Co ltd
Priority date: 2021-12-27
Filing date: 2021-12-27
Publication date: 2022-07-05

Abstract

本发明涉及图像处理技术领域，尤其是一种基于深度学习的产品图像分类方法及系统，针对现有技术中的图像分类系统工作效率低的问题，现提出如下方案，其包括以下步骤：步骤一、根据客户标准来建立起详细的分类标准；步骤二、根据制定好的分类标准建立神经网络模型，然后再进行大量的数据训练，最后形成图形分析模型；步骤三、导入图片，图形分析模型可以将导入的图片特征识别，然后归类为一类图片。本发明通过建立神经网络模型，然后进行大量数据训练模型，可以将导入的图片特征识别，然后归类为一类图片，从而大大的提高了对产品图片的分类效率。

Description

一种基于深度学习的产品图像分类方法及系统

技术领域

本发明涉及图像处理领域，尤其涉及一种基于深度学习的产品图像分类方法及系统。

背景技术

非织造产品的图像分类是计算机视觉领域的一个新场景,将来可能会成为当下图像研究的热门方向。深度学习方法在图像检索、图像分类、文字识别、视频分类等领域得到了广泛的应用。人工智能最重要的领域计算机视觉和图像识别，人工智能时代的到来，人们对图像处理的需求井喷式增长，图像识别技术也迅猛发展。但是随着特种生产需求或工艺的革新，出现了一类棘手且常见的问题，譬如自然形成的各种类型产品的是混合在一起的，需要进行智能化分类，自动化分类基于图像识别或图像分类处理方法。为了适应人工智能时代的步伐，解放人力资源，提高工作效率，促进和快速成长与发展，为此，本方案提出了一种基于深度学习的产品图像分类方法及系统。

发明内容

本发明提出的一种基于深度学习的产品图像分类方法及系统，解决了现有技术中的图像分类系统工作效率低的问题。

为了实现上述目的，本发明采用了如下技术方案：

一种基于深度学习的产品图像分类方法，包括以下步骤：

步骤一、根据客户标准来制定详细的分类标准；

步骤二、根据制定好的分类标准建立神经网络模型，然后再进行大量的数据训练，最后形成图形分析模型；

步骤三、导入图片，图形分析模型可以将导入的图片特征识别，然后归类为一类图片；

其中，若单张导入，则会显示文件类型；若将文件夹内图片批量导入、则自动进行分类，将同种类型的图片放进一个文件夹；若单张混合类型的图片导入，则边缘检测标出每个图像的类型。

优选的，所述神经网络模型的建立包括图像识别方法的建立、决策模型的建立和模型训练方法的建立。

优选的，所述图像识别方法采用决策理论方法识别，利用函数为基数，以模式向量来描绘图像特征，模式向量有粗体小写字母表示，如x，y和z，并采用x＝(x₁,x₂,...,x_n)^T表示一个n维模式向量，对于W个模式类w₁，w₂，...,w_n,决策理论模式识别的基本问题是依据如下属性找到W个决策函数d₁(x)，d₂(x)，...，d_n(x)：如果模式d_n(x)属于w_i，则

d_i(x)＞d_i(x)(j＝1,2,...,W；j≠i)

即将x带入所有决策函数后，如果d_i(x)得到最大值，则称未知模式x属于第i模式类。

优选的，所述决策模型采用SVW分类机制，在SVM中，找到离分隔超平面最近的点(称为支持向量)，确保它们离分隔超平面的距离尽可能的远，通过最大化支持向量到分隔超平面的距离来训练SVM，其中SVM主要分为以下三类：

线性可分支持向量机(也称为硬间隔支持向量机)：当训练数据线性可分时，通过硬间隔最大化，学得一个线性可分支持向量机；

线性支持向量机(也称为软间隔支持向量机)：当训练数据近似线性可分时，通过软间隔最大化，学得一个线性支持向量机；

非线性支持向量机：当训练数据不可分时，通过使用核技巧以及软间隔最大化，学得一个非线性支持向量机。

优选的，所述模型训练方法采用梯度下降算法，迭代处理训练集合中的样例，一次处理一个样例，对于样例d，如果它的预期输出和实际输出有“误差”，BP算法抓住这个误差信号L_d，以“梯度递减”的模式修改权值。也就是说，对于每个训练样例d，权值W_ji的校正幅度为ΔW_ji(需要说明的是，W_ji和W_ij其实都是同一个权值，W_ji表示的是神经元j的第i个输入相关的权值，这里之所以把下标“j”置于“i”之前，仅仅表示这是一个反向更新过程而已)：

在这里，L_d表示的是训练集合中样例d的误差，分解到输出层的所有输出向量：

y_j表示的是第j个神经单元的预期输出值；y′_j表示的是第j个神经单元的实际输出值；outputs的范围是网络最后一层的神经元集合。

一种基于深度学习的产品图像分类系统，包括：

标准设定模块，用于根据客户的标准来建立详细的产品分类标准；

分类器，基于深度学习的决策分类方法神经网络模型，然后进行大量数据训练模型

优选的，所述分类器包括图像输入、NCNN筛选、SVM二次判断、OCR识别和结果输出。

优选的，所述图像输入用于数据的读取，NCNN筛选用于判断产品是否为已有产品类型，NCNN筛选用于对产品图片进行二测判断，OCR识别基于OCR方法对图像关键纹理进行识别，结果输出用于结果输出以及区域图像数据的输出。

本发明的有益效果：

1、SVM是通过支撑面做分类，不需要计算所有的样本，高维数据中只需去少量的样本，节省了内存。

2、通过建立神经网络模型，然后预先将大量的各类产品图片导入训练，形成图像分类模型，然后在对图像进行分类的时候，只需要将图片输入到分类器中，就可以快速的对图片进行特征识别，然后归类为一类图片。

3、分类器可以迅速的将一个文件夹中的所有图片进行分类：若单张导入，则会显示文件类型；若将文件夹内图片批量导入、则自动进行分类，将同种类型的图片放进一个文件夹；若单张混合类型的图片导入，则边缘检测标出每个图像的类型，该种产品分类方法大大的提升了工程效率，避免了人工分类问题。

附图说明

图1为一种基于深度学习的产品图像分类系统图。

图2为分类器中的单元图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

参照图1-2，一种基于深度学习的产品图像分类方法，包括以下步骤：

步骤一、根据客户标准来建立起详细的分类标准；

一种基于深度学习的产品图像分类系统，包括：

分类器，基于深度学习的决策分类方法神经网络模型，然后进行大量数据训练模型，神经网络模型的建立包括图像识别方法的建立、决策模型的建立和模型训练方法的建立；

图像识别方法采用决策理论方法识别，利用函数为基数，以模式向量来描绘图像特征，模式向量有粗体小写字母表示，如x，y和z，并采用x＝(x₁,x₂,...,x_n)^T表示一个n维模式向量，对于W个模式类w₁，w₂，...,w_n,决策理论模式识别的基本问题是依据如下属性找到W个决策函数d₁(x)，d₂(x)，...，d_n(x)：如果模式d_n(x)属于w_i，则

d_i(x)＞d_i(x)(j＝1,2,...,W；j≠i)

即将x带入所有决策函数后，如果d_i(x)得到最大值，则称未知模式x属于第i模式类，通过该方法将待识别的图像首先转换为图像特征向量；

决策模型采用SVW分类机制，在SVM中，找到离分隔超平面最近的点(称为支持向量)，确保它们离分隔超平面的距离尽可能的远，通过最大化支持向量到分隔超平面的距离来训练SVM，其中SVM主要分为以下三类：

非线性支持向量机：当训练数据不可分时，通过使用核技巧以及软间隔最大化，学得一个非线性支持向量机，当需要对图像进行二次识别的时候，则采用SVW方法对图像进行二次判断，将目标图像与训练模型内保存的图片进行对比分析，从而从训练模型内保存的图片中找到与目标图像最为接近的图片；

模型训练方法采用梯度下降算法，迭代处理训练集合中的样例，一次处理一个样例，对于样例d，如果它的预期输出和实际输出有“误差”，BP算法抓住这个误差信号L_d，以“梯度递减”的模式修改权值，也就是说，对于每个训练样例d，权值W_ji的校正幅度为ΔW_ji(需要说明的是，W_ji和W_ij其实都是同一个权值，W_ji表示的是神经元j的第i个输入相关的权值，这里之所以把下标“j”置于“i”之前，仅仅表示这是一个反向更新过程而已)：

y_j表示的是第j个神经单元的预期输出值；y′_j表示的是第j个神经单元的实际输出值；outputs的范围是网络最后一层的神经元集合，通过该训练方法，可以逐渐缩小误差，从而死的图片分类时更加的精准；

分类器包括图像输入、NCNN筛选、SVM二次判断、OCR和结果输出，图像输入用于数据的读取，NCNN筛选用于判断产品是否为已有产品类型，NCNN筛选用于对产品图片进行二测判断，OCR识别基于OCR方法对图像关键纹理进行识别，结果输出用于结果输出以及区域图像数据的输出，通过OCR检测图像暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字，通过将局部图像块的特征转化为视觉词汇,并对视觉词汇进行统计得到图像的描述，然后根据图像描述进行图像分类，从而简单有效的对图像进行快速的分类，在通过大量导入图片进行训练后形成分类模型，并以此为基础制成分类器，单张分类只要点击打开按钮选择要分类的图像(支持多选)，然后点击分类对应的图像就会显示所属类型，无法区分的会显示未知类型；批量分类则点击批量分类按钮，点击打开按钮选择导入路径，点击选择按钮选择保存分类图像的路径，最后点击分类开始进行分类操作，并且会显示分类进度，分类时，只需要将单张图像输入(或者批量图像输入)，再根据NCNN筛选是否属于已有的通用证件类型，若需要根据SVM进行二次判断，则图像会进行OCR识别，OCR全文识别寻找关键词，最后将结果输出或者将区域图像数据输出

工作原理：先根据客户的标准来建立起详细的分类标准，接着根据制定好的分类标准建立神经网络模型，然后再进行大量的数据训练，最后形成图形分析模型，从而给建立起分类器器，然后再对图片进行分类时，先进行单张图像输入(或者批量图像输入)，再根据NCNN筛选是否属于已有的通用证件类型，若需要根据SVM二次判断，则对图像进行OCR识别，OCR全文识别寻找关键词，最后再将结果输出或者将区域图像数据输出。

在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于深度学习的产品图像分类方法，其特征在于，包括以下步骤：

步骤一、根据客户标准来制定详细的分类标准；

2.根据权利要求1所述的一种基于深度学习的产品图像分类方法，其特征在于，所述神经网络模型的建立包括图像识别方法的建立、决策模型的建立和模型训练方法的建立。

3.根据权利要求2所述的一种基于深度学习的产品图像分类方法，其特征在于，所述图像识别方法采用决策理论方法识别，利用函数为基数，以模式向量来描绘图像特征，模式向量有粗体小写字母表示，如x，y和z，并采用x＝(x₁,x₂,...,x_n)^T表示一个n维模式向量，对于W个模式类w₁，w₂，...,w_n,决策理论模式识别的基本问题是依据如下属性找到W个决策函数d₁(x)，d₂(x)，...，d_n(x)：如果模式d_n(x)属于w_i，则

d_i(x)＞d_i(x)(j＝1,2,...,W；j≠i)

4.根据权利要求3所述的一种基于深度学习的产品图像分类方法，其特征在于，所述决策模型采用SVW分类机制，在SVM中，找到离分隔超平面最近的点(称为支持向量)，确保它们离分隔超平面的距离尽可能的远，通过最大化支持向量到分隔超平面的距离来训练SVM，其中SVM主要分为以下三类：

5.根据权利要求4所述的一种基于深度学习的产品图像分类方法，其特征在于，所述模型训练方法采用梯度下降算法，迭代处理训练集合中的样例，一次处理一个样例，对于样例d，如果它的预期输出和实际输出有“误差”，BP算法抓住这个误差信号L_d，以“梯度递减”的模式修改权值，也就是说，对于每个训练样例d，权值W_ji的校正幅度为ΔW_ji(需要说明的是，W_ji和W_ij其实都是同一个权值，W_ji表示的是神经元j的第i个输入相关的权值，这里之所以把下标“j”置于“i”之前，仅仅表示这是一个反向更新过程而已)：

y_j表示的是第j个神经单元的预期输出值；y_j′表示的是第j个神经单元的实际输出值；outputs的范围是网络最后一层的神经元集合。

6.一种基于深度学习的产品图像分类系统，其特征在于，包括：

分类器，基于深度学习的决策分类方法神经网络模型，然后进行大量数据训练模型。

7.根据权利要求6所述的一种基于深度学习的产品图像分类系统，其特征在于，所述分类器包括图像输入、NCNN筛选、SVM二次判断、OCR识别和结果输出。

8.根据权利要求7所述的一种基于深度学习的产品图像分类系统，所述图像输入用于数据的读取，NCNN筛选用于判断产品是否为已有产品类型，NCNN筛选用于对产品图片进行二测判断，OCR识别基于OCR方法对图像关键纹理进行识别，结果输出用于结果输出以及区域图像数据的输出。