CN114821178A - 一种基于深度学习的模块化图像识别分类系统的处理方法 - Google Patents
一种基于深度学习的模块化图像识别分类系统的处理方法 Download PDFInfo
- Publication number
- CN114821178A CN114821178A CN202210479574.6A CN202210479574A CN114821178A CN 114821178 A CN114821178 A CN 114821178A CN 202210479574 A CN202210479574 A CN 202210479574A CN 114821178 A CN114821178 A CN 114821178A
- Authority
- CN
- China
- Prior art keywords
- network
- image recognition
- training
- module
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种基于深度学习的模块化图像识别分类系统的处理方法,用于引入一模块化图像识别分类系统使得基于卷积神经网络训练图像识别网络时用户仅需通过其便捷的、可视化的操作要求,即可完成图像识别网络的训练,显著降低用户需要耗费在理解网络训练还有专业操作设置上的时间和精力。方法包括:数据集构建模块根据第一用户操作输入的设定,将原始图像数据构建为训练集以及测试集;图像识别网络训练模块根据第二用户操作输入的设定,确定本次训练任务选配的卷积神经网络以及相关函数,并进行训练;图像识别网络测试模块对完成训练的当前网络进行检查和测试;模型使用模块基于最终完成训练的图像识别网络,对输入的图像数据进行图像识别。
Description
技术领域
本申请涉及图像识别领域,具体涉及一种基于深度学习的模块化图像识别分类系统的处理方法。
背景技术
深度学习,也被称为深度结构化学习或层次学习,是基于学习数据表示的更广泛的机器学习方法家族的一部分,与普通的机器学习相比,其优势在于深度学习使用非监督或半监督式的特征学习和分层特征提取高校算法来替代人工获取特征,能够帮助用户分析数据的潜在特征。
在图像数据分析领域,传统的计算机视觉方法受限于图像质量和算法的机械性,需要进行大量的图像处理工作,分析结果往往也不尽如人意,而深度学习方法使得计算机可以自动学习图像特征,在学习样本足够的情况下往往能取得良好的分析效果。因此,深度学习非常适合应用于计算机视觉领域,以此实现大量图像数据的自动分类和识别功能。
目前,有许多种深度学习常用的网络结构,包括卷积神经网络、对抗神经网络以及循环神经网络等。其中,由于卷积神经网络特征提取优良的特点,采用卷积神经网络(Convolutional Neural Networks,CNN)的深度学习方法在图像分析与处理领域取得了很好的应用效果,利用卷积神经网络的特性,通过网络学习来实现自动任务处理的操作不但能大大减少用户工作量,还能避免人工操作的主观性,大大提高了效率和准确率,并且具有可成长性,随样本数量增加,网络功能也随着增强。
然而在现有的相关技术的研究过程中,发明人发现,虽然卷积神经网络在图像自动识别领域广泛使用,但是对于科学计算模型搭建,需要用户对编程语言和深度学习原理有非常丰富的经验,对于大多数用户而言可能应用门槛较高,在应用卷积神经网络进行图像识别时,为了能够使用卷积神经网络进行图像分析与处理,用户不但需要详细了解卷积神经网络的工作原理、网络结构、参数设置等,还要熟练编程以对卷积神经网络进行程序实现,这对于计算机专业经验相对不足的用户来说可能是费时并且困难的,通俗来讲,就是应用卷积神经网络进行图像识别时,对于非专业人士来说存在操作困难的问题。
发明内容
本申请提供了一种基于深度学习的模块化图像识别分类系统的处理方法,用于引入一模块化图像识别分类系统,使得基于卷积神经网络训练图像识别网络时用户仅需通过其便捷的、可视化的操作要求,即可完成图像识别网络的训练,显著降低用户需要耗费在理解网络训练还有专业操作设置上的时间和精力。
第一方面,本申请提供了一种基于深度学习的模块化图像识别分类系统的处理方法,系统包括数据集构建模块、图像识别网络训练模块、图像识别网络测试模块以及模型使用模块,方法包括:
数据集构建模块获取用于训练的原始图像数据,并根据第一用户操作输入的设定,将原始图像数据构建为训练集以及测试集;
图像识别网络训练模块根据第二用户操作输入的设定,确定本次训练任务选配的卷积神经网络以及相关函数,并通过训练集、测试集以及相关函数三者对卷积神经网络进行训练;
图像识别网络测试模块对图像识别网络训练模块完成训练的当前网络进行检查和测试,若通过检查和测试,则确定当前网络为最终完成训练的图像识别网络,若未通过检查或者测试,则将当前网络退回图像识别网络训练模块继续进行训练;
模型使用模块基于最终完成训练的图像识别网络,对输入的图像数据进行图像识别,得到图像分类结果。
结合本申请第一方面,在本申请第一方面第一种可能的实现方式中,第一用户操作的输入内容还包括原始图像数据的存储路径,数据集构建模块通过存储路径提取原始图像数据,第一用户操作的输入内容具体包括训练集和测试集的比例。
结合本申请第一方面,在本申请第一方面第二种可能的实现方式中,图像识别网络训练模块供第二用户操作选配的可选卷积神经网络包括AlexNet网络、Resnet18网络和Resnet50网络,Alex网络由五个卷积层和三个全连接层组成,Resnet18网络是由17个卷积层和一个全连接层组成,Resnet50网络由50个卷积层组成。
结合本申请第一方面,在本申请第一方面第三种可能的实现方式中,第二用户操作的输入内容中还包括每次输入网络进行训练的样本数量,图像识别网络训练模块在输入样本训练网络的过程中遵守每次输入网络进行训练的样本数量。
结合本申请第一方面,在本申请第一方面第四种可能的实现方式中,第二用户操作的输入内容中还包括图像标准化操作确认结果,图像标准化操作确认结果用于确认是否对样本数据执行标准化操作;
第二用户操作的输入内容中还包括网络训练过程中的目标网络参数,目标网络参数是指在网络训练过程中进行优化的网络参数。
结合本申请第一方面,在本申请第一方面第五种可能的实现方式中,相关函数中包括优化函数,优化函数是指在网络训练过程中提高训练训练和训练精度的函数,图像识别网络训练模块供第二用户操作选配的可选优化函数包括Adam函数、SGD函数、AdaGrad函数和RMSprop函数。
结合本申请第一方面,在本申请第一方面第六种可能的实现方式中,模块化图像识别分类系统还包括图像分类结果显示模块,方法还包括:
图像分类结果显示模块显示图像分类结果。
第二方面,本申请提供了一种基于深度学习的模块化图像识别分类系统的处理装置,系统包括数据集构建模块、图像识别网络训练模块、图像识别网络测试模块以及模型使用模块,装置包括:
获取单元,用于通过数据集构建模块获取用于训练的原始图像数据,并根据第一用户操作输入的设定,将原始图像数据构建为训练集以及测试集;
训练单元,用于通过图像识别网络训练模块根据第二用户操作输入的设定,确定本次训练任务选配的卷积神经网络以及相关函数,并通过训练集、测试集以及相关函数三者对卷积神经网络进行训练;
检查测试单元,用于通过所图像识别网络测试模块对图像识别网络训练模块完成训练的当前网络进行检查和测试,若通过检查和测试,则确定当前网络为最终完成训练的图像识别网络,若未通过检查或者测试,则将当前网络退回图像识别网络训练模块继续进行训练;
图像识别单元,用于通过模型使用模块基于最终完成训练的图像识别网络,对输入的图像数据进行图像识别,得到图像分类结果。
结合本申请第二方面,在本申请第二方面第一种可能的实现方式中,第一用户操作的输入内容还包括原始图像数据的存储路径,数据集构建模块通过存储路径提取原始图像数据,第一用户操作的输入内容具体包括训练集和测试集的比例。
结合本申请第二方面,在本申请第二方面第二种可能的实现方式中,图像识别网络训练模块供第二用户操作选配的可选卷积神经网络包括AlexNet网络、Resnet18网络和Resnet50网络,Alex网络由五个卷积层和三个全连接层组成,Resnet18网络是由17个卷积层和一个全连接层组成,Resnet50网络由50个卷积层组成。
结合本申请第二方面,在本申请第二方面第三种可能的实现方式中,第二用户操作的输入内容中还包括每次输入网络进行训练的样本数量,图像识别网络训练模块在输入样本训练网络的过程中遵守每次输入网络进行训练的样本数量。
结合本申请第二方面,在本申请第二方面第四种可能的实现方式中,第二用户操作的输入内容中还包括图像标准化操作确认结果,图像标准化操作确认结果用于确认是否对样本数据执行标准化操作;
第二用户操作的输入内容中还包括网络训练过程中的目标网络参数,目标网络参数是指在网络训练过程中进行优化的网络参数。
结合本申请第二方面,在本申请第二方面第五种可能的实现方式中,相关函数中包括优化函数,优化函数是指在网络训练过程中提高训练训练和训练精度的函数,图像识别网络训练模块供第二用户操作选配的可选优化函数包括Adam函数、SGD函数、AdaGrad函数和RMSprop函数。
结合本申请第二方面,在本申请第二方面第六种可能的实现方式中,模块化图像识别分类系统还包括图像分类结果显示模块,装置还包括显示单元,用于:
通过图像分类结果显示模块显示图像分类结果。
第三方面,本申请提供了一种模块化图像识别分类系统,包括处理器和存储器,存储器中存储有计算机程序,处理器调用存储器中的计算机程序时执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。
第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。
从以上内容可得出,本申请具有以下的有益效果:
针对于基于卷积神经网络所进行的图像识别网络的训练,本申请提出了一模块化图像识别分类系统,其包括数据集构建模块、图像识别网络训练模块、图像识别网络测试模块以及模型使用模块,先由数据集构建模块获取用于训练的原始图像数据,并根据第一用户操作输入的设定,将原始图像数据构建为训练集以及测试集,再由图像识别网络训练模块根据第二用户操作输入的设定,确定本次训练任务选配的卷积神经网络以及相关函数,并通过训练集、测试集以及相关函数三者对卷积神经网络进行训练,接着图像识别网络测试模块再对图像识别网络训练模块完成训练的当前网络进行检查和测试,若通过检查和测试,则确定当前网络为最终完成训练的图像识别网络,若未通过检查或者测试,则将当前网络退回图像识别网络训练模块继续进行训练,后续模型使用模块基于最终完成训练的图像识别网络,对输入的图像数据进行图像识别,得到图像分类结果,在这过程中可看出,本申请通过将原本训练过程中需要进行的、具体的专业操作,简化为第一、第二用户操作,供用户简便地、可视化地选填相关设置,具有很低的操作要求的特点,如此可以显著降低用户需要耗费在理解网络训练还有专业操作设置上的时间和精力,进而可以将有关人员从大量无止尽的数学模型以及电脑程序语言学习中解放出来,大大提高了工作效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请基于深度学习的模块化图像识别分类系统的处理方法的一种流程示意图;
图2为本申请基于深度学习的模块化图像识别分类系统的处理装置的一种结构示意图;
图3为本申请模块化图像识别分类系统的一种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。在本申请中出现的对步骤进行的命名或者编号,并不意味着必须按照命名或者编号所指示的时间/逻辑先后顺序执行方法流程中的步骤,已经命名或者编号的流程步骤可以根据要实现的技术目的变更执行次序,只要能达到相同或者相类似的技术效果即可。
本申请中所出现的模块的划分,是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本申请中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分布到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。
在介绍本申请提供的基于深度学习的模块化图像识别分类系统的处理方法之前,首先介绍本申请所涉及的背景内容。
本申请提供的基于深度学习的模块化图像识别分类系统的处理方法、装置以及计算机可读存储介质,可应用于模块化图像识别分类系统,用于引入一模块化图像识别分类系统,使得基于卷积神经网络训练图像识别网络时用户仅需通过其便捷的、可视化的操作要求,即可完成图像识别网络的训练,显著降低用户需要耗费在理解网络训练还有专业操作设置上的时间和精力。
本申请提及的基于深度学习的模块化图像识别分类系统的处理方法,其执行主体可以为基于深度学习的模块化图像识别分类系统的处理装置,或者集成了该基于深度学习的模块化图像识别分类系统的处理装置的、由服务器或者物理主机构成的模块化图像识别分类系统。其中,基于深度学习的模块化图像识别分类系统的处理装置可以采用硬件或者软件的方式实现,模块化图像识别分类系统可以通过设备集群的方式设置。
下面,开始介绍本申请提供的基于深度学习的模块化图像识别分类系统的处理方法。
首先,参阅图1,图1示出了本申请基于深度学习的模块化图像识别分类系统的处理方法的一种流程示意图,具体的,本申请所提供的基于深度学习的模块化图像识别分类系统的处理方法应用于模块化图像识别分类系统,而该模块化图像识别分类系统包括数据集构建模块、图像识别网络训练模块、图像识别网络测试模块以及模型使用模块,具体可包括如下步骤S101至步骤S104:
步骤S101,数据集构建模块获取用于训练的原始图像数据,并根据第一用户操作输入的设定,将原始图像数据构建为训练集以及测试集;
可以理解的是,数据集构建模块还有后续的图像识别网络训练模块、图像识别网络测试模块,是为便于说明,从模块化图像识别分类系统所提供的功能服务所归纳出来的功能模块。
在现有技术中,若用户要进行图像识别网络的训练,则需对所涉及的卷积神经网络的工作原理、网络结构、参数设置等,还要熟练卷积神经网络的编程等相关专业知识,如此才可训练出一可以进行图像识别的图像识别网络。
通俗来讲,现有技术中图像识别网络的训练,都是交由专业人士进行的。
在该情况下,对于非专业人士,则存在入手困难、操作不便的问题,需要耗费大量的时间还有精力才可能完成图像识别网络的训练。
而本申请则关注到了该问题,由此将原本专业人士涉及到的专业操作进行汇总分析,并简化出用户容易理解且简单的设置内容,如此用户只需对这些设置内容进行简单地输入,模块化图像识别分类系统即可完成图像识别网络的自动设置还有自动训练。
具体的,在初始阶段,图像识别网络的训练,需要样本数据,该样本数据的加工,则可交由模块化图像识别分类系统执行。
而用户,则仅需对模块化图像识别分类系统所提供的第一用户操作的操作界面,对确定的原始图像数据进行训练集还有测试集的筛选即可,其具体的样本数据(训练集+测试集)的制备处理,则可交由模块化图像识别分类系统完成。
其中,可以理解的是,数据集构建模块对于样本数据的具体制备处理,是按照预设的制备策略、制备规则进行的,也就是说,数据集构建模块预设有相应的样本数据的标准形式,如此可以将原始图像数据转化为样本数据的标准形式供后续的网络训练使用。
步骤S102,图像识别网络训练模块根据第二用户操作输入的设定,确定本次训练任务选配的卷积神经网络以及相关函数,并通过训练集、测试集以及相关函数三者对卷积神经网络进行训练;
而在通过数据集构建模块制备好了样本数据(训练集+测试集)后,则可开始进行具体的网络训练。
在网络训练过程中涉及到的初始网络还有依赖的相关函数,则可再次进行汇总分析,并简化出用户容易理解且简单的设置内容,如此用户只需对这些设置内容进行简单地输入,模块化图像识别分类系统即可完成训练环境的搭建。
其中,可以理解的是,图像识别网络训练模块对于训练环境的具体搭建处理,是按照预设的搭建策略、搭建规则进行的,也就是说,图像识别网络训练模块预设有相应的训练环境的样式,如此可以供用户选定。
此时,搭建好了训练环境后,则可进行卷积神经网络的训练,训练其对于输入图像的特征分类,如此方可完成具体目标特征的分类效果,例如识别输入图像中是否存在某些物体、识别输入图像中物体的具体特征等,可以理解,具体需要分类的特征,可以随具体需要调整,在此不做具体限定。
而在训练过程中,简要来说,就是将训练集或者测试集输入卷积神经网络,使其进行图像识别,并根据图像识别结果计算损失函数,再根据损失函数计算结果来优化模型参数,如此经过多轮的训练、满足了训练要求(时长、精度、轮次等要求)即可完成网络的训练。
可以理解,具体的,用户可以通过设置何种损失函数来评估网络运算结果的好坏,而损失函数的计算值越小,则可证明网络预测结果(图像识别效果)与真实结果越接近,网络性能越好。
此外,图像识别网络训练模块还可对完成训练的网络甚至训练过程中的网络进行自动保存,以供数据回溯等方面的数据使用。
步骤S103,图像识别网络测试模块对图像识别网络训练模块完成训练的当前网络进行检查和测试,若通过检查和测试,则确定当前网络为最终完成训练的图像识别网络,若未通过检查或者测试,则将当前网络退回图像识别网络训练模块继续进行训练;
从上面内容可以看到,在图像识别网络训练模块执行的网络训练过程中,已经通过测试集进行了训练效果的测试了,在实际应用中,图像识别网络训练模块完成训练后,还可继续交由图像识别网络测试模块进行新一轮的训练效果校验。
具体的,图像识别网络测试模块配置有图像分类网络的检查策略还有测试策略,如此可以对图像识别网络测试模块训练出的网络进行不限于识别精度的网络训练效果的核验,如此进一步保障了最终完成训练的图像识别网络的质量。
步骤S104,模型使用模块基于最终完成训练的图像识别网络,对输入的图像数据进行图像识别,得到图像分类结果。
可以理解,在完成了网络的训练后,则可投入具体使用,将需要进行识别的图像数据输入至完成训练的图像识别网络,使其对该图像数据进行高效的图像识别,得到图像识别结果,也可以称为图像分类结果。
模型使用模块实现的是图像识别网络的应用功能,具体的,模型使用模块的工作可以包括:
1)参数导入:用户应当将图像识别网络训练模块中训练好的图像识别网络导入至模型使用模块;
2)辨别图像提交:用户将需要进行自动辨别的图像提交至模型使用模块。
具体的,选择并且提交所选择需要辨别的图像,模型使用模块可以自动得出图像所属的类别,即,完成输入图像的自动图像识别,得到图像识别结果。
从图1所示实施例可看出,针对于基于卷积神经网络所进行的图像识别网络的训练,本申请提出了一模块化图像识别分类系统,其包括数据集构建模块、图像识别网络训练模块、图像识别网络测试模块以及模型使用模块,先由数据集构建模块获取用于训练的原始图像数据,并根据第一用户操作输入的设定,将原始图像数据构建为训练集以及测试集,再由图像识别网络训练模块根据第二用户操作输入的设定,确定本次训练任务选配的卷积神经网络以及相关函数,并通过训练集、测试集以及相关函数三者对卷积神经网络进行训练,接着图像识别网络测试模块再对图像识别网络训练模块完成训练的当前网络进行检查和测试,若通过检查和测试,则确定当前网络为最终完成训练的图像识别网络,若未通过检查或者测试,则将当前网络退回图像识别网络训练模块继续进行训练,后续模型使用模块基于最终完成训练的图像识别网络,对输入的图像数据进行图像识别,得到图像分类结果,在这过程中可看出,本申请通过将原本训练过程中需要进行的、具体的专业操作,简化为第一、第二用户操作,供用户简便地、可视化地选填相关设置,具有很低的操作要求的特点,如此可以显著降低用户需要耗费在理解网络训练还有专业操作设置上的时间和精力,进而可以将有关人员从大量无止尽的数学模型以及电脑程序语言学习中解放出来,大大提高了工作效率。
继续对上述图1所示实施例的各个步骤及其在实际应用中可能的实现方式进行详细阐述。
作为一个适于实用的实现方式,在样本数据准备阶段所涉及的第一用户操作中,其输入内容具体还可包括原始图像数据的存储路径,如此,数据集构建模块通过存储路径提取原始图像数据,而第一用户操作的输入内容中也可具体包括训练集和测试集的比例。
如此,在该设置下,在第一用户操作中,用户即可直接锁定原始图像数据的位置还有其处理得到的具体训练集、测试集的数量比例,具有操作简洁且对样本数据的制备高度可控的特点。
作为一个实例,对于用户,在模块化图像识别分类系统进行数据集构建之前,则应当提交原始文件夹,文件夹的子文件命名应为图像种类名,各子文件夹中包含对应图像种类的图像,用户可以在系统中设定测试集路径、训练集路径,该模块自动从该原始文件夹中按测试集、训练集设置的比例进行测试集、训练集的构建。
构建了测试集、训练集后,数据集构建模块则可将获得的训练集、测试集路径键入系统,为训练图像识别网络的样本数据进行下一步运算。
而对于后续的网络训练阶段,图像识别网络训练模块供第二用户操作选配的可选卷积神经网络中,作为又一种适于实用的实现方式,具体则可包括AlexNet网络、Resnet18网络和Resnet50网络三种网络,它们的网络结构各不相同,具体的,Alex网络由五个卷积层和三个全连接层组成,Resnet18网络是由17个卷积层和一个全连接层组成,Resnet50网络由50个卷积层组成。
可以理解,此处设置,为实际应用中图像识别网络训练模块可供用户选定的卷积神经网络提供了具体的应用方案。
此外,作为又一种适于实用的实现方式,第二用户操作的输入内容中,具体还可包括每次输入网络进行训练的样本数量,图像识别网络训练模块在输入样本训练网络的过程中遵守每次输入网络进行训练的样本数量。
可以理解,此处设置,可方便用户把控图像识别网络训练模块读取样本数据(训练集+测试集)的进程,从而可以在实际应用中能够大大提高网络的运算速度、把控图像识别网络训练模块的网络训练效率。
类似的,在实际应用中还可设置计算机读取样本数据(训练集+测试集)的进程,也有助于提高网络的运算速度、把控图像识别网络训练模块的网络训练效率。
作为又一种适于实用的实现方式,本申请的网络训练还可涉及对样本数据的图像标准化的操作处理,对应的,在网络训练阶段,图像识别网络训练模块其涉及的第二用户操作的输入内容中,具体还可包括图像标准化操作确认结果,图像标准化操作确认结果用于确认是否对样本数据执行标准化操作。
此外,图像识别网络训练模块其涉及的第二用户操作的输入内容中,具体还可包括网络训练过程中的目标网络参数,目标网络参数是指在网络训练过程中进行优化的网络参数,即可以由用户自定义的训练参数,如此对于用户而言,可以把控网络训练更为符合自身的使用要求,使训练所得到的网络更为适合自身的图像数据,也就是说,对于自身需求具有更高的针对性,进而可以带来更为适配的、更为精确的图形识别效果。
此外,作为又一种适于实用的实现方式,在网络训练阶段,图像识别网络训练模块其涉及的第二用户操作的输入内容中的相关函数,除了可以包括损失函数,还可以包括优化函数,该优化函数是指在网络训练过程中提高训练训练和训练精度的函数,通俗来讲,就是与网络训练架构所涉及的算法、函数,其可以通过搭建的不同训练架构来影响具体的训练进程、训练精度。
具体的,图像识别网络训练模块供第二用户操作选配的可选优化函数,可以包括Adam函数、SGD函数、AdaGrad函数和RMSprop函数(有中英文全称就提供下),如此,此处设置又为网络训练处理提供了又一套可以提高训练效果的具体应用方案。
此外,在实际应用中,对于网络训练处理过程中还可涉及以下设置:
1)权重初始化:权重初始化的设定可以帮助缓解模型运行当中出现的梯度消失或者梯度爆炸等问题。
2)日志文件显示:用户可以进行选择是否在网络运算过程中是否显示日志文件。
3)参数保存:用户可以自行选择是否将以上参数进行保存,以便下次继续使用。
此外,在实际应用中,模块化图像识别分类系统还可配置一图像分类结果显示模块,通过该图像分类结果显示模块,系统还可包括以下功能;
1)图像类别显示:输入图像的类别(图像识别结果)会显示在图像的显示位置上,其文字大小和颜色还可以由用户根据图像自行设置;
2)批量分类选择:用户可以自行选择是否使用批量分类选择,如果选择是,模块可以对多个图像进行同时批量分类。
以上是本申请提供基于深度学习的模块化图像识别分类系统的处理方法的介绍,为便于更好的实施本申请提供的基于深度学习的模块化图像识别分类系统的处理方法,本申请还从功能模块角度提供了一种基于深度学习的模块化图像识别分类系统的处理装置。
参阅图2,图2为本申请基于深度学习的模块化图像识别分类系统的处理装置的一种结构示意图,在本申请中,系统包括数据集构建模块、图像识别网络训练模块、图像识别网络测试模块以及模型使用模块,基于深度学习的模块化图像识别分类系统的处理装置200具体可包括如下结构:
获取单元201,用于通过数据集构建模块获取用于训练的原始图像数据,并根据第一用户操作输入的设定,将原始图像数据构建为训练集以及测试集;
训练单元202,用于通过图像识别网络训练模块根据第二用户操作输入的设定,确定本次训练任务选配的卷积神经网络以及相关函数,并通过训练集、测试集以及相关函数三者对卷积神经网络进行训练;
检查测试单元203,用于图像识别网络测试模块对图像识别网络训练模块完成训练的当前网络进行检查和测试,若通过检查和测试,则确定当前网络为最终完成训练的图像识别网络,若未通过检查或者测试,则将当前网络退回图像识别网络训练模块继续进行训练;
图像识别单元204,用于通过模型使用模块基于最终完成训练的图像识别网络,对输入的图像数据进行图像识别,得到图像分类结果。
在一种示例性的实现方式中,第一用户操作的输入内容还包括原始图像数据的存储路径,数据集构建模块通过存储路径提取原始图像数据,第一用户操作的输入内容具体包括训练集和测试集的比例。
在又一种示例性的实现方式中,图像识别网络训练模块供第二用户操作选配的可选卷积神经网络包括AlexNet网络、Resnet18网络和Resnet50网络,Alex网络由五个卷积层和三个全连接层组成,Resnet18网络是由17个卷积层和一个全连接层组成,Resnet50网络由50个卷积层组成。
在又一种示例性的实现方式中,第二用户操作的输入内容中还包括每次输入网络进行训练的样本数量,图像识别网络训练模块在输入样本训练网络的过程中遵守每次输入网络进行训练的样本数量。
在又一种示例性的实现方式中,第二用户操作的输入内容中还包括图像标准化操作确认结果,图像标准化操作确认结果用于确认是否对样本数据执行标准化操作;
第二用户操作的输入内容中还包括网络训练过程中的目标网络参数,目标网络参数是指在网络训练过程中进行优化的网络参数。
在又一种示例性的实现方式中,相关函数中包括优化函数,优化函数是指在网络训练过程中提高训练训练和训练精度的函数,图像识别网络训练模块供第二用户操作选配的可选优化函数包括Adam函数、SGD函数、AdaGrad函数和RMSprop函数。
在又一种示例性的实现方式中,模块化图像识别分类系统还包括图像分类结果显示模块,装置还包括显示单元205,用于:
通过图像分类结果显示模块显示图像分类结果。
本申请还从硬件结构角度提供了一种模块化图像识别分类系统,将模块化图像识别分类系统理解为一种硬件设备,参阅图3,图3从硬件设备出发示出了本申请模块化图像识别分类系统的一种结构示意图,具体的,本申请模块化图像识别分类系统可包括处理器301、存储器302以及输入输出设备303,处理器301用于执行存储器302中存储的计算机程序时实现如图1对应实施例中基于深度学习的模块化图像识别分类系统的处理方法的各步骤;或者,处理器301用于执行存储器302中存储的计算机程序时实现如图2对应实施例中各单元的功能,存储器302用于存储处理器301执行上述图1对应实施例中基于深度学习的模块化图像识别分类系统的处理方法所需的计算机程序。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器302中,并由处理器301执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
模块化图像识别分类系统可包括,但不仅限于处理器301、存储器302、输入输出设备303。本领域技术人员可以理解,示意仅仅是模块化图像识别分类系统的示例,并不构成对模块化图像识别分类系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如模块化图像识别分类系统还可以包括网络接入设备、总线等,处理器301、存储器302、输入输出设备303等通过总线相连。
处理器301可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是模块化图像识别分类系统的控制中心,利用各种接口和线路连接整个设备的各个部分。
存储器302可用于存储计算机程序和/或模块,处理器301通过运行或执行存储在存储器302内的计算机程序和/或模块,以及调用存储在存储器302内的数据,实现计算机装置的各种功能。存储器302可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据模块化图像识别分类系统的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器301用于执行存储器302中存储的计算机程序时,具体可实现以下功能:
数据集构建模块获取用于训练的原始图像数据,并根据第一用户操作输入的设定,将原始图像数据构建为训练集以及测试集;
图像识别网络训练模块根据第二用户操作输入的设定,确定本次训练任务选配的卷积神经网络以及相关函数,并通过训练集、测试集以及相关函数三者对卷积神经网络进行训练;
图像识别网络测试模块对图像识别网络训练模块完成训练的当前网络进行检查和测试,若通过检查和测试,则确定当前网络为最终完成训练的图像识别网络,若未通过检查或者测试,则将当前网络退回图像识别网络训练模块继续进行训练;
模型使用模块基于最终完成训练的图像识别网络,对输入的图像数据进行图像识别,得到图像分类结果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的图像识别网络训练系统的处理装置、模块化图像识别分类系统及其相应单元的具体工作过程,可以参考如图1对应实施例中基于深度学习的模块化图像识别分类系统的处理方法的说明,具体在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请如图1对应实施例中基于深度学习的模块化图像识别分类系统的处理方法的步骤,具体操作可参考如图1对应实施例中基于深度学习的模块化图像识别分类系统的处理方法的说明,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(Read Only Memory,ROM)、随机存取记忆体(Random Access Memory,RAM)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请如图1对应实施例中基于深度学习的模块化图像识别分类系统的处理方法的步骤,因此,可以实现本申请如图1对应实施例中基于深度学习的模块化图像识别分类系统的处理方法所能实现的有益效果,详见前面的说明,在此不再赘述。
以上对本申请提供的基于深度学习的模块化图像识别分类系统的处理方法、装置、模块化图像识别分类系统以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种基于深度学习的模块化图像识别分类系统的处理方法,其特征在于,所述系统包括数据集构建模块、图像识别网络训练模块、图像识别网络测试模块以及模型使用模块,所述方法包括:
所述数据集构建模块获取用于训练的原始图像数据,并根据第一用户操作输入的设定,将所述原始图像数据构建为训练集以及测试集;
所述图像识别网络训练模块根据第二用户操作输入的设定,确定本次训练任务选配的卷积神经网络以及相关函数,并通过所述训练集、所述测试集以及所述相关函数三者对所述卷积神经网络进行训练;
所述图像识别网络测试模块对所述图像识别网络训练模块完成训练的当前网络进行检查和测试,若通过所述检查和所述测试,则确定所述当前网络为最终完成训练的图像识别网络,若未通过所述检查或者所述测试,则将所述当前网络退回所述图像识别网络训练模块继续进行训练;
所述模型使用模块基于最终完成训练的所述图像识别网络,对输入的图像数据进行图像识别,得到图像分类结果。
2.根据权利要求1所述的方法,其特征在于,所述第一用户操作的输入内容还包括所述原始图像数据的存储路径,所述数据集构建模块通过所述存储路径提取所述原始图像数据,第一用户操作的输入内容具体包括所述训练集和所述测试集的比例。
3.根据权利要求1所述的方法,其特征在于,所述图像识别网络训练模块供所述第二用户操作选配的可选卷积神经网络包括AlexNet网络、Resnet18网络和Resnet50网络,所述Alex网络由五个卷积层和三个全连接层组成,所述Resnet18网络是由17个卷积层和一个全连接层组成,所述Resnet50网络由50个卷积层组成。
4.根据权利要求1所述的方法,其特征在于,所述第二用户操作的输入内容中还包括每次输入网络进行训练的样本数量,所述图像识别网络训练模块在输入样本训练网络的过程中遵守所述每次输入网络进行训练的样本数量。
5.根据权利要求1所述的方法,其特征在于,所述第二用户操作的输入内容中还包括图像标准化操作确认结果,所述图像标准化操作确认结果用于确认是否对样本数据执行标准化操作;
所述第二用户操作的输入内容中还包括网络训练过程中的目标网络参数,所述目标网络参数是指在所述网络训练过程中进行优化的网络参数。
6.根据权利要求1所述的方法,其特征在于,所述相关函数中包括优化函数,所述优化函数是指在网络训练过程中提高训练训练和训练精度的函数,所述图像识别网络训练模块供所述第二用户操作选配的可选优化函数包括Adam函数、SGD函数、AdaGrad函数和RMSprop函数。
7.根据权利要求1所述的方法,其特征在于,所述模块化图像识别分类系统还包括图像分类结果显示模块,所述方法还包括:
所述图像分类结果显示模块显示所述图像分类结果。
8.一种基于深度学习的模块化图像识别分类系统的处理装置,其特征在于,所述系统包括数据集构建模块、图像识别网络训练模块、图像识别网络测试模块以及模型使用模块,所述装置包括:
获取单元,用于通过所述数据集构建模块获取用于训练的原始图像数据,并根据第一用户操作输入的设定,将所述原始图像数据构建为训练集以及测试集;
训练单元,用于通过所述图像识别网络训练模块根据第二用户操作输入的设定,确定本次训练任务选配的卷积神经网络以及相关函数,并通过所述训练集、所述测试集以及所述相关函数三者对所述卷积神经网络进行训练;
检查测试单元,用于通过所所述图像识别网络测试模块对所述图像识别网络训练模块完成训练的当前网络进行检查和测试,若通过所述检查和所述测试,则确定所述当前网络为最终完成训练的图像识别网络,若未通过所述检查或者所述测试,则将所述当前网络退回所述图像识别网络训练模块继续进行训练;
图像识别单元,用于通过所述模型使用模块基于最终完成训练的所述图像识别网络,对输入的图像数据进行图像识别,得到图像分类结果。
9.一种模块化图像识别分类系统,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210479574.6A CN114821178A (zh) | 2022-05-05 | 2022-05-05 | 一种基于深度学习的模块化图像识别分类系统的处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210479574.6A CN114821178A (zh) | 2022-05-05 | 2022-05-05 | 一种基于深度学习的模块化图像识别分类系统的处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114821178A true CN114821178A (zh) | 2022-07-29 |
Family
ID=82512259
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210479574.6A Pending CN114821178A (zh) | 2022-05-05 | 2022-05-05 | 一种基于深度学习的模块化图像识别分类系统的处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114821178A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115713763A (zh) * | 2022-11-25 | 2023-02-24 | 青海卓旺智慧信息科技有限公司 | 一种基于深度学习的土豆图像识别系统 |
CN116597286A (zh) * | 2023-07-17 | 2023-08-15 | 深圳市诚识科技有限公司 | 一种基于深度学习的图像识别自适应学习方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108241892A (zh) * | 2016-12-23 | 2018-07-03 | 北京国双科技有限公司 | 一种数据建模方法和装置 |
CN110751269A (zh) * | 2019-10-18 | 2020-02-04 | 网易(杭州)网络有限公司 | 图神经网络训练方法、客户端设备及系统 |
CN112418266A (zh) * | 2020-10-15 | 2021-02-26 | 南昌大学 | 一种基于卷积神经网络的桩基础完整性分类识别方法 |
CN113723451A (zh) * | 2021-07-20 | 2021-11-30 | 山东师范大学 | 视网膜图像分类模型训练方法、系统、存储介质及设备 |
CN113792783A (zh) * | 2021-09-13 | 2021-12-14 | 陕西师范大学 | 一种基于深度学习的和面阶段自动识别方法及系统 |
CN114365158A (zh) * | 2019-09-12 | 2022-04-15 | 维亚奈系统公司 | 视觉创建和监控机器学习模型 |
-
2022
- 2022-05-05 CN CN202210479574.6A patent/CN114821178A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108241892A (zh) * | 2016-12-23 | 2018-07-03 | 北京国双科技有限公司 | 一种数据建模方法和装置 |
CN114365158A (zh) * | 2019-09-12 | 2022-04-15 | 维亚奈系统公司 | 视觉创建和监控机器学习模型 |
CN110751269A (zh) * | 2019-10-18 | 2020-02-04 | 网易(杭州)网络有限公司 | 图神经网络训练方法、客户端设备及系统 |
CN112418266A (zh) * | 2020-10-15 | 2021-02-26 | 南昌大学 | 一种基于卷积神经网络的桩基础完整性分类识别方法 |
CN113723451A (zh) * | 2021-07-20 | 2021-11-30 | 山东师范大学 | 视网膜图像分类模型训练方法、系统、存储介质及设备 |
CN113792783A (zh) * | 2021-09-13 | 2021-12-14 | 陕西师范大学 | 一种基于深度学习的和面阶段自动识别方法及系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115713763A (zh) * | 2022-11-25 | 2023-02-24 | 青海卓旺智慧信息科技有限公司 | 一种基于深度学习的土豆图像识别系统 |
CN116597286A (zh) * | 2023-07-17 | 2023-08-15 | 深圳市诚识科技有限公司 | 一种基于深度学习的图像识别自适应学习方法及系统 |
CN116597286B (zh) * | 2023-07-17 | 2023-09-15 | 深圳市诚识科技有限公司 | 一种基于深度学习的图像识别自适应学习方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114821178A (zh) | 一种基于深度学习的模块化图像识别分类系统的处理方法 | |
WO2017143921A1 (zh) | 一种多重抽样模型训练方法及装置 | |
CN112889042A (zh) | 机器学习中超参数的识别与应用 | |
CN110046706A (zh) | 模型生成方法、装置及服务器 | |
CN109919304A (zh) | 神经网络搜索方法、装置、可读存储介质和计算机设备 | |
CN110472060A (zh) | 题目推送方法、装置、计算机设备和存储介质 | |
CN109409533A (zh) | 一种机器学习模型的生成方法、装置、设备及存储介质 | |
CN110457218A (zh) | 游戏引擎测试方法、装置、存储介质及电子设备 | |
CN112651356B (zh) | 视频难度定级模型获取方法及视频难度定级方法 | |
CN110287104A (zh) | 测试用例生成方法、装置、终端及计算机可读存储介质 | |
CN107391383A (zh) | 一种应用程序界面的测试方法和测试系统 | |
CN111797320A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN110046279A (zh) | 视频文件特征的预测方法、介质、装置和计算设备 | |
CN109241485A (zh) | 一种页面间跳转关系建立方法,及装置 | |
CN112597066B (zh) | 页面测试方法和装置 | |
CN106900034A (zh) | 一种连接wifi的方法、装置及电子设备 | |
CN109783361A (zh) | 确定代码质量的方法和装置 | |
CN111386454A (zh) | 一种车辆诊断方法、设备及可读存储介质 | |
CN114356744A (zh) | 基于机器学习的应用程序界面遍历方法及设备 | |
CN116110033A (zh) | 车牌生成方法、装置、非易失性存储介质和计算机设备 | |
CN116501979A (zh) | 信息推荐方法、装置、计算机设备及计算机可读存储介质 | |
CN110334353B (zh) | 词序识别性能的分析方法、装置、设备及存储介质 | |
CN112699032A (zh) | 一种基于Excel实现vdbench性能测试结果分析的方法 | |
CN114328169A (zh) | 一种动态页面的测试方法及其系统 | |
CN109800168A (zh) | 软件的操作事件数据的测试方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |