CN109840552B - 一种动态图像分类方法 - Google Patents
一种动态图像分类方法 Download PDFInfo
- Publication number
- CN109840552B CN109840552B CN201910031358.3A CN201910031358A CN109840552B CN 109840552 B CN109840552 B CN 109840552B CN 201910031358 A CN201910031358 A CN 201910031358A CN 109840552 B CN109840552 B CN 109840552B
- Authority
- CN
- China
- Prior art keywords
- model
- lenet
- pictures
- subset
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种动态图像分类方法,从图片中随机选取一张图作为输入经过LeNet模型得到Q函数;根据Q函数选取一个动作1或0得到一个奖励和下一张图片;根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型。得到的下一张图作为更新后LeNet模型的输入重复上述操作直到遍历所有图片,保存模型。本发明结合LeNet和强化学习中Qlearning算法用来处理动态图像分类问题,本发明可以用来处理各种大样本数据集如ciffa10,ciffa100等。
Description
技术领域
本发明属于图像分类技术领域,涉及一种动态图像分类方法,具体涉及一种基于深度学习和强化学习的动态图像分类方法。
背景技术
随着人工智能的发展,基于深度学习的图像分类有着广泛的应用前景和重要研究价值,近年来成为了研究热点领域,无论是工业应用,还是学术研究都已取得了许多有价值的成果。强化学习是机器学习的一个重要分支,主要用来解决决策问题。强化学习可以在复杂的、不确定的环境中学习如何实现设定的目标,并且应用场景非常广,如控制机器人的电机让它执行特定任务、给商品定价或者进行库存管理、玩视频游戏或棋牌游戏等。
深度学习算法如AlexNet,VggNet,ResNet等处理图像分类问题时,训练完成后参数就固定了,无法改变。而生产线上的图片是源源不断的、动态的,需要模型可以随时更新,故深度学习算法无法解决此类动态问题,而目前强化学习主要应用于处理游戏,没有适用于图像分类方向的算法。
发明内容
为了解决上述技术问题,本发明开拓性地提出了一种基于深度学习和强化学习的动态图像分类方法,结合LeNet模型的提取特征能力和强化学习算法中Qlearning的动态决策能力处理生产线上图片不断增加的问题。
本发明所采用的技术方案是:一种动态图像分类方法,其特征在于,包括以下步骤:
步骤1:获取若干图片,作为样本集;
步骤2:将样本集分为若干子集;
步骤3:从第一个子集中的图片中随机选取一张图作为输入经过LeNet模型逼近Q(s,a;θ)函数,其中s表示状态,a表示动作,θ表示LeNet模型的权重;
步骤4:根据Q(s,a;θ)函数选取一个动作1或0,得到一个奖励和下一张图片;其中,1和0分别表示图片的2个对立的类别;所述得到一个奖励,如果分类正确,则+1分;如果分类错误,则-1分;得分越高分类准确率越高;
步骤5:根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型;
步骤6:得到的下一张图作为更新后LeNet模型的输入重复上述操作直到遍历第一个子集中的所有图片,保存模型;
步骤7:将第后一个子集中的图片添加到前面的子集中,回转执行步骤3;
步骤8:对比每次的准确率;
如果准确率下降,所有的训练要重新开始,从第一个子集中的图片开始,回转执行步骤3;
如果准确率增加或不变,则保存模型。
相对现有技术,本发明的有益效果是:结合了LeNet模型(已有的深度学习模型)和Qlearning(已有的强化学习算法)用于处理动态图片分类问题,深度学习算法单独使用不能够处理动态图片分类问题,而强化学习目前几乎没有用于图像分类领域的算法,本技术将两者结合并用于处理动态图片分类问题。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例中LeNet模型图;
图3为本发明实施例的LeNet与Qlearning算法原理图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1和图3,本发明提供的一种动态图像分类方法,包括以下步骤:
步骤1:获取若干图片,作为样本集;
本实施例以龙虾样本为例,选取本地图片20000张;
步骤2:将样本集分为若干子集;
本实施例将将样本集分为4份,每份5000张,为模拟动态过程做准备。
步骤3:从第一个子集中的图片中随机选取一张图作为输入经过LeNet模型逼近Q(s,a;θ)函数,其中s表示状态,a表示动作,θ表示LeNet模型的权重;
请见图2,本实施例的LeNet模型,包括3层5*5的卷积层、两层池化层和两层全连接层。
步骤4:根据Q(s,a;θ)函数选取一个动作1或0,得到一个奖励和下一张图片;其中,1和0分别表示图片的2个对立的类别(本实施例1和0分别表示好的龙虾图片和坏的龙虾图片);所述得到一个奖励,如果分类正确,则+1分;如果分类错误,则-1分;
因为每一张图片都做了分类,将样本分为两类,以龙虾为例,将好的龙虾分为一类用1作为标签,龙虾用0作为标签,分类正确+1分,分类错误-1分,最终是通过得到的分数来判断分类的准确性,得分越高分类准确率越高,分类效果越好。
步骤5:根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型;
步骤6:得到的下一张图作为更新后LeNet模型的输入重复上述操作直到遍历第一个子集中的所有图片,保存模型;
步骤7:将第后一个子集中的图片添加到前面的子集中,回转执行步骤3;
本实施例训练时依次增加图片,第一次5000张,第二次10000张,第三次15000,第四次20000张,通过这种方法模拟动态过程。
步骤8:对比每次的准确率;
如果准确率下降,调LeNet模型比如增加1*1的卷积模块等方法来加强算法,所有的训练要重新开始,从第一个子集中的图片开始,回转执行步骤3;
如果准确率增加或不变,则保存模型。
本发明主要应用于动态图像分类,单独使用目前分类效果较好的深度学习算法无法处理在生产线上图片不断增加这类动态问题,而目前强化学习主要应用于处理游戏。故本发明结合LeNet和强化学习中Qlearning算法用来处理动态图像分类问题。本发明也可以用来处理各种大样本数据集如ciffa10,ciffa100等。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (2)
1.一种动态图像分类方法,其特征在于,包括以下步骤:
步骤1:获取若干图片,作为样本集;
步骤2:将样本集分为若干子集;
步骤3:从第一个子集中的图片中随机选取一张图作为输入经过LeNet模型逼近Q(s,a;θ)函数,其中s表示状态,a表示动作,θ表示LeNet模型的权重;
步骤4:根据Q(s,a;θ)函数选取一个动作1或0,得到一个奖励和下一张图片;其中,1和0分别表示图片的2个对立的类别;所述得到一个奖励,如果分类正确,则+1分;如果分类错误,则-1分;得分越高分类准确率越高;
步骤5:根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型;
步骤6:得到的下一张图作为更新后LeNet模型的输入,回转执行步骤3直到遍历第一个子集中的所有图片,保存模型;
步骤7:将后一个子集中的图片添加到前面的子集中,回转执行步骤3;
步骤8:对比每次的准确率;
如果准确率下降,微调LeNet模型,所有的训练要重新开始,从第一个子集中的图片开始,回转执行步骤3;其中所述微调LeNet模型,是增加1*1的卷积层;
如果准确率增加或不变,则保存模型。
2.根据权利要求1所述的动态图像分类方法,其特征在于:步骤3中所述LeNet模型,包括3层5*5的卷积层、两层池化层和两层全连接层。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910031358.3A CN109840552B (zh) | 2019-01-14 | 2019-01-14 | 一种动态图像分类方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910031358.3A CN109840552B (zh) | 2019-01-14 | 2019-01-14 | 一种动态图像分类方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN109840552A CN109840552A (zh) | 2019-06-04 |
| CN109840552B true CN109840552B (zh) | 2020-04-10 |
Family
ID=66883811
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201910031358.3A Expired - Fee Related CN109840552B (zh) | 2019-01-14 | 2019-01-14 | 一种动态图像分类方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN109840552B (zh) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111633647B (zh) * | 2020-05-26 | 2021-06-22 | 山东大学 | 一种基于深度强化学习的多模融合机器人缝制方法及系统 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104766096B (zh) * | 2015-04-17 | 2017-11-10 | 南京大学 | 一种基于多尺度全局特征和局部特征的图像分类方法 |
| US11580398B2 (en) * | 2016-10-14 | 2023-02-14 | KLA-Tenor Corp. | Diagnostic systems and methods for deep learning models configured for semiconductor applications |
| CN106874956B (zh) * | 2017-02-27 | 2018-10-23 | 陕西师范大学 | 图像分类卷积神经网络结构的构建方法 |
| CN107016409A (zh) * | 2017-03-20 | 2017-08-04 | 华中科技大学 | 一种基于图像显著区域的图像分类方法和系统 |
| CN108537277A (zh) * | 2018-04-10 | 2018-09-14 | 湖北工业大学 | 一种图像分类识别的方法 |
-
2019
- 2019-01-14 CN CN201910031358.3A patent/CN109840552B/zh not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| CN109840552A (zh) | 2019-06-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110799992B (zh) | 使用模拟和域适配以用于机器人控制 | |
| US11640518B2 (en) | Method and apparatus for training a neural network using modality signals of different domains | |
| CN111507419A (zh) | 图像分类模型的训练方法及装置 | |
| CN112232395B (zh) | 一种基于联合训练生成对抗网络的半监督图像分类方法 | |
| CN110880176B (zh) | 一种基于对抗生成网络的半监督工业图像缺陷分割方法 | |
| CN110209857B (zh) | 基于神经网络结构搜索的车辆多属性识别方法、装置、介质 | |
| TWI785739B (zh) | 目標模型的獲取方法、電子設備與儲存媒體 | |
| CN114037055A (zh) | 数据处理系统、方法、装置、设备及存储介质 | |
| CN112766315A (zh) | 一种用于测试人工智能模型鲁棒性的方法和系统 | |
| CN113449878B (zh) | 数据分布式的增量学习方法、系统、设备及存储介质 | |
| CN117237720A (zh) | 基于强化学习的标签噪声矫正图像分类方法 | |
| CN110807291A (zh) | 一种基于拟态对抗学习机制的现场态势未来引导技术 | |
| CN113689348A (zh) | 多任务图像复原方法、系统、电子设备及存储介质 | |
| CN115953618A (zh) | 一种通过特征解耦实现无监督域自适应图像分类的方法 | |
| CN113837296B (zh) | 一种基于两阶段融合结构搜索的rgbt视觉跟踪方法及系统 | |
| CN109840552B (zh) | 一种动态图像分类方法 | |
| CN119863706A (zh) | 一种基于特征蒸馏和改进YOLOv8的轻量化果实目标检测方法 | |
| CN113033410B (zh) | 基于自动数据增强的域泛化行人重识别方法、系统及介质 | |
| CN114298168A (zh) | 一种三维点云处理方法及系统 | |
| CN114463596A (zh) | 一种超图神经网络的小样本图像识别方法、装置及设备 | |
| CN114445684B (zh) | 车道线分割模型的训练方法、装置、设备及存储介质 | |
| CN116702872A (zh) | 基于离线预训练状态转移Transformer模型的强化学习方法和装置 | |
| WO2020087254A1 (zh) | 卷积神经网络的优化方法及相关产品 | |
| CN111144497B (zh) | 基于美学分析的多任务深度网络下的图像显著性预测方法 | |
| CN113591647B (zh) | 人体动作识别方法、装置、计算机设备和存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant | ||
| CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200410 |
|
| CF01 | Termination of patent right due to non-payment of annual fee |