CN109840552B

CN109840552B - 一种动态图像分类方法

Info

Publication number: CN109840552B
Application number: CN201910031358.3A
Authority: CN
Inventors: 舒军; 杨露; 吴柯; 蒋明威; 李振亚; 邓明舟; 舒心怡; 潘健; 王淑青
Original assignee: Hubei University of Technology
Current assignee: Hubei University of Technology
Priority date: 2019-01-14
Filing date: 2019-01-14
Publication date: 2020-04-10
Anticipated expiration: 2039-01-14
Also published as: CN109840552A

Abstract

本发明公开了一种动态图像分类方法，从图片中随机选取一张图作为输入经过LeNet模型得到Q函数；根据Q函数选取一个动作1或0得到一个奖励和下一张图片；根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型。得到的下一张图作为更新后LeNet模型的输入重复上述操作直到遍历所有图片，保存模型。本发明结合LeNet和强化学习中Qlearning算法用来处理动态图像分类问题，本发明可以用来处理各种大样本数据集如ciffa10，ciffa100等。

Description

一种动态图像分类方法

技术领域

本发明属于图像分类技术领域，涉及一种动态图像分类方法，具体涉及一种基于深度学习和强化学习的动态图像分类方法。

背景技术

随着人工智能的发展，基于深度学习的图像分类有着广泛的应用前景和重要研究价值，近年来成为了研究热点领域，无论是工业应用，还是学术研究都已取得了许多有价值的成果。强化学习是机器学习的一个重要分支，主要用来解决决策问题。强化学习可以在复杂的、不确定的环境中学习如何实现设定的目标，并且应用场景非常广，如控制机器人的电机让它执行特定任务、给商品定价或者进行库存管理、玩视频游戏或棋牌游戏等。

深度学习算法如AlexNet,VggNet，ResNet等处理图像分类问题时，训练完成后参数就固定了，无法改变。而生产线上的图片是源源不断的、动态的，需要模型可以随时更新，故深度学习算法无法解决此类动态问题，而目前强化学习主要应用于处理游戏，没有适用于图像分类方向的算法。

发明内容

为了解决上述技术问题，本发明开拓性地提出了一种基于深度学习和强化学习的动态图像分类方法，结合LeNet模型的提取特征能力和强化学习算法中Qlearning的动态决策能力处理生产线上图片不断增加的问题。

本发明所采用的技术方案是：一种动态图像分类方法，其特征在于，包括以下步骤：

步骤1：获取若干图片，作为样本集；

步骤2：将样本集分为若干子集；

步骤3：从第一个子集中的图片中随机选取一张图作为输入经过LeNet模型逼近Q(s,a；θ)函数，其中s表示状态，a表示动作，θ表示LeNet模型的权重；

步骤4：根据Q(s,a；θ)函数选取一个动作1或0，得到一个奖励和下一张图片；其中，1和0分别表示图片的2个对立的类别；所述得到一个奖励，如果分类正确，则+1分；如果分类错误，则-1分；得分越高分类准确率越高；

步骤5：根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型；

步骤6：得到的下一张图作为更新后LeNet模型的输入重复上述操作直到遍历第一个子集中的所有图片，保存模型；

步骤7：将第后一个子集中的图片添加到前面的子集中，回转执行步骤3；

步骤8：对比每次的准确率；

如果准确率下降，所有的训练要重新开始，从第一个子集中的图片开始，回转执行步骤3；

如果准确率增加或不变，则保存模型。

相对现有技术，本发明的有益效果是：结合了LeNet模型(已有的深度学习模型)和Qlearning(已有的强化学习算法)用于处理动态图片分类问题，深度学习算法单独使用不能够处理动态图片分类问题，而强化学习目前几乎没有用于图像分类领域的算法，本技术将两者结合并用于处理动态图片分类问题。

附图说明

图1为本发明实施例的流程图；

图2为本发明实施例中LeNet模型图；

图3为本发明实施例的LeNet与Qlearning算法原理图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

请见图1和图3，本发明提供的一种动态图像分类方法，包括以下步骤：

步骤1：获取若干图片，作为样本集；

本实施例以龙虾样本为例，选取本地图片20000张；

步骤2：将样本集分为若干子集；

本实施例将将样本集分为4份，每份5000张，为模拟动态过程做准备。

请见图2，本实施例的LeNet模型，包括3层5*5的卷积层、两层池化层和两层全连接层。

步骤4：根据Q(s,a；θ)函数选取一个动作1或0，得到一个奖励和下一张图片；其中，1和0分别表示图片的2个对立的类别(本实施例1和0分别表示好的龙虾图片和坏的龙虾图片)；所述得到一个奖励，如果分类正确，则+1分；如果分类错误，则-1分；

因为每一张图片都做了分类，将样本分为两类，以龙虾为例，将好的龙虾分为一类用1作为标签，龙虾用0作为标签，分类正确+1分，分类错误-1分，最终是通过得到的分数来判断分类的准确性，得分越高分类准确率越高，分类效果越好。

本实施例训练时依次增加图片，第一次5000张，第二次10000张，第三次15000，第四次20000张，通过这种方法模拟动态过程。

步骤8：对比每次的准确率；

如果准确率下降，调LeNet模型比如增加1*1的卷积模块等方法来加强算法，所有的训练要重新开始，从第一个子集中的图片开始，回转执行步骤3；

如果准确率增加或不变，则保存模型。

本发明主要应用于动态图像分类，单独使用目前分类效果较好的深度学习算法无法处理在生产线上图片不断增加这类动态问题，而目前强化学习主要应用于处理游戏。故本发明结合LeNet和强化学习中Qlearning算法用来处理动态图像分类问题。本发明也可以用来处理各种大样本数据集如ciffa10，ciffa100等。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

Claims

1.一种动态图像分类方法，其特征在于，包括以下步骤：

步骤1：获取若干图片，作为样本集；

步骤2：将样本集分为若干子集；

步骤6：得到的下一张图作为更新后LeNet模型的输入，回转执行步骤3直到遍历第一个子集中的所有图片，保存模型；

步骤7：将后一个子集中的图片添加到前面的子集中，回转执行步骤3；

步骤8：对比每次的准确率；

如果准确率下降，微调LeNet模型，所有的训练要重新开始，从第一个子集中的图片开始，回转执行步骤3；其中所述微调LeNet模型，是增加1*1的卷积层；

如果准确率增加或不变，则保存模型。

2.根据权利要求1所述的动态图像分类方法，其特征在于：步骤3中所述LeNet模型，包括3层5*5的卷积层、两层池化层和两层全连接层。