CN114463667A

CN114463667A - 基于视频识别的小样本学习方法

Info

Publication number: CN114463667A
Application number: CN202111629047.0A
Authority: CN
Inventors: 费树岷; 陆志刚; 王彬彬
Original assignee: Nanjing Dongqi Intelligent Manufacturing Research Institute Co ltd
Current assignee: Nanjing Dongqi Intelligent Manufacturing Research Institute Co ltd
Priority date: 2021-12-29
Filing date: 2021-12-29
Publication date: 2022-05-10

Abstract

本发明公开了基于视频识别的小样本学习方法，包括如下步骤：采集多帧连续的视频图像，并生成预处理图像；切割预处理图像，在所采集的多帧连续的视频图像中检测被识别对象的目标区域；将被识别对象的目标区域，传输至SSD算法模块，利用SSD算法提取各帧视频图像中被识别对象目标区域的特点；根据提取的被识别对象目标区域的特点，构建用于学习的深度神经网络模型；基于公用数据库训练深度神经网络模型，并对采集多帧连续的视频图像进行识别测试；选取少量未识别的视频图像建立训练样本库。本发明针对小样本数据集的特征提取方法能通过网络模型的特征提取性能，可以实现视频图像数据的小样本学习，节省大量的视频识别时间。

Description

基于视频识别的小样本学习方法

技术领域

本发明涉及视频图像处理技术领域，尤其涉及基于视频识别的小样本学习方法。

背景技术

随着深度学习在图像领域内的飞速发展，计算机对图像的识别已经接近甚至超越人类的表现。近几年来大数据技术、卷积神经网络和计算及性能都在飞速发展，大规模数据的图像任务，例如图像分类、目标检测、图像分割等都已经发展的非常成熟。然而目前主流的深度学习网络模型都针对样本数量较大的任务提出，而忽略了现实生活中大多数任务场景下数据量稀缺的问题，大数据样本训练费时、耗力，业界已开始探索小样本机器学习方法。

发明内容

基于背景技术存在的技术问题，本发明提出了基于视频识别的小样本学习方法。

本发明提出的基于视频识别的小样本学习方法，包括如下步骤：

S1采集多帧连续的视频图像，并生成预处理图像；

S2切割预处理图像，在所采集的多帧连续的视频图像中检测被识别对象的目标区域；

S3将被识别对象的目标区域，传输至SSD算法模块，利用SSD算法提取各帧视频图像中被识别对象目标区域的特点；

S4根据提取的被识别对象目标区域的特点，构建用于学习的深度神经网络模型；

S5基于公用数据库训练深度神经网络模型，并对采集多帧连续的视频图像进行识别测试；

S6选取少量未识别的视频图像建立训练样本库；

S7用建立训练样本库继续训练深度神经网络；

S8用训练好的深度神经网络对采集多帧连续的视频图像进行识别测试。

优选的，所述视频图像通过卷积块进行特征提取，得到图像投融资，通过池化层对提取后的图像特征进行全局特征提取，得到全局特征标量。

优选的，根据所提取的各帧视频图像中被识别对象目标区域的特征，分析被识别对象的目标区域有否出现持续时间位于最小阈值与最大阈值之间的动作，并将目标区域出现了持续时间位于最小阈值与最大阈值之间的动作的被识别对象确定为被识别对象，最小阈值为0.1秒，最大阈值为0.5秒。

优选的，所述步骤S6选取少量未识别的视频图像，是指选取的图像占图像总数的比例小，这个比例需要小于10％。

优选的，所述步骤S7训练样本库，需要对每一个样本图像进行标注。

优选的，所述的深度神经网络模型，主要用于对目标进行检测，深度神经网络模型为R-CNN系列模型。

优选的，所述深度神经网络模型进行优化，根据深度神经网络模型输出的特征向量计算总损失函数，利用随机梯度下降法优化总损失函数，得到优化后的深度神经网络模型。

优选的，所述步骤S2具体为切割视频图像，并将切割后的预处理图像传输至SSD算法模块，生成基于运动物体的预处理图像块，利用SSD算法提取并识别运动目标的生物特征，完成对目标区域特点的提取。

本发明中，所述基于视频识别的小样本学习方法，针对小样本数据集的特征提取方法能通过网络模型的特征提取性能，可以实现视频图像数据的小样本学习，节省大量的视频识别时间。

附图说明

图1为本发明提出的基于视频识别的小样本学习方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

参照图1，基于视频识别的小样本学习方法，包括如下步骤：

S1采集多帧连续的视频图像，并生成预处理图像；

S6选取少量未识别的视频图像建立训练样本库；

S7用建立训练样本库继续训练深度神经网络；

本发明中，视频图像通过卷积块进行特征提取，得到图像投融资，通过池化层对提取后的图像特征进行全局特征提取，得到全局特征标量。

本发明中，根据所提取的各帧视频图像中被识别对象目标区域的特征，分析被识别对象的目标区域有否出现持续时间位于最小阈值与最大阈值之间的动作，并将目标区域出现了持续时间位于最小阈值与最大阈值之间的动作的被识别对象确定为被识别对象，最小阈值为0.1秒，最大阈值为0.5秒。

本发明中，步骤S6选取少量未识别的视频图像，是指选取的图像占图像总数的比例小，这个比例需要小于10％。

本发明中，步骤S7训练样本库，需要对每一个样本图像进行标注。

本发明中，深度神经网络模型，主要用于对目标进行检测，深度神经网络模型为R-CNN系列模型。

本发明中，深度神经网络模型进行优化，根据深度神经网络模型输出的特征向量计算总损失函数，利用随机梯度下降法优化总损失函数，得到优化后的深度神经网络模型。

本发明中，步骤S2具体为切割视频图像，并将切割后的预处理图像传输至SSD算法模块，生成基于运动物体的预处理图像块，利用SSD算法提取并识别运动目标的生物特征，完成对目标区域特点的提取。

本发明：采集多帧连续的视频图像，并生成预处理图像；切割预处理图像，在所采集的多帧连续的视频图像中检测被识别对象的目标区域；将被识别对象的目标区域，传输至SSD算法模块，利用SSD算法提取各帧视频图像中被识别对象目标区域的特点；根据提取的被识别对象目标区域的特点，构建用于学习的深度神经网络模型；基于公用数据库训练深度神经网络模型，并对采集多帧连续的视频图像进行识别测试；选取少量未识别的视频图像建立训练样本库；用建立训练样本库继续训练深度神经网络；用训练好的深度神经网络对采集多帧连续的视频图像进行识别测试。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.基于视频识别的小样本学习方法，其特征在于，包括如下步骤：

S1采集多帧连续的视频图像，并生成预处理图像；

S6选取少量未识别的视频图像建立训练样本库；

S7用建立训练样本库继续训练深度神经网络；

2.根据权利要求1所述的基于视频识别的小样本学习方法，其特征在于，所述视频图像通过卷积块进行特征提取，得到图像投融资，通过池化层对提取后的图像特征进行全局特征提取，得到全局特征标量。

3.根据权利要求1所述的基于视频识别的小样本学习方法，其特征在于，根据所提取的各帧视频图像中被识别对象目标区域的特征，分析被识别对象的目标区域有否出现持续时间位于最小阈值与最大阈值之间的动作，并将目标区域出现了持续时间位于最小阈值与最大阈值之间的动作的被识别对象确定为被识别对象，最小阈值为0.1秒，最大阈值为0.5秒。

4.根据权利要求1所述的基于视频识别的小样本学习方法，其特征在于，所述步骤S6选取少量未识别的视频图像，是指选取的图像占图像总数的比例小，这个比例需要小于10％。

5.根据权利要求1所述的基于视频识别的小样本学习方法，其特征在于，所述步骤S7训练样本库，需要对每一个样本图像进行标注。

6.根据权利要求1所述的基于视频识别的小样本学习方法，其特征在于，所述的深度神经网络模型，主要用于对目标进行检测，深度神经网络模型为R-CNN系列模型。

7.根据权利要求1所述的基于视频识别的小样本学习方法，其特征在于，所述深度神经网络模型进行优化，根据深度神经网络模型输出的特征向量计算总损失函数，利用随机梯度下降法优化总损失函数，得到优化后的深度神经网络模型。

8.根据权利要求1所述的基于视频识别的小样本学习方法，其特征在于，所述步骤S2具体为切割视频图像，并将切割后的预处理图像传输至SSD算法模块，生成基于运动物体的预处理图像块，利用SSD算法提取并识别运动目标的生物特征，完成对目标区域特点的提取。