CN113269139B

CN113269139B - 一种针对复杂场景的自学习大规模警员图像分类模型

Info

Publication number: CN113269139B
Application number: CN202110677796.4A
Authority: CN
Inventors: 宋荣伟; 罗礼斌; 刘汪洋; 曹扬; 刘兰; 范振军
Original assignee: CETC Big Data Research Institute Co Ltd
Current assignee: CETC Big Data Research Institute Co Ltd
Priority date: 2021-06-18
Filing date: 2021-06-18
Publication date: 2023-09-26
Anticipated expiration: 2041-06-18
Also published as: CN113269139A

Abstract

本发明提供了一种针对复杂场景的自学习大规模警员图像分类模型，通过优化警员图像数据集构建和模型训练过程，对大规模警员图像数据集进行筛选，结合图像主体区域检测模型减少数据中的噪声，增强了对复杂场景的识别，同时利用迁移学习方法降低了模型训练的难度，迭代训练了一个警员图像分类模型，进一步将模型运用在原始大规模警员图片数据集中，实现了警员图像分类模型自学习过程。相对于传统的直接在原始数据集上进行训练的图像分类模型，本方法解决了训练大规模警员图像分类模型缺少标注数据的问题，并针对警员图像数据场景复杂的特征进行了数据筛选与语义增强，从而能够更准确的实现对警员图像的分类与识别。

Description

一种针对复杂场景的自学习大规模警员图像分类模型

技术领域

本发明涉及一种针对复杂场景的自学习大规模警员图像分类模型，属于计算机视觉技术领域。

背景技术

警员分类技术广泛应用于各类监狱视频监控场景中，合理的对警员进行分类处理不仅能快速识别视频目标，也能节省人力物力，产生巨大的经济效益，但各式各样的场景与需求使得人们合理的进行分类变得十分困难。因此，如何通过自动化的方法快速的对警员进行分析，识别其所属类别，成为了一个迫切的需求，警员图像分类技术是其中一个可行有效的解决方案。

传统的警员图像分类技术通过建立图像分类模型，在大量的标注数据上进行训练，得到警员图像分类模型，然而算法需要大量的人工标注数据，在人力、财力和时间方面消耗较大，并且主观的标注和警员图像中的噪声也会对模型的分类效果产生巨大影响。同时传统方法也不具备自动学习更新能力，一旦变更分类标准或者产生新的种类警员，模型都需要重新进行训练。本发明提出了一种针对复杂场景的自学习大规模警员图像分类模型，通过构建迭代训练机制以及采用主体区域检测消除警员图像数据噪声的方法，有效的解决了警员图像数据标注、噪声影响以及模型更新的问题。

发明内容

为解决上述技术问题，本发明提供了一种针对复杂场景的自学习大规模警员图像分类模型，该针对复杂场景的自学习大规模警员图像分类模型通过优化警员图像数据集构建和模型训练过程，对大规模警员图像数据集进行筛选，结合图像主体区域检测模型减少数据中的噪声，增强了对复杂场景的识别，同时利用迁移学习方法降低了模型训练的难度，迭代训练了一个警员图像分类模型，进一步将模型运用在原始大规模警员图片数据集中，实现了警员图像分类模型自学习过程。

本发明通过以下技术方案得以实现。

本发明提供的一种针对复杂场景的自学习大规模警员图像分类模型，其特征在于：首先利用权威分类指标体系对原始警员图片数据集的数据进行人工筛选，获取标注数据集；其次，通过主体区域检测注意力模型去除图片中的噪声数据，生成精确数据集；然后利用迁移学习图像分类模型，结合基于DenseNet的图像分类算法，在精确数据集上进行训练，获取警员图像分类算法模型；最后将警员图像分类算法模型运用到原始警员图片数据集中进行自动分类，并不断迭代上述流程，获取自学习警员图像分类算法模型。

本发明包括以下步骤：

①人工筛选数据集：从原始警员图片数据集中，利用权威分类指标体系，人工筛选数据，获取标注数据集；

②主体区域检测：对标注数据集采用主体区域检测注意力模型进行主体区域检测，获取警员图片中的主体内容，再去除图片中的噪声，获取图像分类数据集；

③基于DenseNet的警员图像分类算法：利用迁移学习图像分类模型，在原始警员图片数据集上进行预训练得到图像分类模型；结合DenseNet图像分类算法和图像分类模型，在图像分类数据集上进行再训练，获取警员图像分类算法模型；

④自学习警员图像分类算法模型：利用步骤③中的警员图像分类算法模型，对原始警员图片数据集中的数据进行自动分类，获取预警员图像分类算法模型，再运用步骤②中获取的图像分类数据集，进一步训练预警员图像分类算法模型，然后不断进行迭代训练，直至原始警员图片数据集中的所有数据训练完成，得到自学习警员图像分类算法模型。

所述步骤①中，权威分类指标体系是指国家发布的警员分类体系所定义的分类标准，通过人工对每类警员筛选50张警员图像，形成标注数据集。

所述步骤②中，主体区域检测采用VGG net模型提取图像特征，并采用特征金字塔注意力模型进行图像语义分割，识别图像中的主体区域，提取主体区域形成精确警员图像，去除原始图像中的噪声。

所述步骤③中，利用densenet121模型在原始警员图片数据集上预训练得到的图像分类模型，提取其网络特征作为DenseNet图像分类算法模型的输入。

所述步骤④中，每次自学习训练过程只采用原始警员图片数据集中的部分数据，第一次训练过后，每次在之前得到的警员图像分类算法模型上再进行训练，不断迭代。

所述步骤①分为以下步骤：

(1.1)确定采用的分类指标体系标准；

(1.2)根据分类标准人工筛选警员图片，并分为两组同时进行交叉验证。

所述步骤②分为以下步骤：

(2.1)将输入的警员图像缩放为(256,256,3)的尺寸大小，并进行图像预处理，然后输入到用于主体区域检测的特征金字塔注意力模型中；

(2.2)特征金字塔注意力模型首先通过预训练的VGG net网络模型进行特征提取，获取输入图像的低层特征与高层特征；

(2.3)对(2.2)中获取到的低层特征与高层特征，通过上下文感知的特征金字塔提取模块以及注意力机制进行特征融合，获得完整的上下文特征；

(2.4)将融合特征进行单通道卷积，并在最后使用任意一种边缘损失函数来指导模型在主体区域提取中学习完整的信息，对图像中的警员主体区域进行分割输出，获取图像分类数据集。

所述步骤③分为以下步骤：

(3.1)在原始警员图片数据集上利用DenseNet121模型进行预训练，得到图像分类模型；

(3.2)提取预训练模型的参数网络作为基于DenseNet的警员图像分类算法的模型参数，并将警员图像缩放为(224,224,3)的尺寸大小输入到DenseNet121模型中；

(3.3)DenseNet模型的网络采用密集连接方式，对输入图像进行逐层特征提取，并通过特征并联来实现短路连接，利用特征重用、图像的高层特征与底层特征，进行不断迭代训练以及相应的模型推理，获取警员图像分类算法模型。

所述步骤④分为以下步骤：

(4.1)采用步骤③中得到的警员图像分类算法模型对原始警员图片数据集中的数据进行分类；

(4.2)对分类后的警员图片数据进行主体区域检测，并提取出主体区域图像，形成图像分类数据集；

(4.3)在步骤③得到的警员图像分类算法模型基础上，应用图像分类数据集进行再次训练，获取新一轮迭代训练的警员图像分类算法模型；

(4.4)循环进行步骤(4.1)～(4.3)中的操作，直到原始警员图片数据集训练完成，获取自学习警员图像分类算法模型。

本发明的有益效果在于：通过优化警员图像数据集构建和模型训练过程，对大规模警员图像数据集进行筛选，结合图像主体区域检测模型减少数据中的噪声，增强了对复杂场景的识别，同时利用迁移学习方法降低了模型训练的难度，迭代训练了一个警员图像分类模型，进一步将模型运用在原始大规模警员图片数据集中，实现了警员图像分类模型自学习过程。相对于传统的直接在原始数据集上进行训练的图像分类模型，本方法解决了训练大规模警员图像分类模型缺少标注数据的问题，并针对警员图像数据场景复杂的特征进行了数据筛选与语义增强，从而能够更准确的实现对警员图像的分类与识别。

附图说明

图1是本发明的流程图；

图2是本发明实施例用于主体区域检测的特征金字塔注意力模型；

图3是本发明实施例DenseNet121具体网络结构图。

具体实施方式

下面进一步描述本发明的技术方案，但要求保护的范围并不局限于所述。

实施例1

如图1所示，一种针对复杂场景的自学习大规模警员图像分类模型，首先对原始大规模警员图片数据集的部分数据利用权威分类指标体系进行人工筛选，得到小量标注数据集，通过主体区域检测注意力模型去除图片中的噪声数据，生成精确小量数据集，然后利用迁移学习图像分类模型，结合基于DenseNet的图像分类算法，在精确小量数据集上进行训练，得到警员图像分类算法模型，最后将模型运用到原始大规模警员图片数据集中进行自动分类，并不断迭代上述流程，获取大规模警员图像分类算法模型。

本发明具体包括以下步骤：

①人工筛选小量数据集：从原始大规模警员图片数据集中，利用权威分类指标体系，人工筛选部分数据，得到标注数据集；

②主体区域检测：对标注数据集采用主体区域检测注意力模型进行主体区域检测，获取警员图片中的主体内容，去除图片中的噪声，生成精确警员图片数据集；

③基于DenseNet的警员图像分类算法：利用迁移学习思想，在大规模图像分类数据集上进行预训练得到图像分类模型，结合DenseNet图像分类算法进行再训练，可降低模型训练的资源消耗及难度，提升分类模型精度；

④警员图像分类算法模型：将精确警员图片数据集在图像分类模型上进行训练，得到警员图像分类算法模型；

⑤自学习大规模警员图像分类算法模型：利用步骤④中得到的警员图像分类算法模型，对原始警员图片数据集中的数据进行自动分类，再运用步骤②中的主体区域检测，得到精确小量数据集，进一步训练步骤④中的模型，得到更精确的警员图像分类算法模型，然后不断进行迭代训练，直至原始警员图片数据集中所有数据训练完成，得到大规模警员图像分类算法模型；

所述步骤①中，权威分类指标体系是指国家发布的警员分类体系所定义的分类标准，通过人工对每类警员筛选50张警员图像，形成小量数据集。

所述步骤②中，主体区域检测采用VGG net模型提取图像特征，并采用特征金字塔注意力模型进行图像语义分割，识别图像中的主体区域，并提取主体区域形成精确警员图像，去除原始图像中的噪声，如图2所示。

所述步骤③中，利用densenet121模型在ImageNet大规模图像数据集上预训练得到的分类模型，提取其网络特征作为DenseNet图像分类算法模型的输入，如图3所示。

所述步骤⑤中，每次自学习训练过程只采用原始大规模警员图片数据集中的部分数据，第一次训练过后，每次在之前得到的模型上再进行训练，不断迭代。

所述步骤①分为以下步骤：

(1.1)确定采用的分类指标体系标准；

(1.2)根据分类标准人工筛选警员图片，并分为两组同时进行，交叉验证，减少人为分类的主观因素影响。

所述步骤②分为以下步骤：

(2.2)该模型首先通过预训练的VGG net网络模型进行特征提取，从而获取输入图像的低层特征与高层特征；

(2.3)对(2.2)中获取到的低层特征与高层特征，通过上下文感知的特征金字塔提取模块以及注意力机制进行特征融合，获得丰富的上下文特征；

(2.4)将融合特征进行单通道卷积，并在最后使用任意一种边缘损失函数来指导模型在主体区域提取中学习更详细的信息，对图像中的警员主体区域进行分割输出。

所述步骤③分为以下步骤：

(3.1)在ImageNet大规模图像数据集上利用DenseNet121模型进行预训练，得到图像分类模型；

(3.3)DenseNet模型的网络采用密集连接方式，对输入图像进行逐层特征提取，并通过特征并联来实现短路连接，实现了特征重用，结合了图像的高层特征与底层特征，进行不断的迭代训练以及相应的模型推理。

所述步骤⑤分为以下步骤：

(5.1)采用步骤④中得到的警员图像分类模型对原始大规模警员图片数据集中的部分数据进行分类；

(5.2)对分类后的警员图片数据进行主体区域检测，并提取出主体区域图像，形成精确小量数据集；

(5.3)在步骤④得到的模型基础上，应用精确小量数据集进行再次训练，得到新一轮迭代训练的警员图像分类模型；

(5.4)循环进行步骤(5.1)～(5.3)中的操作，直到原始大规模警员图片数据集训练完成；

(5.5)得到自学习大规模警员图像分类算法模型。

进一步的，本发明首先对原始警员图片数据集利用权威分类指标体系进行人工筛选分类，并进行主体区域检测提取去除噪声数据，再利用迁移学习模型，结合基于DenseNet的图像分类算法训练得到警员图像分类模型，最后将模型运用到原始大规模警员图片数据集中进行自动分类，并不断迭代上述流程，获取大规模警员图像分类算法模型。

具体的，本发明针对基于深度学习的警员图像分类方法需要大量人工标注数据而造成的人力、财力和时间消耗问题以及噪声数据对分类精度的影响问题，通过迭代训练自学习机制进行大规模警员图像分类模型训练，辅以主体区域检测去除数据噪声的方法，得到一种针对复杂场景的自学习大规模警员图像分类模型。

综上所述，本发明通过训练一种针对复杂场景的自学习大规模警员图像分类模型，能实现自动对警员图像进行识别分类，同时能避免复杂场景的噪声影响分类精度的问题；在实际应用中，可以快速的识别警员图像中的内容，并进行精确分类，达到在监狱视频监控场景中对警员进行分类处理的目的，有效解决了基于深度学习的警员图像分类模型缺少标注数据训练的问题，同时又避免了复杂场景的噪声造成的模型识别不准确、精度低的问题。

Claims

1.一种针对复杂场景的自学习大规模警员图像分类模型，其特征在于：首先利用权威分类指标体系对原始警员图像数据集的数据进行人工筛选，获取标注数据集；其次，通过主体区域检测注意力模型去除图像中的噪声数据，生成图像分类数据集；然后利用迁移学习图像分类模型，结合基于DenseNet的图像分类算法，在图像分类数据集上进行训练，获取警员图像分类算法模型；最后将警员图像分类算法模型运用到原始警员图像数据集中进行自动分类，并不断迭代上述流程，获取自学习大规模警员图像分类模型；

包括以下步骤：

①人工筛选数据集：从原始警员图像数据集中，利用权威分类指标体系，人工筛选数据，获取标注数据集；

②主体区域检测：对标注数据集采用主体区域检测注意力模型进行主体区域检测，获取警员图像中的主体内容，再去除图像中的噪声，获取图像分类数据集；

③基于DenseNet的警员图像分类算法：利用迁移学习图像分类模型，在原始警员图像数据集上进行预训练得到图像分类模型；结合DenseNet图像分类算法和图像分类模型，在图像分类数据集上进行再训练，获取警员图像分类算法模型；

④自学习大规模警员图像分类模型：利用步骤③中的警员图像分类算法模型，对原始警员图像数据集中的数据进行自动分类，获取预警员图像分类算法模型，再运用获取的图像分类数据集，进一步训练预警员图像分类算法模型，然后不断进行迭代训练，直至原始警员图像数据集中的所有数据训练完成，得到自学习大规模警员图像分类模型；

所述步骤④中，每次自学习训练过程只采用原始警员图像数据集中的部分数据，第一次训练过后，每次在之前得到的警员图像分类算法模型上再进行训练，不断迭代；

所述步骤②分为以下步骤：

（2.1）将输入的警员图像缩放为（256,256,3）的尺寸大小，并进行图像预处理；

（2.2）将图像预处理后的警员图像输入预训练的VGG net网络模型进行特征提取，获取输入图像的低层特征与高层特征；

（2.3）对（2.2）中获取到的低层特征与高层特征，通过上下文感知的特征金字塔提取模块以及注意力机制进行特征融合，获得完整的上下文特征，上下文特征为融合特征；

（2.4）将融合特征进行单通道卷积，并在最后使用任意一种边缘损失函数来指导模型在主体区域提取中学习完整的信息，对图像中的警员主体区域进行分割输出，获取图像分类数据集；

所述步骤③分为以下步骤：

（3.1）在原始警员图像数据集上利用DenseNet121模型进行预训练，得到图像分类模型；

（3.2）提取图像分类模型的网络参数作为基于DenseNet的警员图像分类算法的模型参数，并将警员图像缩放为（224,224,3）的尺寸大小输入到DenseNet的警员图像分类算法的DenseNet模型中；

（3.3）DenseNet模型的网络采用密集连接方式，对输入图像进行逐层特征提取，并通过特征并联来实现短路连接，利用特征重用、图像的高层特征与底层特征，进行不断迭代训练以及相应的模型推理，获取警员图像分类算法模型；

所述步骤④分为以下步骤：

（4.1）采用步骤③中得到的警员图像分类算法模型对原始警员图像数据集中的数据进行分类；

（4.2）对分类后的警员图像数据进行主体区域检测，并提取出主体区域图像，形成图像分类数据集；

（4.3）在步骤③得到的警员图像分类算法模型基础上，应用步骤（4.2）中的图像分类数据集进行再次训练，获取新一轮迭代训练的警员图像分类算法模型；

（4.4）循环进行步骤（4.1）~（4.3）中的操作，直到原始警员图像数据集训练完成，获取自学习大规模警员图像分类模型。

2.如权利要求1所述的针对复杂场景的自学习大规模警员图像分类模型，其特征在于：所述步骤②中，主体区域检测采用VGG net模型提取图像特征，并采用特征金字塔注意力模型进行图像语义分割，识别图像中的主体区域，提取主体区域形成精确警员图像，去除原始图像中的噪声。