CN111310591A

CN111310591A - 多类型样本数据制作装置及方法

Info

Publication number: CN111310591A
Application number: CN202010064545.4A
Authority: CN
Inventors: 杨曼艺; 冯瑞
Original assignee: Fudan University
Current assignee: Fudan University
Priority date: 2020-01-20
Filing date: 2020-01-20
Publication date: 2020-06-19

Abstract

本发明提供一种多类型样本数据制作装置，其特征在于，用于对导入的视频数据进行自动地目标检测以及多类型处理从而生成样本数据，包括：视频处理部，用于对视频数据进行预处理从而去除视频数据中模糊、无目标物体的帧并得到作为原始样本集的多个预处理帧；分辨率处理部，用于根据预设的放缩比例并利用双线性差值算法对预处理帧进行分辨率的放缩从而得到作为多尺度样本集的多个不同尺度的图像帧；对比度处理部，用于对预处理帧进行降低对比度处理从而得到作为低对比度样本集的多个不同对比度的图像帧；噪声处理部，用于对预处理帧进行添加噪声处理从而得到作为噪声样本集的多个被添加随机噪声的图像帧；数据命名存储部，用于对图像帧进行统一命名并存储为样本数据。

Description

多类型样本数据制作装置及方法

技术领域

本发明属于计算机视觉、图像处理技术领域，具体涉及一种实现多类型行人样本数据的数据集制作装置及方法。

背景技术

目前，在计算机视觉研究领域中，基于深度学习的算法在各个方向都有着良好的表现，其中大部分算法是根据卷积神经网络进行设计，通过采用预先准备好的数据集进行预训练，从而使得训练后的卷积神经网络能够根据训练的完成任务。

然而，基于深度学习的算法的优化及改进离不开大量的数据支持及验证。现存的大部分数据集都具有数据质量高低不等、数据标注内容不够丰富、数据场景过于单一、数据格式不统一等问题。特别是在图像数据类型上，目前已有的行人样本数据图像数据类型单一，同样的样本数据尺度单一，缺少低质量的样本数据。

而多尺度和低质量数据对算法训练和测试来说必不可少，若缺少了数据集，基于图像数据的卷积神经网络就难以发挥较好的识别效果，也难以对该卷积神经网络进行优化，从而在使用中容易产生误识别、无法识别等问题。

发明内容

为解决上述问题，提供一种能够规范地半自动化实现行人检测级行人重识别的大型数据集制作的装置及方法，本发明采用了如下技术方案：

本发明提供了一种多类型样本数据制作装置，其特征在于，用于对导入的视频数据进行自动地目标检测以及多类型处理从而生成样本数据，包括：视频处理部，用于对视频数据进行预处理从而去除视频数据中模糊、无目标物体的帧并得到作为原始样本集的多个预处理帧；分辨率处理部，用于根据预设的放缩比例并利用双线性差值算法对预处理帧进行分辨率的放缩从而得到作为多尺度样本集的多个不同尺度的图像帧；对比度处理部，用于对预处理帧进行降低对比度处理从而得到作为低对比度样本集的多个不同对比度的图像帧；噪声处理部，用于对预处理帧进行添加噪声处理从而得到作为噪声样本集的多个被添加随机噪声的图像帧；数据命名存储部，用于对多尺度样本集、低对比度样本集以及噪声样本集中的图像帧进行统一命名并存储为样本数据。

本发明提供的多类型样本数据制作装置，还可以具有这样的技术特征，其中，预处理包括：使用帧间差分法去除视频数据中模糊且无目标的帧；从处理后的视频数据中每五帧抽取一帧作为预处理帧。

本发明提供的多类型样本数据制作装置，还可以具有这样的技术特征，其中，放缩比例的取值在0.5至3间。

本发明提供的多类型样本数据制作装置，还可以具有这样的技术特征，其中，添加噪声处理为在预处理图像帧中随机增加椒盐噪声与高斯噪声。

本发明还提供了一种多类型样本数据制作方法，其特征在于，包括如下步骤：步骤S1，对视频数据进行预处理从而去除视频数据中模糊、无目标物体的帧并得到作为原始样本集的多个预处理帧；步骤S2，根据预设的放缩比例并利用双线性差值算法对预处理帧进行分辨率的放缩从而得到作为多尺度样本集的多个不同尺度的图像帧；步骤S3，对预处理帧进行降低对比度处理从而得到作为低对比度样本集的多个不同对比度的图像帧；步骤S4，对预处理帧进行添加噪声处理从而得到作为噪声样本集的多个被添加随机噪声的图像帧；步骤S5，对多尺度样本集、低对比度样本集以及噪声样本集中的图像帧进行统一命名并存储为样本数据。

发明作用与效果

根据本发明的多类型样本数据制作装置及方法，由于通过帧间差分对输入的视频数据进行预处理，因此有效地去除了视频数据中无目标以及模糊的帧。同时，由于结合了多种类型的图像处理方法分别对预处理后的视频帧进行处理，生成了多种类型的样本集，从而解决了数据类型单一的问题。进一步，由于通过双线性插值方法处理得到多尺度的图像，还通过降低对比度以及模拟高斯分布将视频帧处理为低质量图像，从而有助于在利用本实施例构建的样本数据对卷积神经网络进行训练时，能够因为训练集中富含低质量图像以及多尺度图像从而最终得到稳定性及识别率更高的卷积神经网络。因此，通过本实施例的多类型样本数据制作装置及方法，能够得到格式统一、多尺度、多类型的样本数据，不仅方便了用户根据实际需要构建相应的样本数据，还方便了用户通过该样本数据构建训练数据集从而对卷积神经网络进行训练。

附图说明

图1是本发明实施例中多类型样本数据制作装置的结构框图；

图2是本发明实施例中双线性插值算法的原理示意图；以及

图3是本发明实施例中多类型样本数据制作方法的流程图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，以下结合实施例及附图对本发明的多类型样本数据制作装置及方法作具体阐述。

<实施例>

本发明的硬件平台采用一台计算机完成程序的运行，该计算机设一个NVIDIATITANX显卡用以GPU加速。本实施例中，采用了现有的caltech行人检测数据集以及citypersons行人检测数据集用作训练以及测试。

其中，caltech行人检测数据集是加州理工大学于2012年推出的大型公开行人数据集，使用车载相机进行拍摄，有超过350000个行人目标。Citypersons数据集是基于cityscape数据集对行人部分进行额外标注的数据集，具有更加细分的标注类别。

图1是本发明实施例中多类型样本数据制作装置的结构框图。

如图1所示，多类型样本数据制作装置100包括视频处理部1、分辨率处理部2、对比度处理部3、噪声处理部4以及数据命名存储部5、装置通信部6以及控制上述各部的装置控制部7。

其中，装置通信部6用于进行多类型样本数据制作装置100的各个构成部件之间以及多类型样本数据制作装置100与其他系统之间的数据通信。装置控制部7存储有用于对多类型样本数据制作装置100的各个构成部件的工作进行控制的计算机程序。

视频处理部1用于对需要标注的视频数据进行预处理，去处模糊、无目标物体的帧。

本实施例中，用户在需要进行样本数据的制作时，将视频数据导入多类型样本数据制作装置100即可进行对类型行人样本数据的制作过程。该视频数据可以是监控视频等针对行人拍摄的视频。

本实施例中，视频处理部1的处理对象为视频数据中的原始视频帧，视频处理部1采用帧间差分对各个原始视频帧进行预处理。具体为：

首先，对原始视频帧进行3×3中值滤波预处理，去掉图像随机噪声(用于减少以后运算的复杂度，克服噪声对图像处理结果的干扰)。

其次，根据视频序列采用帧间差分依次对视频数据中各个帧进行处理，其中，将pk(x,y)表示当前帧图像，将pk-1(x,y)表示前一帧图像，若不存在前一帧图像则表示当前帧图像为视频数据的起始，进一步将后一帧作为当前帧图像并进行处理。计算当前帧与背景帧的差得FD(x,y)，从图像中提取出完整的目标，计掉当前1帧的差得FG(x,y)，得到目标的变化量；求帧差FD(x,y)与FG(x,y)的交集从而得到运动目标粗糙的运动区域，并进行形态学处理。进一步，将视频数据中无目标且模糊的视频帧删去。

最后，从处理后的视频数据中每五帧抽取一帧作为预处理帧。

分辨率处理部2用于根据预设的放缩比例对预处理帧进行尺度放缩，具体利用双线性插值算法对预处理帧进行分辨率的放缩从而得到不同尺度的图像帧。这些不同尺度的图像帧即构成一个多尺度样本集。

本实施例中，双线性插值算法利用目标像素点对应原图坐标周围四个最近的像素点，完成像素值和位置转化。如图2所示，假设目标像素点在原图像上的对应点为P，P的目标像素点值则应由其相邻近的四个点Q₁₁、Q₁₂、Q₂₁、Q₂₂决定。双线性插值计算方式就是在x、y两个方向上分别进行两次插值。通过该双线性差值算法即可完成图像的尺度放缩。

另外，分辨率处理部2的放缩比例可以由用户自行设定，但是本实施例中将该放缩比例控制在0.5-3间，过大的放大倍率可能导致图像模糊失真。

对比度处理部3用于对预处理帧进行降低对比度处理从而生成多个低对比度的图像帧。

本实施例中，对于每个预处理帧，对比度处理部3会多次随机降低该预处理帧的对比度从而形成多个对应该预处理帧的低对比度的图像帧。所有低对比度的图像帧构成一个低对比度样本集。

噪声处理部4用于对预处理帧进行添加噪声处理从而得到多个被添加随机噪声的图像帧。

本实施例中，噪声处理部4对每个预处理帧进行添加噪声处理时，可增加椒盐噪声与高斯噪声两种，从而随机生成多个对应的被添加随机噪声的图像帧。所有被添加随机噪声的图像帧构成一个噪声样本集。

上述对比度处理部3以及噪声处理部4针对每个预处理帧生成的低质量图像帧(即低对比度的图像帧以及被添加随机噪声的图像帧)的数量可以由用户预先设定。本实施例中，每个预处理帧被对应生成两个低对比度的图像帧以及两个被添加随机噪声的图像帧。

数据命名存储部5用于将多尺度样本集、低对比度样本集以及噪声样本集中的图像帧进行统一命名并存储为样本数据。

另外，本实施例中，多类型样本数据制作装置100还可以通过行人检测部以及数据标注部辅助用户对样本数据进行标注，从而将样本数据处理为最终用于神经网络训练的训练数据集。

行人检测部存储有预先训练好的行人检测网络，用于对样本数据中所有图像帧进行目标检测从而检测出需要标注的行人目标。

本实施例中，每个图像帧都依次通过行人检测网络，最终得到表示该图像帧中行人的行人目标。

本实施例中，采用了在Imagenet上预训练得到的vgg16网络模型在行人检测数据集上进行迁移学习，通过检测网络进行训练，得到本实例采用的行人检测网络。

数据标注部用于通过预设的标注工具显示图像帧以及相应被行人检测部识别出的行人目标，从而让用户对各个行人目标进行人为标注。本实施例中，被用户标注好的样本数据即可作为训练数据集对神经网络模型进行训练。

图3是本发明实施例中多类型样本数据制作方法的流程图。

如图3所示，多类型样本数据制作装置100的具体实施过程对应于多类型样本数据制作方法，当用户在多类型样本数据制作装置100中导入视频数据后，开始如下步骤：

步骤S1，对视频数据进行预处理从而去除视频数据中模糊、无目标物体的帧并得到作为原始样本集的多个预处理帧，然后进入步骤S2；

步骤S2，根据预设的放缩比例并利用双线性差值算法对预处理帧进行分辨率的放缩从而得到作为多尺度样本集的多个不同尺度的图像帧，然后进入步骤S3；

步骤S3，对预处理帧进行降低对比度处理从而得到作为低对比度样本集的多个不同对比度的图像帧，然后进入步骤S4；

步骤S4，对预处理帧进行添加噪声处理从而得到作为噪声样本集的多个被添加随机噪声的图像帧，然后进入步骤S5；

步骤S5，对多尺度样本集、低对比度样本集以及噪声样本集中的图像帧进行统一命名并存储，然后进入结束状态。

实施例作用与效果

根据本实施例提供的多类型样本数据制作装置及方法，由于通过帧间差分对输入的视频数据进行预处理，因此有效地去除了视频数据中无目标以及模糊的帧。同时，由于结合了多种类型的图像处理方法分别对预处理后的视频帧进行处理，生成了多种类型的样本集，从而解决了数据类型单一的问题。进一步，由于通过双线性插值方法处理得到多尺度的图像，还通过降低对比度以及模拟高斯分布将视频帧处理为低质量图像，从而有助于在利用本实施例构建的样本数据对卷积神经网络进行训练时，能够因为训练集中富含低质量图像以及多尺度图像从而最终得到稳定性及识别率更高的卷积神经网络。因此，通过本实施例的多类型样本数据制作装置及方法，能够得到格式统一、多尺度、多类型的样本数据，不仅方便了用户根据实际需要构建相应的样本数据，还方便了用户通过该样本数据构建训练数据集从而对卷积神经网络进行训练。

上述实施例仅用于举例说明本发明的具体实施方式，而本发明不限于上述实施例的描述范围。

例如，上述实施例中，多类型样本数据制作装置及方法用在行人检测方向，用于生成行人检测用的样本数据。然而，在本发明的其他实施例中，多类型样本数据制作装置及方法对于其他目标检测方向数据集的制作具有同样的效果和相同的操作方式。

Claims

1.一种多类型样本数据制作装置，其特征在于，用于对导入的视频数据进行自动地目标检测以及多类型处理从而生成样本数据，包括：

视频处理部，用于通过帧间差分法对所述视频数据进行预处理从而去除所述视频数据中模糊、无目标物体的帧并得到作为原始样本集的多个预处理帧；

分辨率处理部，用于根据预设的放缩比例并利用双线性差值算法对所述预处理帧进行分辨率的放缩从而得到作为多尺度样本集的多个不同尺度的图像帧；

对比度处理部，用于对所述预处理帧进行降低对比度处理从而得到作为低对比度样本集的多个不同对比度的图像帧；

噪声处理部，用于对所述预处理帧进行添加噪声处理从而得到作为噪声样本集的多个被添加随机噪声的图像帧；以及

数据命名存储部，用于对所述原始样本集、所述多尺度样本集、所述低对比度样本集以及所述噪声样本集中的图像帧进行统一命名并存储为所述样本数据。

2.根据权利要求1所述的多类型样本数据制作装置，其特征在于：

其中，所述预处理包括：

使用帧间差分法去除所述视频数据中模糊且无目标的帧；

从处理后的所述视频数据中每五帧抽取一帧作为所述预处理帧。

3.根据权利要求1所述的多类型样本数据制作装置，其特征在于：

其中，所述放缩比例的取值在0.5至3间。

4.根据权利要求1所述的多类型样本数据制作装置，其特征在于：

其中，所述添加噪声处理为在所述预处理图像帧中随机增加椒盐噪声与高斯噪声。

5.一种多类型样本数据制作方法，其特征在于，包括如下步骤：

步骤S1，对所述视频数据进行预处理从而去除所述视频数据中模糊、无目标物体的帧并得到作为原始样本集的多个预处理帧；

步骤S2，根据预设的放缩比例并利用双线性差值算法对所述预处理帧进行分辨率的放缩从而得到作为多尺度样本集的多个不同尺度的图像帧；

步骤S3，对所述预处理帧进行降低对比度处理从而得到作为低对比度样本集的多个不同对比度的图像帧；

步骤S4，对所述预处理帧进行添加噪声处理从而得到作为噪声样本集的多个被添加随机噪声的图像帧；

步骤S5，对所述原始样本集、所述多尺度样本集、所述低对比度样本集以及所述噪声样本集中的图像帧进行统一命名并存储为所述样本数据。