CN109409421A

CN109409421A - 基于卷积神经网络的机动车、驾驶人档案图像识别方法

Info

Publication number: CN109409421A
Application number: CN201811173633.7A
Authority: CN
Inventors: 黄冬发; 陈教; 王天然; 李万清
Original assignee: Hangzhou Cheng Road Polytron Technologies Inc
Current assignee: Hangzhou Cheng Road Polytron Technologies Inc
Priority date: 2018-10-09
Filing date: 2018-10-09
Publication date: 2019-03-01
Anticipated expiration: 2038-10-09
Also published as: CN109409421B

Abstract

本发明公开了一种基于卷积神经网络的机动车、驾驶人档案图像识别方法；本发明利用真实的机动车、驾驶人档案图像数据，具有数据量大、类别众多等特点，由此根据机动车、驾驶人档案图像训练出来的卷积神经网络识别准确率高。本发明实现了自动识别、分类机动车、驾驶人档案图像，且具有执行速度快、准确性高、高效率等特点。避免了大量的人为识别、分类工作。

Description

基于卷积神经网络的机动车、驾驶人档案图像识别方法

技术领域

本发明属于深度学习技术领域，具体涉及到一种基于卷积神经网络的机动车、驾驶人档案图像识别方法。

背景技术

随着经济和社会的发展，互联网的普及率越来越高，每时每刻在互联网上都有大量的图像资源在产生、传送、接收。图像资源包含着大量对经济、社会有益的信息，在数量如此众多的图像资源下，人工识别会消耗大量的人工和费用，所以利用计算机来完成图像识别任务就显得尤为重要。

随着“互联网+”的提出，各个领域大量的图像资源都会上传到网络上。随着城市人口逐渐增加，汽车保有量的飞速增长，机动车、驾驶人档案图像的数据量也在飞速增长。机动车、驾驶人档案图像类别众多，并且由于大量历史数据的存在，同一类别的图像也存在样式区别巨大等的特点，由于这些原因，根据以往的经验，通过人工识别、上传图像时，难免出现分类错误等现象，而且存在大量未分类的历史数据，如果由人工逐一核实比对重新分类，将耗费大量的人工，并且很难保证重新分类过程中不出现再次分类错误。

如何能够通过深度学习的技术手段，对机动车、驾驶人档案图像进行自动识别、分类，将会大大降低人工的费用和时间。

发明内容

本发明针对现有技术的不足，提供了一种基于卷积神经网络的机动车、驾驶人档案图像识别方法。

本发明中所谓的机动车、驾驶人档案图像是指包含档案资料目录、机动车驾驶证申请表、身体条件证明、身份证复印件、科目一成绩单、驾驶证、行驶证、购置税、合格证、汽车图片等100余种，涵盖机动车和驾驶人业务的档案图像(参考《业务资料影像化分类代码》)。

本发明技术方案的主要构思：根据海量的机动车、驾驶人档案图像数据，在对图像数据进行预处理后，搭建并训练一个卷积神经网络，并利用训练好的模型完成对机动车、驾驶人档案图像的识别、分类工作。

本发明方法包括以下步骤：

步骤(1)、准备足够的机动车、驾驶人档案图像，同一类别的档案图像放置在同一文件夹中；

步骤(2)、将机动车、驾驶人档案图像按设定比例自动分成训练集、测试集；

步骤(3)、将训练集、测试集数据分别转换成TF-Record形式，在此过程中统一图像大小，并对图像进行标准化处理；

步骤(4)、选择合适的超参数，搭建一个卷积神经网络；

步骤(5)、将训练集的TF-Record数据作为输入，选择合适的迭代次数，训练搭建好的卷积神经网络；

步骤(6)、将测试集的TF-Record数据作为输入，通过训练好的卷积神经网络得到对应的测试集准确率；

步骤(7)、判断测试集准确率是否达到预期标准，如果未达到预期标准，则重复步骤(4)，(5)，(6)数次，直到测试集准确率达到预期标准为止；

步骤(8).使用训练好的卷积神经网络模型制成机动车、驾驶人档案图像识别器和分类器，能够完成单张识别和多张分类的功能。

本发明具有的有益效果：本发明利用真实的机动车、驾驶人档案图像数据，具有数据量大、类别众多等特点，由此根据机动车、驾驶人档案图像训练出来的卷积神经网络识别准确率高。本发明实现了自动识别、分类机动车、驾驶人档案图像，且具有执行速度快、准确性高、高效率等特点。避免了大量的人为识别、分类工作。

附图说明

图1是机动车、驾驶人档案图像识别的流程图。

具体实施方式

以下结合附图对本发明作进一步说明。如图1所示，本发明包括如下步骤：

步骤(1).数据准备：按照机动车、驾驶人档案图像的类别进行收集数据，每个类别收集足够的数据，并放置在同一文件夹下，文件夹按照类名来命名。

步骤(2).数据分割：根据预先设定好的比率ratio，将机动车、驾驶人档案图像数据集分成训练集和测试集，每个类别进行数据分割时都按照比率ratio进行分割。

步骤(3).数据预处理：将训练集、测试集中的图像统一转换为指定的大小：width*height*3,其中，width是图片的宽度，height是图片的高度。然后将统一大小的图片像素值张量x及其标签转化为卷积神经网络可以识别的输入数据格式(TF-Record)，并根据公式(1)对所有图像进行标准化。

其中x_now为经标准化处理后图片RGB三通道的像素值，x为原本图片RGB三通道的像素值，mean分别为三通道像素值的均值，stddev为三通道像素的标准差，num_elements为三通道各自的像素个数。

步骤(4).搭建卷积神经网络。根据输入的图像特征，选择合适的超参数搭建卷积神经网络。其中神经网络的激活函数都选择线性整流函数(RectifiedLinear Unit,ReLU)。网络中偏置biases的初始值为0.1，前五层权值weights使用了Xavier初始化方法，后三层权值weights初始值满足期望为0，标准差为0.005的正态分布。

步骤(5).训练网络。使用交叉熵来表示损失函数，并使用了系数为0.0005的L2正则化惩罚项，损失函数见公式(2)。使用随机梯度下降法来优化损失函数，最终batch大小为50，学习率为0.0005，迭代次数为20000。

其中m为样本数量，y_为样本的标签，即对应的真实值，y为神经网络的预测输出值，w为神经网络的参数。

步骤(6).计算网络准确率。使用测试集的图片数据(已经转化成TF-Record格式)，将其输入到训练好的神经网络中，此时的神经网络Dropout层不起作用，损失函数去除L2正则化的惩罚项，根据测试集中每个样本预测值和真实值是否一致来统计准确率。

步骤(7).调试网络。包括调整网络结构、调整参数等。根据步骤(6)中的准确率，判断网络是否到达预期标准，(这个预期标准需要根据实际情况设定，范围为0-1之间。比如0表示全部错误，1表示全部准确，0.98表示98％准确)如果没有到达到预期标准，则不断重复步骤(4)、(5)、(6)，调整网络的结构和超参数，直到准确率达到预期标准。

步骤(8).制作识别器。利用训练好的网络模型来完成机动车、驾驶人档案图像识别的工作，当有单张图像输入时，将其输入到网络，输出网络预测其属于的类别；当有多张未分类的图像输入时，将它们输入到网络，根据网络输出的预测结果，将它们自动分到所在的类别中。

Claims

1.基于卷积神经网络的机动车、驾驶人档案图像识别方法，其特征在于，该方法具体包括以下步骤：

步骤(4)、选择合适的超参数，搭建一个卷积神经网络；

2.根据权利要求1所述的基于卷积神经网络的机动车、驾驶人档案图像识别方法，其特征在于：步骤(3)具体为：将训练集、测试集中的图像统一转换为指定的大小：width*height*3,其中，width是图片的宽度，height是图片的高度；然后将统一大小的图片像素值张量及其标签转化为卷积神经网络可以识别的输入数据格式TF-Record，并根据公式(1)对所有图像进行标准化；

3.根据权利要求1所述的基于卷积神经网络的机动车、驾驶人档案图像识别方法，其特征在于：步骤(5)中训练搭建好的卷积神经网络具体为；使用交叉熵来表示损失函数，并使用了系数为0.0005的L2正则化惩罚项，损失函数见公式(2)；使用随机梯度下降法来优化损失函数，最终batch大小为50，学习率为0.0005，迭代次数为20000；

4.根据权利要求1所述的基于卷积神经网络的机动车、驾驶人档案图像识别方法，其特征在于：步骤(6)具体为：使用测试集中已经转化成TF-Record格式的图片数据，将其输入到训练好的神经网络中，此时的神经网络Dropout层不起作用，损失函数去除L2正则化的惩罚项，根据测试集中每个样本预测值和真实值是否一致来统计准确率。