CN109409421A - 基于卷积神经网络的机动车、驾驶人档案图像识别方法 - Google Patents
基于卷积神经网络的机动车、驾驶人档案图像识别方法 Download PDFInfo
- Publication number
- CN109409421A CN109409421A CN201811173633.7A CN201811173633A CN109409421A CN 109409421 A CN109409421 A CN 109409421A CN 201811173633 A CN201811173633 A CN 201811173633A CN 109409421 A CN109409421 A CN 109409421A
- Authority
- CN
- China
- Prior art keywords
- driver
- convolutional neural
- neural networks
- motor vehicle
- archival image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于卷积神经网络的机动车、驾驶人档案图像识别方法;本发明利用真实的机动车、驾驶人档案图像数据,具有数据量大、类别众多等特点,由此根据机动车、驾驶人档案图像训练出来的卷积神经网络识别准确率高。本发明实现了自动识别、分类机动车、驾驶人档案图像,且具有执行速度快、准确性高、高效率等特点。避免了大量的人为识别、分类工作。
Description
技术领域
本发明属于深度学习技术领域,具体涉及到一种基于卷积神经网络的机动车、驾驶人档案图像识别方法。
背景技术
随着经济和社会的发展,互联网的普及率越来越高,每时每刻在互联网上都有大量的图像资源在产生、传送、接收。图像资源包含着大量对经济、社会有益的信息,在数量如此众多的图像资源下,人工识别会消耗大量的人工和费用,所以利用计算机来完成图像识别任务就显得尤为重要。
随着“互联网+”的提出,各个领域大量的图像资源都会上传到网络上。随着城市人口逐渐增加,汽车保有量的飞速增长,机动车、驾驶人档案图像的数据量也在飞速增长。机动车、驾驶人档案图像类别众多,并且由于大量历史数据的存在,同一类别的图像也存在样式区别巨大等的特点,由于这些原因,根据以往的经验,通过人工识别、上传图像时,难免出现分类错误等现象,而且存在大量未分类的历史数据,如果由人工逐一核实比对重新分类,将耗费大量的人工,并且很难保证重新分类过程中不出现再次分类错误。
如何能够通过深度学习的技术手段,对机动车、驾驶人档案图像进行自动识别、分类,将会大大降低人工的费用和时间。
发明内容
本发明针对现有技术的不足,提供了一种基于卷积神经网络的机动车、驾驶人档案图像识别方法。
本发明中所谓的机动车、驾驶人档案图像是指包含档案资料目录、机动车驾驶证申请表、身体条件证明、身份证复印件、科目一成绩单、驾驶证、行驶证、购置税、合格证、汽车图片等100余种,涵盖机动车和驾驶人业务的档案图像(参考《业务资料影像化分类代码》)。
本发明技术方案的主要构思:根据海量的机动车、驾驶人档案图像数据,在对图像数据进行预处理后,搭建并训练一个卷积神经网络,并利用训练好的模型完成对机动车、驾驶人档案图像的识别、分类工作。
本发明方法包括以下步骤:
步骤(1)、准备足够的机动车、驾驶人档案图像,同一类别的档案图像放置在同一文件夹中;
步骤(2)、将机动车、驾驶人档案图像按设定比例自动分成训练集、测试集;
步骤(3)、将训练集、测试集数据分别转换成TF-Record形式,在此过程中统一图像大小,并对图像进行标准化处理;
步骤(4)、选择合适的超参数,搭建一个卷积神经网络;
步骤(5)、将训练集的TF-Record数据作为输入,选择合适的迭代次数,训练搭建好的卷积神经网络;
步骤(6)、将测试集的TF-Record数据作为输入,通过训练好的卷积神经网络得到对应的测试集准确率;
步骤(7)、判断测试集准确率是否达到预期标准,如果未达到预期标准,则重复步骤(4),(5),(6)数次,直到测试集准确率达到预期标准为止;
步骤(8).使用训练好的卷积神经网络模型制成机动车、驾驶人档案图像识别器和分类器,能够完成单张识别和多张分类的功能。
本发明具有的有益效果:本发明利用真实的机动车、驾驶人档案图像数据,具有数据量大、类别众多等特点,由此根据机动车、驾驶人档案图像训练出来的卷积神经网络识别准确率高。本发明实现了自动识别、分类机动车、驾驶人档案图像,且具有执行速度快、准确性高、高效率等特点。避免了大量的人为识别、分类工作。
附图说明
图1是机动车、驾驶人档案图像识别的流程图。
具体实施方式
以下结合附图对本发明作进一步说明。如图1所示,本发明包括如下步骤:
步骤(1).数据准备:按照机动车、驾驶人档案图像的类别进行收集数据,每个类别收集足够的数据,并放置在同一文件夹下,文件夹按照类名来命名。
步骤(2).数据分割:根据预先设定好的比率ratio,将机动车、驾驶人档案图像数据集分成训练集和测试集,每个类别进行数据分割时都按照比率ratio进行分割。
步骤(3).数据预处理:将训练集、测试集中的图像统一转换为指定的大小:width*height*3,其中,width是图片的宽度,height是图片的高度。然后将统一大小的图片像素值张量x及其标签转化为卷积神经网络可以识别的输入数据格式(TF-Record),并根据公式(1)对所有图像进行标准化。
其中xnow为经标准化处理后图片RGB三通道的像素值,x为原本图片RGB三通道的像素值,mean分别为三通道像素值的均值,stddev为三通道像素的标准差,num_elements为三通道各自的像素个数。
步骤(4).搭建卷积神经网络。根据输入的图像特征,选择合适的超参数搭建卷积神经网络。其中神经网络的激活函数都选择线性整流函数(RectifiedLinear Unit,ReLU)。网络中偏置biases的初始值为0.1,前五层权值weights使用了Xavier初始化方法,后三层权值weights初始值满足期望为0,标准差为0.005的正态分布。
步骤(5).训练网络。使用交叉熵来表示损失函数,并使用了系数为0.0005的L2正则化惩罚项,损失函数见公式(2)。使用随机梯度下降法来优化损失函数,最终batch大小为50,学习率为0.0005,迭代次数为20000。
其中m为样本数量,y_为样本的标签,即对应的真实值,y为神经网络的预测输出值,w为神经网络的参数。
步骤(6).计算网络准确率。使用测试集的图片数据(已经转化成TF-Record格式),将其输入到训练好的神经网络中,此时的神经网络Dropout层不起作用,损失函数去除L2正则化的惩罚项,根据测试集中每个样本预测值和真实值是否一致来统计准确率。
步骤(7).调试网络。包括调整网络结构、调整参数等。根据步骤(6)中的准确率,判断网络是否到达预期标准,(这个预期标准需要根据实际情况设定,范围为0-1之间。比如0表示全部错误,1表示全部准确,0.98表示98%准确)如果没有到达到预期标准,则不断重复步骤(4)、(5)、(6),调整网络的结构和超参数,直到准确率达到预期标准。
步骤(8).制作识别器。利用训练好的网络模型来完成机动车、驾驶人档案图像识别的工作,当有单张图像输入时,将其输入到网络,输出网络预测其属于的类别;当有多张未分类的图像输入时,将它们输入到网络,根据网络输出的预测结果,将它们自动分到所在的类别中。
Claims (4)
1.基于卷积神经网络的机动车、驾驶人档案图像识别方法,其特征在于,该方法具体包括以下步骤:
步骤(1)、准备足够的机动车、驾驶人档案图像,同一类别的档案图像放置在同一文件夹中;
步骤(2)、将机动车、驾驶人档案图像按设定比例自动分成训练集、测试集;
步骤(3)、将训练集、测试集数据分别转换成TF-Record形式,在此过程中统一图像大小,并对图像进行标准化处理;
步骤(4)、选择合适的超参数,搭建一个卷积神经网络;
步骤(5)、将训练集的TF-Record数据作为输入,选择合适的迭代次数,训练搭建好的卷积神经网络;
步骤(6)、将测试集的TF-Record数据作为输入,通过训练好的卷积神经网络得到对应的测试集准确率;
步骤(7)、判断测试集准确率是否达到预期标准,如果未达到预期标准,则重复步骤(4),(5),(6)数次,直到测试集准确率达到预期标准为止;
步骤(8).使用训练好的卷积神经网络模型制成机动车、驾驶人档案图像识别器和分类器,能够完成单张识别和多张分类的功能。
2.根据权利要求1所述的基于卷积神经网络的机动车、驾驶人档案图像识别方法,其特征在于:步骤(3)具体为:将训练集、测试集中的图像统一转换为指定的大小:width*height*3,其中,width是图片的宽度,height是图片的高度;然后将统一大小的图片像素值张量及其标签转化为卷积神经网络可以识别的输入数据格式TF-Record,并根据公式(1)对所有图像进行标准化;
其中xnow为经标准化处理后图片RGB三通道的像素值,x为原本图片RGB三通道的像素值,mean分别为三通道像素值的均值,stddev为三通道像素的标准差,num_elements为三通道各自的像素个数。
3.根据权利要求1所述的基于卷积神经网络的机动车、驾驶人档案图像识别方法,其特征在于:步骤(5)中训练搭建好的卷积神经网络具体为;使用交叉熵来表示损失函数,并使用了系数为0.0005的L2正则化惩罚项,损失函数见公式(2);使用随机梯度下降法来优化损失函数,最终batch大小为50,学习率为0.0005,迭代次数为20000;
其中m为样本数量,y_为样本的标签,即对应的真实值,y为神经网络的预测输出值,w为神经网络的参数。
4.根据权利要求1所述的基于卷积神经网络的机动车、驾驶人档案图像识别方法,其特征在于:步骤(6)具体为:使用测试集中已经转化成TF-Record格式的图片数据,将其输入到训练好的神经网络中,此时的神经网络Dropout层不起作用,损失函数去除L2正则化的惩罚项,根据测试集中每个样本预测值和真实值是否一致来统计准确率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811173633.7A CN109409421B (zh) | 2018-10-09 | 2018-10-09 | 基于卷积神经网络的机动车、驾驶人档案图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811173633.7A CN109409421B (zh) | 2018-10-09 | 2018-10-09 | 基于卷积神经网络的机动车、驾驶人档案图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109409421A true CN109409421A (zh) | 2019-03-01 |
CN109409421B CN109409421B (zh) | 2021-12-07 |
Family
ID=65466868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811173633.7A Active CN109409421B (zh) | 2018-10-09 | 2018-10-09 | 基于卷积神经网络的机动车、驾驶人档案图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109409421B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197589A (zh) * | 2019-05-29 | 2019-09-03 | 杭州诚道科技股份有限公司 | 一种基于深度学习的闯红灯违法检测方法 |
CN110209632A (zh) * | 2019-05-27 | 2019-09-06 | 武汉市润普网络科技有限公司 | 一种电子卷宗随案生产、转档系统 |
CN112507864A (zh) * | 2020-12-04 | 2021-03-16 | 河北地质大学 | 基于卷积神经网络的信贷档案识别方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105825243A (zh) * | 2015-01-07 | 2016-08-03 | 阿里巴巴集团控股有限公司 | 证件图像检测方法及设备 |
CN106874901A (zh) * | 2017-01-17 | 2017-06-20 | 北京智元未来科技有限公司 | 一种行驶证识别方法及装置 |
CN106934408A (zh) * | 2015-12-29 | 2017-07-07 | 北京大唐高鸿数据网络技术有限公司 | 基于卷积神经网络的身份证照片分类方法 |
CN106991451A (zh) * | 2017-04-14 | 2017-07-28 | 武汉神目信息技术有限公司 | 一种证件图片的识别系统及方法 |
CN107239785A (zh) * | 2016-03-29 | 2017-10-10 | 北京市商汤科技开发有限公司 | 一种在智能设备中对图片进行分类的方法和系统 |
US9798954B1 (en) * | 2016-12-15 | 2017-10-24 | Federal Home Loan Mortgage Corporation | System, device, and method for image anomaly detection |
CN108229299A (zh) * | 2017-10-31 | 2018-06-29 | 北京市商汤科技开发有限公司 | 证件的识别方法和装置、电子设备、计算机存储介质 |
CN108256591A (zh) * | 2018-02-26 | 2018-07-06 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
-
2018
- 2018-10-09 CN CN201811173633.7A patent/CN109409421B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105825243A (zh) * | 2015-01-07 | 2016-08-03 | 阿里巴巴集团控股有限公司 | 证件图像检测方法及设备 |
CN106934408A (zh) * | 2015-12-29 | 2017-07-07 | 北京大唐高鸿数据网络技术有限公司 | 基于卷积神经网络的身份证照片分类方法 |
CN107239785A (zh) * | 2016-03-29 | 2017-10-10 | 北京市商汤科技开发有限公司 | 一种在智能设备中对图片进行分类的方法和系统 |
US9798954B1 (en) * | 2016-12-15 | 2017-10-24 | Federal Home Loan Mortgage Corporation | System, device, and method for image anomaly detection |
CN106874901A (zh) * | 2017-01-17 | 2017-06-20 | 北京智元未来科技有限公司 | 一种行驶证识别方法及装置 |
CN106991451A (zh) * | 2017-04-14 | 2017-07-28 | 武汉神目信息技术有限公司 | 一种证件图片的识别系统及方法 |
CN108229299A (zh) * | 2017-10-31 | 2018-06-29 | 北京市商汤科技开发有限公司 | 证件的识别方法和装置、电子设备、计算机存储介质 |
CN108256591A (zh) * | 2018-02-26 | 2018-07-06 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110209632A (zh) * | 2019-05-27 | 2019-09-06 | 武汉市润普网络科技有限公司 | 一种电子卷宗随案生产、转档系统 |
CN110197589A (zh) * | 2019-05-29 | 2019-09-03 | 杭州诚道科技股份有限公司 | 一种基于深度学习的闯红灯违法检测方法 |
CN112507864A (zh) * | 2020-12-04 | 2021-03-16 | 河北地质大学 | 基于卷积神经网络的信贷档案识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109409421B (zh) | 2021-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109409421A (zh) | 基于卷积神经网络的机动车、驾驶人档案图像识别方法 | |
CN102508907B (zh) | 一种基于训练集优化的推荐系统的动态推荐方法 | |
CN109543502A (zh) | 一种基于深度多尺度神经网络的语义分割方法 | |
CN110457781B (zh) | 面向乘客舒适性的列车过隧道时长计算方法 | |
CN107571867A (zh) | 用于控制无人驾驶车辆的方法和装置 | |
CN110009095A (zh) | 基于深度特征压缩卷积网络的道路行驶区域高效分割方法 | |
CN113688558B (zh) | 一种基于大数据库样本的汽车行驶工况构建方法及系统 | |
CN108665093A (zh) | 基于深度学习的高速公路交通事故严重度预测方法 | |
CN104134068A (zh) | 基于稀疏编码的监控车辆特征表示及分类方法 | |
CN106960176A (zh) | 一种基于超限学习机和颜色特征融合的行人性别识别方法 | |
CN104751175A (zh) | 基于增量支持向量机的sar图像多类标场景分类方法 | |
CN114976306A (zh) | 一种基于车联云的动力锂电池智能化梯次利用方法 | |
CN103678552A (zh) | 基于显著区域特征的遥感影像检索方法及系统 | |
CN108376257B (zh) | 一种燃气表不完整码字识别方法 | |
CN114821247B (zh) | 一种模型的训练方法、装置、存储介质及电子装置 | |
CN113326826A (zh) | 网络模型的训练方法、装置、电子设备及存储介质 | |
CN117809107A (zh) | 一种烘烤阶段烟叶状态识别方法及装置 | |
CN116824274A (zh) | 小样本细粒度图像分类方法及系统 | |
CN116168363A (zh) | 基于信息熵的数据筛选方法、装置和计算机可读介质 | |
US20240135679A1 (en) | Method for classifying images and electronic device | |
CN107169532A (zh) | 一种基于小波分析和半监督学习的车联网油耗数据质量评估方法 | |
CN115310999B (zh) | 基于多层感知机和排序网络的企业用电行为分析方法及系统 | |
CN110532224A (zh) | 一种深度学习标注样本的文件管理系统及方法 | |
CN110866118B (zh) | 一种深度学习模型的超参数调优方法 | |
CN113592341A (zh) | 度量损失函数、扇区复杂度评估方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |