CN112001258A - 物流货车准时到站识别方法、装置、设备和存储介质 - Google Patents
物流货车准时到站识别方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN112001258A CN112001258A CN202010732114.0A CN202010732114A CN112001258A CN 112001258 A CN112001258 A CN 112001258A CN 202010732114 A CN202010732114 A CN 202010732114A CN 112001258 A CN112001258 A CN 112001258A
- Authority
- CN
- China
- Prior art keywords
- model
- layer
- features
- xception
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了物流货车准时到站识别方法、装置、设备和存储介质,该方法包括:S1:对物流货车的站台进行图像采集,获取样本图像集;S2:基于Xception网络架构搭建Xception模型,其中,将模型的学习率调整为自适应,并对模型加入用于减弱深层神经网络的过拟合效应的Dropout层;S3:加载预先训练好的预训练模型,输入搭建好的模型中,通过样本图像集从预训练模型开始训练;S4:对训练完成之后的模型进行测试,输出得到准时到站识别模型;S5:通过准时到站识别模型对车站场景进行监控识别。本发明解决了现有物流行业货车入场速度较慢、进站识别慢、容易造成货车运输晚点,从而影响快递派送效率的技术问题,能够提高货车进站效率高、识别速度快,实现物流的智能化。
Description
技术领域
本发明属于物流智能化技术领域,尤其涉及物流货车准时到站识别方法、装置、设备和存储介质。
背景技术
在物流行业,随着近年来物流总需求的平稳增长,物流运输网络越来越繁荣,次日达、当日达等快速的物流运输服务也越来越频繁,给人们带来了实实在在的方便,为满足物流运输的日异月新需求,整个物流行业都向着速度更快、服务质量更高的方向不断发展。
但是相对地,随着物流运输网络越来越繁荣,物流运输网络的复杂程度也越来越高,这对于物流运输的监控管控要求也越来越高,尤其是货车运输,作为物流运输中重要的一环节,其每天都需要在各个物流站点进行装货卸货,因此,物流站点经常是货车拥堵排队的地方,经常影响货车准时到站,从而影响整个物流运输的效率。
针对货车准时到站而言,目前现有的自动化的货车到站系统也是依靠停车场车牌识别和门禁系统,但是货车入场速度较慢,而且还需要进行排队等待,在此情况下容易造成货车运输晚点的情况,影响快递派送效率。同时现有技术中对于货车准时到站识别的智能化水平不高,识别的图片有大小、分辨率的限制,识别速度往往慢,不能满足快递行业时效性的要求。
发明内容
本发明为解决上述技术问题,提供了物流货车准时到站识别方法、装置、设备和存储介质,具有货车进站效率高、识别速度快、物流智能化的技术特点。
本发明的技术方案为:
一种物流货车准时到站识别方法,包括以下步骤:
S1:对物流货车的站台进行图像采集,获取样本图像集;
S2:基于Xception网络架构搭建Xception模型,Xception模型包括输入层、卷积层、池化层、全连接层和输出层,其中,将Xception模型的学习率调整为自适应,并对Xception模型加入用于减弱深层神经网络的过拟合效应的Dropout层;
S3:加载预先通过同类数据集训练好的预训练模型,输入搭建好的Xception模型中,通过样本图像集从预训练模型开始训练;
S4:对训练完成之后的模型进行测试,输出得到准时到站识别模型;
S5:通过准时到站识别模型对车站场景进行监控识别,判断是否有物流货车到站。
根据本发明一实施例,步骤S2中,输入层包括以下图像处理步骤:
对输入的图像进行归一化的预处理,之后输入至卷积层。
根据本发明一实施例,步骤S2中,卷积层包括以下图像处理步骤:
对预处理之后的图像进行大小统一,并通过卷积进行初步特征提取,得到特征提取图;
通过尺寸不同的深度可分离卷积对特征提取图进行特征的进一步提取,依次提取得到初级特征、中级特征和高级特征。
根据本发明一实施例,步骤S2中,池化层包括以下图像处理步骤:
通过每个深度可分离卷积模块中的最大池化层将初级特征、中级特征、高级特征进行筛选降维,其中,每个深度可分离卷积模块的连接采用残差连接;
对筛选降维之后的初级特征、中级特征、高级特征进行特征融合,之后输入全连接层。
根据本发明一实施例,步骤S2中,全连接层和输出层包括以下图像处理步骤:
将特征融合之后的特征整合具有类别区分性的局部信息,并通过逻辑回归分类进行输出。
一种物流货车准时到站识别装置,包括:
数据采集模块,用于对物流货车的站台进行图像采集,获取样本图像集;
模型搭建模块,用于基于Xception网络架构搭建Xception模型,Xception模型包括输入层、卷积层、池化层、全连接层和输出层,其中,将Xception模型的学习率调整为自适应,并对Xception模型加入用于减弱深层神经网络的过拟合效应的Dropout层;
模型加载训练模块,用于加载预先通过同类数据集训练好的预训练模型,输入搭建好的Xception模型中,通过样本图像集从预训练模型开始训练;
模型测试输出模块,用于对训练完成之后的模型进行测试,输出得到准时到站识别模型;
到站识别模块,用于通过准时到站识别模型对车站场景进行监控识别,判断是否有物流货车到站。
根据本发明一实施例,输入层用于对输入的图像进行归一化的预处理,之后输入至卷积层;
卷积层用于对预处理之后的图像进行大小统一,并通过卷积进行初步特征提取,得到特征提取图,以及通过尺寸不同的深度可分离卷积模块对特征提取图进行特征的进一步提取,依次提取得到初级特征图、中级特征图和高级特征图;
池化层用于通过每个深度可分离卷积模块中的最大池化层将初级特征、中级特征、高级特征进行筛选降维,其中,每个深度可分离卷积模块的连接采用残差连接,以及对筛选降维之后的初级特征、中级特征、高级特征进行特征融合,之后输入全连接层;
全连接层和输出层用于将特征融合之后的特征整合具有类别区分性的局部信息,并通过逻辑回归分类进行输出。
一种计算机设备,包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行如上述中的物流货车准时到站识别方法。
一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述中的物流货车准时到站识别方法。
本发明与现有技术相比具有以下的优点和积极效果:
本发明通过Xception模型进行物流货车准时到站识别,其对于需要识别的图像,没有图片传入大小的限制,Xception可以自动压缩到合适的尺寸,节省了图片处理的时间,提高了识别的速度,从而降低了货车晚点到站的可能性;
本发明通过Xception模型的输入层对输入的图像进行归一化预处理,可筛选出相关的物体信息,以便对无效信息进行弱化,通过Xception模型的卷积层中尺寸不同的深度可分离卷积模块,对图像进行处理,可以自动提取图像的边缘、明暗、轮快等信息,通过Xception模型的池化层对卷积得到的特征进行筛选降维,保留主要的特征同时减少参数(降维)和计算量,如此,通过上述Xception模型的图像处理上的优化,提高了模型识别的速度,从而降低了货车晚点到站的可能性;
本发明通过加载预先通过同类数据集训练好的预训练模型,其中,同类数据集与采集的样本图像集是类似的图像集,和本发明类似的同类数据集例如检测有无客车或或者有无自行车或者有无障碍物等等数据集,通过如此训练好的预训练模型输入搭建好的Xception模型中,通过样本图像从预训练模型开始训练,可以不再是从零开始训练,大大提高模型的训练速度;
本发明通过将Xception模型的学习率调整为自适应,前期加快收敛速度,后期提高搜索精度,同时加入Dropout层,使模型在每次训练中按照所设定的概率参数随机地不激活一定比例的神经单元,以减弱深层神经网络的过拟合效应。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。
图1为本发明的一种物流货车准时到站识别方法的整体流程图;
图2为本发明的一种物流货车准时到站识别方法的Xception模型图像处理流程图;
图3为本发明的一种物流货车准时到站识别方法的深度可分离卷积原理图;
图4为本发明的一种物流货车准时到站识别装置的结构框图。
附图标记说明:
1-数据采集模块;2-模型搭建模块;3-模型加载训练模块;4-模型测试输出模块。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
参看图1,本申请提供了一种物流货车准时到站识别方法,包括以下步骤:
S1:对物流货车的站台进行图像采集,获取样本图像集;
S2:基于Xception网络架构搭建Xception模型,Xception模型包括输入层、卷积层、池化层、全连接层和输出层,其中,将Xception模型的学习率调整为自适应,并对Xception模型加入用于减弱深层神经网络的过拟合效应的Dropout层;
S3:加载预先通过同类数据集训练好的预训练模型,输入搭建好的Xception模型中,通过样本图像集从预训练模型开始训练;
S4:对训练完成之后的模型进行测试,输出得到准时到站识别模型;
S5:通过准时到站识别模型对车站场景进行监控识别,判断是否有物流货车到站。
现对上述实施例进行详细说明,但不仅限于此。
本实施例适用于物流智能化技术领域,对于物流货车到站进行准时识别,其中,本实施例的技术方案重点在于物流货车准时到站识别的实现方法,通过该方法可以高效快捷地实现物流运输站对于货车到站识别,其次,通过本实施例最后得到准时到站识别模型可以快速、智能化的实现物流货车到站识别,无需经过人工登记、门禁系统读卡、停车场车牌识别等复杂的货车到站检测方式,大大降低人员或设备成本,同时提高货车到站识别效率,从而提高物流运输的效率。
在本实施例的步骤S1中,可以基于具体站台场景和所要识别的物流货车,通过摄像的形式采集所需的样本图像集,本实施例对于获取的图像数量不作限制,原则上采集的图片越多越好,以提高实际应用中物流货车到站的识别效果。具体地,本实施例的样本图像集分成两类,一类是有货车的图片,另一类是没有货车的图片,其中,样本图像集中图片的格式可以是Bmp图片格式,这些图像不需要进行数据标注,同样对于尺寸大小没有严格统一要求,如此,本实施例的方法可以适用于不同设备拍摄获取的图像,并且不需要通过对获取的图片进行裁剪等预处理以形成统一标准的图片,大大提高方法的兼容性、适配性。
较优地,在有限图片下,本实施例还可以通过图片增强的方式扩展图片数量,例如,将图像在一定尺度范围内平移、将图像在一定角度范围内旋转、水平翻转或上下翻转图像、在原有图像上裁剪出一块、将图像在一定尺度内放大或缩小、对图像的RGB颜色空间进行一些变化、给图像加入一些人工生成的噪声(如高斯噪声)等等,从而显著提高图片的数据量。
在本实施例的步骤S2中,本实施例将Xception作为主干网络进行搭建Xception模型,Xception网络是由深度神经网络(Inception)结构加上深度可分离卷积(depthwiseseparable convlution),再加上残差网络结构改进而来。常规卷积是直接通过一个卷积核把空间信息和通道信息直接提取出来,结合了空间维度(spatial dimensions)和通道维度(channels dimensions),而Xception网络这种是分开做的。它最初的想法是从Incetpion来的,总体思想是把交叉通道相关性(corss-channel correlations)和空间相关性(spatial correlations)充分解耦合,将深度神经网络模块(Inception modul)拆分成一系列操作,独立处理spatial-correlations和cross-channel correlations,网络处理起来更加简单有效。参看图2,本实施例基于Xception网络搭建的Xception模型包括依次连接的输入层、卷积层、池化层、全连接层和输入层,通过上述不同的功能层进行识别过程的图像处理。
参看图2,本实施例的输入层用于执行步骤A1:对输入的图像进行归一化的预处理,之后输入至卷积层,经过归一化预处理之后的图像,不仅适合Xception的网络,而且可以筛选出相关的物体信息,以便于对无效信息的弱化。本实施例的卷积层用于执行步骤A21至A23:图像经过预处理后,Xception会自动压缩到合适的尺寸,对预处理之后的图像进行大小统一,并通过卷积进行初步特征提取,得到特征提取图,其中,对于需要识别的图像,本实施例Xception可以自动压缩到合适的尺寸,没有了图片传入大小的限制,从而节省了图片处理的时间,提高了识别的速度;将得到的特征提取图输入到深度可分离卷积中,进行特征的进一步提取,依次提取初级、中级和高级特征,深度可分离卷积原理参看图3,其中,通过尺寸不同的可分离卷积核对图像进行处理,分别自动提取图像的图像信息,图像信息包括边缘、明暗、轮廓等信息。具体地,Xception网络卷积层的图像处理的步骤可以为:首先通过“1x1”卷积,将输入数据拆分交叉通道相关性,拆分成3或者4组独立的空间;然后,通过‘3x3’或者‘5x5’卷积核映射到更小的空间上去。本实施例的池化层用于执行步骤A31至A33:本实施例在每个深度可分离卷积中设置一个最大池化层,其中,每个深度可分离卷积模块的连接采用残差连接,通过最大池化层对初级特征、中级特征、高级特征进行筛选降维,保留主要的特征同时减少参数(降维)和计算量;再对筛选降维之后的初级特征、中级特征、高级特征进行特征融合,之后输入全连接层。本实施例的全连接层和输出层用于执行步骤S41和S42:全连接层将特征融合之后的特征整合具有类别区分性的局部信息并输出,输出层通过逻辑回归分类之后进行输出,以准确地对图像进行识别。
本实施例通过Xception模型的输入层对输入的图像进行归一化预处理,可筛选出相关的物体信息,以便对无效信息进行弱化,通过Xception模型的卷积层中尺寸不同的深度可分离卷积模块,对图像进行处理,可以自动提取图像的边缘、明暗、轮快等信息,通过Xception模型的池化层对卷积得到的特征进行筛选降维,保留主要的特征同时减少参数(降维)和计算量,如此,通过上述Xception模型的图像处理上的优化,提高了模型识别的速度,从而降低了货车晚点到站的可能性。
在本实施例的步骤S2中,本实施例还对Xception模型进行优化,其中,将Xception模型的学习率调整为自适应,以前期加快收敛速度,后期提高搜索精度。模型的学习率作为监督学习以及深度学习中重要的超参,其决定着目标函数能否收敛到局部最小值以及何时收敛到最小值,合适的学习率能够使目标函数在合适的时间内收敛到局部最小值,本实施例将Xception模型的学习率调整为自适应,以自动调节该学习率,从而前期大学习率搜索加快收敛速度,后期小学习率调优提高搜索精度,其中,本实施例具体可以通过随机梯度下降,基于损失梯度调整学习率,使得学习率随着训练过程逐步进行调整,同样地,也可以采用离散下降、指数减缓、分数减缓等方式进行学习率的自动调节。
在本实施例的步骤S2中,本实施例还对Xception模型加入用于减弱深层神经网络的过拟合效应的Dropout层,Dropout层可以加入到任意一层或多层中,一般优选可以加入在全连接层,增强模型的鲁棒性、泛化性能。一般标准的深度神经网络的训练准则是要求所有样本的期望值与输出值的误差平方和(拟合误差)小于给定的足够小的允许误差,一般,允许误差越小拟合精度越高,网络的预测精度也越高。但实际上,随着拟合误差的减小,开始预测误差也随着减小,但随着拟合误差减小到某个值之后,预测误差反而增大,说明泛化能力降低,这就是过拟合效应。本实施例中,Dropout层会按照所设定的概率参数(范围0~1,默认值为0.5),在每次训练中随机地不激活一定比例的神经单元,以减弱深层神经网络训练过程中的的过拟合效应,其中,对Dropout层概率参数的设定,可以先将概率参数设为0,根据训练后得到模型的指标检验模型是否存在过拟合,若存在,则可以将概率参数设置为默认值,再次进行训练后根据模型指标进行检验过拟合是否好转,若过拟合明显好转,但指标明显下降,可以尝试较小的概率参数,若过拟合还是严重,则可以尝试更大的概率参数,以此,可以得到本实施例所训练模型所适合的Dropout层概率参数。
在本实施例的步骤S3中,通过加载预先通过同类数据集训练好的预训练模型,该预训练模型训练时采用数据集与本实施例中训练的样本图像及类似,其中,同类数据集与采集的样本图像集是类似的图像集,和本发明类似的同类数据集,例如检测有无客车或或者有无自行车或者有无障碍物等等数据集,通过已经用同类数据集训练好了的预训练模型可以用到本实施例近似的数据集上进行模型微调,即调用该预训练模型,输入搭建好的Xception模型中,通过样本图像集从预训练模型开始训练,如此,模型的训练不再从零开始,大大加快模型训练的速度,缩短了时间周期,模型训练完成后输出h5训练文件。
在本实施例的步骤S4中,通过取不同于训练所用的样本图像集的非样本集的图片进行测试,非样本集中一类有货车,另一类无货车,将非样本集输入到训练好的模型中,检验模型识别的准确性,以判断模型的训练效果,若模型识别的准确性较差,需进行再训练,直至到达识别要求,得到可以运用于实际站台货车检测中的准时到站识别模型。
在本实施例的步骤S5中,通过经测试之后输出准时到站识别模型,本实施例可以通过站台任意的摄像头等检测终端,可以快速地识别判断站台是否有物流货车到站,其中,对于摄像头拍摄的图片或视频没有大小、分辨率的限制,可以广泛适用于现有的站台进行物流货车的到站识别。该到站识别模型也可以与现在的站台物流系统进行结合,例如当识别第一时间识别到有物流货车到站,站台物流系统则自动进行物流货车的到站记录,并且自动进行卸货或装货的流程安排,如控制一些自动化设备对货车进行货物卸货或装货,完成之后,第一时间通知货车司机驶离站台,以提高站台车位的周转利用率。通过准时到站识别模型进行物流货车到站识别,大大节省了物流货车进站所需要的时间,大大减小了运输晚点的可能性,满足了快递行业时效性的要求。
本实施例通过上述方法可以快速地得到符合要求的准时到站识别模型,将准时到站识别模型应用到实际物流站点中,可以避免现有复杂的货车进站流程,大大降低了货车因为进站拥堵、进站登记不及时或慢而造成的到站晚点的可能性,推动了物流行业向高速、智能化的发展。
参看图4,本申请的另一个实施例中基于上述实施例还提供了一种物流货车准时到站识别装置,包括:数据采集模块1、模型搭建模块2、模型加载训练模块3、模型测试输出模块4、到站识别模块5。
本实施例的数据采集模块可以基于具体站台场景和所要识别的物流货车,通过摄像的形式采集所需的样本图像集,本实施例对于获取的图像数量不作限制,原则上采集的图片越多越好,以提高实际应用中物流货车到站的识别效果。具体地,本实施例的样本图像集分成两类,一类是有货车的图片,另一类是没有货车的图片,其中,样本图像集中图片的格式可以是Bmp图片格式,这些图像不需要进行数据标注,同样对于尺寸大小没有严格统一要求,如此,本实施例的方法可以适用于不同设备拍摄获取的图像,并且不需要通过对获取的图片进行裁剪等预处理以形成统一标准的图片,大大提高方法的兼容性、适配性。
较优地,在有限图片下,本实施例的数据采集模块还可以通过图片增强的方式扩展图片数量,例如,将图像在一定尺度范围内平移、将图像在一定角度范围内旋转、水平翻转或上下翻转图像、在原有图像上裁剪出一块、将图像在一定尺度内放大或缩小、对图像的RGB颜色空间进行一些变化、给图像加入一些人工生成的噪声(如高斯噪声)等等,从而显著提高图片的数据量。
本实施例的模型搭建模块将Xception作为主干网络进行搭建Xception模型,Xception网络是由深度神经网络(Inception)结构加上深度可分离卷积(depthwiseseparable convlution),再加上残差网络结构改进而来。常规卷积是直接通过一个卷积核把空间信息和通道信息直接提取出来,结合了空间维度(spatial dimensions)和通道维度(channels dimensions),而Xception网络这种是分开做的。它最初的想法是从Incetpion来的,总体思想是把交叉通道相关性(corss-channel correlations)和空间相关性(spatial correlations)充分解耦合,将深度神经网络模块(Inception modul)拆分成一系列操作,独立处理spatial-correlations和cross-channel correlations,网络处理起来更加简单有效。其中,Xception模型包括输入层、卷积层、池化层、全连接层和输出层,通过上述不同的功能层进行识别过程的图像处理。
具体地,本实施例的输入层用于执行:对输入的图像进行归一化的预处理,之后输入至卷积层,经过归一化预处理之后的图像,不仅适合Xception的网络,而且可以筛选出相关的物体信息,以便于对无效信息的弱化。本实施例的卷积层用于执行:图像经过预处理后,Xception会自动压缩到合适的尺寸,对预处理之后的图像进行大小统一,并通过卷积进行初步特征提取,得到特征提取图,其中,对于需要识别的图像,本实施例Xception可以自动压缩到合适的尺寸,没有了图片传入大小的限制,从而节省了图片处理的时间,提高了识别的速度;将得到的特征提取图输入到深度可分离卷积中,进行特征的进一步提取,依次提取初级、中级和高级特征,其中,通过尺寸不同的可分离卷积核对图像进行处理,分别自动提取图像的图像信息,图像信息包括边缘、明暗、轮廓等信息。具体地,Xception网络卷积层的图像处理的步骤可以为:首先通过“1x1”卷积,将输入数据拆分交叉通道相关性,拆分成3或者4组独立的空间;然后,通过‘3x3’或者‘5x5’卷积核映射到更小的空间上去。本实施例的池化层用于执行:本实施例在每个深度可分离卷积中设置一个最大池化层,其中,每个深度可分离卷积模块的连接采用残差连接,通过最大池化层对初级特征、中级特征、高级特征进行筛选降维,保留主要的特征同时减少参数(降维)和计算量;再对筛选降维之后的初级特征、中级特征、高级特征进行特征融合,之后输入全连接层。本实施例的全连接层和输出层用于执行:全连接层将特征融合之后的特征整合具有类别区分性的局部信息并输出,输出层通过逻辑回归分类之后进行输出,以准确地对图像进行识别。
本实施例的模型搭建模块还对Xception模型进行优化,其中,将Xception模型的学习率调整为自适应,以前期加快收敛速度,后期提高搜索精度。模型的学习率作为监督学习以及深度学习中重要的超参,其决定着目标函数能否收敛到局部最小值以及何时收敛到最小值,合适的学习率能够使目标函数在合适的时间内收敛到局部最小值,本实施例将Xception模型的学习率调整为自适应,以自动调节该学习率,从而前期大学习率搜索加快收敛速度,后期小学习率调优提高搜索精度,其中,本实施例具体可以通过随机梯度下降,基于损失梯度调整学习率,使得学习率随着训练过程逐步进行调整,同样地,也可以采用离散下降、指数减缓、分数减缓等方式进行学习率的自动调节。
本实施例还对Xception模型加入用于减弱深层神经网络的过拟合效应的Dropout层,Dropout层可以加入到任意一层或多层中,一般优选可以加入在全连接层,增强模型的鲁棒性、泛化性能。一般标准的深度神经网络的训练准则是要求所有样本的期望值与输出值的误差平方和(拟合误差)小于给定的足够小的允许误差,一般,允许误差越小拟合精度越高,网络的预测精度也越高。但实际上,随着拟合误差的减小,开始预测误差也随着减小,但随着拟合误差减小到某个值之后,预测误差反而增大,说明泛化能力降低,这就是过拟合效应。本实施例中,Dropout层会按照所设定的概率参数(范围0~1,默认值为0.5),在每次训练中随机地不激活一定比例的神经单元,以减弱深层神经网络训练过程中的的过拟合效应,其中,对Dropout层概率参数的设定,可以先将概率参数设为0,根据训练后得到模型的指标检验模型是否存在过拟合,若存在,则可以将概率参数设置为默认值,再次进行训练后根据模型指标进行检验过拟合是否好转,若过拟合明显好转,但指标明显下降,可以尝试较小的概率参数,若过拟合还是严重,则可以尝试更大的概率参数,以此,可以得到本实施例所训练模型所适合的Dropout层概率参数。
本实施例通过Xception模型的输入层对输入的图像进行归一化预处理,可筛选出相关的物体信息,以便对无效信息进行弱化,通过Xception模型的卷积层中尺寸不同的深度可分离卷积模块,对图像进行处理,可以自动提取图像的边缘、明暗、轮快等信息,通过Xception模型的池化层对卷积得到的特征进行筛选降维,保留主要的特征同时减少参数(降维)和计算量,如此,通过上述Xception模型的图像处理上的优化,提高了模型识别的速度,从而降低了货车晚点到站的可能性。
本实施例的模型加载训练模块通过加载预先通过同类数据集训练好的预训练模型,该预训练模型训练时采用数据集与本实施例中训练的样本图像及类似,其中,同类数据集与采集的样本图像集是类似的图像集,和本发明类似的同类数据集例如检测有无客车或或者有无自行车或者有无障碍物等等数据集,通过已经用同类数据集训练好了的预训练模型可以用到本实施例近似的数据集上进行模型微调,即调用该预训练模型,输入搭建好的Xception模型中,通过样本图像集从预训练模型开始训练,如此,模型的训练不再从零开始,大大加快模型训练的速度,缩短了时间周期,模型训练完成后输出h5训练文件。
本实施例的模型测试输出模块通过取不同于训练所用的样本图像集的非样本集的图片进行测试,非样本集中一类有货车,另一类无货车,将非样本集输入到训练好的模型中,检验模型识别的准确性,以判断模型的训练效果,若模型识别的准确性较差,需进行再训练,直至到达识别要求,得到可以运用于实际站台货车检测中的准时到站识别模型。
本实施例的到站识别模块通过经测试之后输出准时到站识别模型,本实施例可以通过站台任意的摄像头等检测终端,可以快速地识别判断站台是否有物流货车到站,其中,对于摄像头拍摄的图片或视频没有大小、分辨率的限制,可以广泛适用于现有的站台进行物流货车的到站识别。该到站识别模型也可以与现在的站台物流系统进行结合,例如当识别第一时间识别到有物流货车到站,站台物流系统则自动进行物流货车的到站记录,并且自动进行卸货或装货的流程安排,如控制一些自动化设备对货车进行货物卸货或装货,完成之后,第一时间通知货车司机驶离站台,以提高站台车位的周转利用率。通过准时到站识别模型进行物流货车到站识别,大大节省了物流货车进站所需要的时间,大大减小了运输晚点的可能性,满足了快递行业时效性的要求。
本申请还提出了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如上述实施例所提及的物流货车准时到站识别方法。
本申请还提出了一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中所提及的物流货车准时到站识别方法。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式。即使对本发明作出各种变化,倘若这些变化属于本发明权利要求及其等同技术的范围之内,则仍落入在本发明的保护范围之中。
Claims (9)
1.一种物流货车准时到站识别方法,其特征在于,包括以下步骤:
S1:对物流货车的站台进行图像采集,获取样本图像集;
S2:基于Xception网络架构搭建Xception模型,所述Xception模型包括输入层、卷积层、池化层、全连接层和输出层,其中,将所述Xception模型的学习率调整为自适应,并对所述Xception模型加入用于减弱深层神经网络的过拟合效应的Dropout层;
S3:加载预先通过同类数据集训练好的预训练模型,输入搭建好的所述Xception模型中,通过所述样本图像集从所述预训练模型开始训练;
S4:对训练完成之后的模型进行测试,输出得到准时到站识别模型;
S5:通过所述准时到站识别模型对车站场景进行监控识别,判断是否有物流货车到站。
2.根据权利要求1所述的物流货车准时到站识别方法,其特征在于,所述步骤S2中,所述输入层包括以下图像处理步骤:
对输入的图像进行归一化的预处理,之后输入至所述卷积层。
3.根据权利要求2所述的物流货车准时到站识别方法,其特征在于,所述步骤S2中,所述卷积层包括以下图像处理步骤:
统一所述预处理之后的图像大小,并通过卷积进行初步特征提取,得到特征提取图;
通过尺寸不同的深度可分离卷积对所述特征提取图进行特征的进一步提取,依次提取得到初级特征、中级特征和高级特征。
4.根据权利要求3所述的物流货车准时到站识别方法,其特征在于,所述步骤S2中,所述池化层包括以下图像处理步骤:
通过每个所述深度可分离卷积模块中的最大池化层对所述初级特征、所述中级特征、所述高级特征进行筛选降维,其中,每个所述深度可分离卷积模块的连接采用残差连接;
对所述筛选降维之后的所述初级特征、所述中级特征、所述高级特征进行特征融合,之后输入所述全连接层。
5.根据权利要求4所述的物流货车准时到站识别方法,其特征在于,所述步骤S2中,所述全连接层和所述输出层包括以下图像处理步骤:
将所述特征融合之后的特征整合具有类别区分性的局部信息,并通过逻辑回归分类进行输出。
6.一种物流货车准时到站识别装置,其特征在于,包括:
数据采集模块,用于对物流货车的站台进行图像采集,获取样本图像集;
模型搭建模块,用于基于Xception网络架构搭建Xception模型,所述Xception模型包括输入层、卷积层、池化层、全连接层和输出层,其中,将所述Xception模型的学习率调整为自适应,并对所述Xception模型加入用于减弱深层神经网络的过拟合效应的Dropout层;
模型加载训练模块,用于加载预先通过同类数据集训练好的预训练模型,输入搭建好的所述Xception模型中,通过所述样本图像集从所述预训练模型开始训练;
模型测试输出模块,用于对训练完成之后的模型进行测试,输出得到准时到站识别模型;
到站识别模块,用于通过所述准时到站识别模型对车站场景进行监控识别,判断是否有物流货车到站。
7.根据权利要求6所述的物流货车准时到站识别装置,其特征在于,所述输入层用于对输入的图像进行归一化的预处理,之后输入至所述卷积层;
所述卷积层用于对所述预处理之后的图像进行大小统一,并通过卷积进行初步特征提取,得到特征提取图,以及通过尺寸不同的深度可分离卷积对所述特征提取图进行特征的进一步提取,依次提取得到初级特征、中级特征和高级特征;
所述池化层用于通过每个所述深度可分离卷积模块中的最大池化层对所述初级特征、所述中级特征、所述高级特征进行筛选降维,其中,每个所述深度可分离卷积模块的连接采用残差连接,以及对所述筛选降维之后的所述初级特征、所述中级特征、所述高级特征进行特征融合,之后输入所述全连接层;
所述全连接层和所述输出层用于将所述特征融合之后的特征整合具有类别区分性的局部信息,并通过逻辑回归分类进行输出。
8.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述的物流货车准时到站识别方法。
9.一种存储有计算机可读指令的存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至5中任一项所述的物流货车准时到站识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010732114.0A CN112001258B (zh) | 2020-07-27 | 2020-07-27 | 物流货车准时到站识别方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010732114.0A CN112001258B (zh) | 2020-07-27 | 2020-07-27 | 物流货车准时到站识别方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112001258A true CN112001258A (zh) | 2020-11-27 |
CN112001258B CN112001258B (zh) | 2023-07-11 |
Family
ID=73467785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010732114.0A Active CN112001258B (zh) | 2020-07-27 | 2020-07-27 | 物流货车准时到站识别方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112001258B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114066055A (zh) * | 2021-11-16 | 2022-02-18 | 中交智运有限公司 | 一种在物流运输中车辆晚靠台预测的方法、装置和服务器 |
CN114255359A (zh) * | 2022-03-01 | 2022-03-29 | 深圳市北海轨道交通技术有限公司 | 一种基于运动图像识别的智能报站校验方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590741A (zh) * | 2017-09-19 | 2018-01-16 | 广东工业大学 | 一种预测图片流行度的方法及系统 |
CN108898579A (zh) * | 2018-05-30 | 2018-11-27 | 腾讯科技(深圳)有限公司 | 一种图像清晰度识别方法、装置和存储介质 |
US20190220709A1 (en) * | 2018-01-18 | 2019-07-18 | Aptiv Technologies Limited | Device and a method for image classification using a convolutional neural network |
WO2020083073A1 (zh) * | 2018-10-23 | 2020-04-30 | 苏州科达科技股份有限公司 | 非机动车图像多标签分类方法、系统、设备及存储介质 |
-
2020
- 2020-07-27 CN CN202010732114.0A patent/CN112001258B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590741A (zh) * | 2017-09-19 | 2018-01-16 | 广东工业大学 | 一种预测图片流行度的方法及系统 |
US20190220709A1 (en) * | 2018-01-18 | 2019-07-18 | Aptiv Technologies Limited | Device and a method for image classification using a convolutional neural network |
CN108898579A (zh) * | 2018-05-30 | 2018-11-27 | 腾讯科技(深圳)有限公司 | 一种图像清晰度识别方法、装置和存储介质 |
WO2020083073A1 (zh) * | 2018-10-23 | 2020-04-30 | 苏州科达科技股份有限公司 | 非机动车图像多标签分类方法、系统、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
石鑫;赵池航;林盛梅;李彦伟;薛善光;钱子晨;: "基于深度学习网络模型的车辆类型识别方法研究", 筑路机械与施工机械化, no. 04 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114066055A (zh) * | 2021-11-16 | 2022-02-18 | 中交智运有限公司 | 一种在物流运输中车辆晚靠台预测的方法、装置和服务器 |
CN114255359A (zh) * | 2022-03-01 | 2022-03-29 | 深圳市北海轨道交通技术有限公司 | 一种基于运动图像识别的智能报站校验方法和系统 |
CN114255359B (zh) * | 2022-03-01 | 2022-06-24 | 深圳市北海轨道交通技术有限公司 | 一种基于运动图像识别的智能报站校验方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112001258B (zh) | 2023-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110059582B (zh) | 基于多尺度注意力卷积神经网络的驾驶员行为识别方法 | |
WO2021244621A1 (zh) | 基于全局引导选择性上下文网络的场景语义解析方法 | |
CN107690659B (zh) | 一种图像识别系统及图像识别方法 | |
US20230154210A1 (en) | Method for recognizing license plate characters, electronic device and storage medium | |
CN110033481A (zh) | 用于进行图像处理的方法和设备 | |
CN112001258B (zh) | 物流货车准时到站识别方法、装置、设备和存储介质 | |
CN115035295B (zh) | 一种基于共享卷积核和边界损失函数的遥感图像语义分割方法 | |
US12008071B2 (en) | System and method for parameter compression of capsule networks using deep features | |
CN113177528B (zh) | 基于多任务学习策略训练网络模型的车牌识别方法及系统 | |
CN112784675B (zh) | 目标检测方法及装置、存储介质、终端 | |
CN114612755A (zh) | 一种火灾检测方法、系统、电子设备和可读存储介质 | |
CN110390813B (zh) | 基于车型鉴别的大数据处理系统 | |
CN117523218A (zh) | 标签生成、图像分类模型的训练、图像分类方法及装置 | |
CN114419005A (zh) | 基于改进轻量型cnn与迁移学习的裂缝自动检测方法 | |
US20240013516A1 (en) | Method and system for deep learning based image feature extraction | |
CN117710295A (zh) | 图像处理方法、装置、设备、介质及程序产品 | |
CN115761552B (zh) | 面向无人机机载平台的目标检测方法、设备及介质 | |
CN114187502A (zh) | 车辆装载率识别方法、装置、电子设备及存储介质 | |
CN111814562A (zh) | 车辆的识别方法、车辆识别模型的训练方法及相关装置 | |
CN116524314A (zh) | 一种基于无锚框算法的无人机小目标检测方法 | |
CN115830362A (zh) | 图像处理方法、装置、设备、介质及产品 | |
CN110689481A (zh) | 车辆种类识别方法及装置 | |
CN112507933B (zh) | 基于集中式信息交互的显著性目标检测方法及系统 | |
CN115393743A (zh) | 基于双分支编解码网络的车辆检测方法、无人机、介质 | |
CN115147818A (zh) | 玩手机行为识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |