CN111666848A - 运输车辆到站检测方法、装置、设备及存储介质 - Google Patents
运输车辆到站检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111666848A CN111666848A CN202010462723.9A CN202010462723A CN111666848A CN 111666848 A CN111666848 A CN 111666848A CN 202010462723 A CN202010462723 A CN 202010462723A CN 111666848 A CN111666848 A CN 111666848A
- Authority
- CN
- China
- Prior art keywords
- detected
- image
- target
- convolution
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/584—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Abstract
本发明涉及物流技术领域,公开了一种运输车辆到站检测方法、装置、设备及存储介质,用于解决运输车辆的监控效率低下,无法准确判断运输车辆是否停靠在指定位置的问题。运输车辆到站检测方法包括:获取多个待检测图像;通过预置的特征提取器对每个待检测图像进行卷积计算,得到多个待检测图像对应的多个待检测特征向量;根据预置的分类函数确定每个待检测特征向量的类别标签,得到多个类别标签,利用预置的迁移学习模型对多个类别标签进行训练,得到待检测图像的训练结果;获取目标待识别图像,采用预置深度学习网络解析目标待识别图像,得到目标待确认结果,将目标待确认结果与待检测图像的训练结果进行比对,得到目标待识别图像的目标识别结果。
Description
技术领域
本发明涉及物流技术领域,尤其涉及一种运输车辆到站检测方法、装置、设备及存储介质。
背景技术
随着生活水平的不断提高,物流运输领域也得到了愈来愈多的重视。在进行货物(快递包裹)运输的过程中,物流运营商负责将揽收的货物运输到各个分拨中转站,再由分拨中转站根据货物的运输目的地的地址将货物进行分类,最后,再由运输车辆将分类后的货物运输到相应的目的地。一般情况下,物流运营商会在货物存放仓的停车场中设置监控系统,利用监控系统中的TensorFlow框架对车辆进行位置识别,实时监控运输车辆。
但是在现有技术中,因采用TensorFlow框架识别运输车辆时,对于识别到的图像大小以及分辨率均有限制,以致于不能及时的监控到运输车辆的位置信息,导致运输车辆的监控效率低下,无法准确判断运输车辆是否停靠在停车场的指定位置上。
发明内容
本发明的主要目的在于解决运输车辆的监控效率低下,无法准确判断运输车辆是否停靠在停车场的指定位置上的问题。
本发明第一方面提供了一种运输车辆到站检测方法,包括:获取多个待检测图像,所述待检测图像用于显示车辆停靠位置上是否停靠运输车辆;通过预置的特征提取器对每个待检测图像进行卷积计算,得到所述多个待检测图像对应的多个待检测特征向量;根据预置的分类函数确定每个待检测特征向量的类别标签,得到多个类别标签,并利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果;获取目标待识别图像,采用预置深度学习网络解析所述目标待识别图像,得到目标待确认结果,将所述目标待确认结果与所述待检测图像的训练结果进行比对,得到目标待识别图像的目标识别结果,其中,所述目标识别结果包括第一识别结果与第二识别结果,所述第一识别结果用于指示车辆停靠位置上已停靠运输车辆,所述第二识别结果用于指示车辆停靠位置上未停靠运输车辆。
可选的,在本发明第一方面的第一种实现方式中,所述所述根据预置的分类函数确定每个待检测特征向量的类别标签,得到多个类别标签,并利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果包括:采用卷积神经网络计算所述多个待检测特征向量的基础特征值,得到多个基础特征值;通过所述多个基础特征值以及预置的分类函数,计算每个待检测特征向量对应的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应;利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果。
可选的,在本发明第一方面的第二种实现方式中,所述通过所述多个基础特征值以及预置的分类函数,计算每个待检测特征向量对应的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应包括:采用预置的分类函数分别计算所述多个基础特征值中目标基础特征值与多个预置类别特征值之间的相似匹配值,得到多个相似匹配值;在所述多个相似匹配值中选取数值最大的目标相似匹配值,将计算所述目标相似匹配度的预置类别特征值所对应的标准类别标签确定为目标基础特征值的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应。
可选的,在本发明第一方面的第三种实现方式中,所述利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果包括:采用数据集划分函数将多个类别标签进行划分,得到训练标签集、验证标签集及测试标签集;配置预置的初始脚本的设置参数,得到配置后的初始脚本;将所述训练标签集中的多个类别标签输入到所述配置后的初始脚本中,通过所述配置后的初始脚本对所述训练标签集中的多个类别标签进行训练,得到所述多个类别标签的待验证模型;将所述验证标签集中的多个类别标签输入到所述待验证模型中,得到所述验证标签集中的多个类别标签对应的多个验证结果,计算所述多个验证结果的准确度,并判断所述多个验证结果的准确度是否大于标准预测准确度;若所述多个验证结果的准确度大于标准预测准确度,则将所述待验证模型确定为待测试模型,将所述测试标签集中的多个类别标签输入到所述待测试模型中,得到所述测试标签集中的多个类别标签对应的多个测试结果,计算所述多个测试结果的准确度,并判断所述多个测试结果的准确度是否大于预期预测准确度;若所述待测试模型的准确度大于预期预测准确度,则将所述待测试模型确定为迁移学习模型,将所述测试结果确定为待检测图像的训练结果。
可选的,在本发明第一方面的第四种实现方式中,在配置预置的初始脚本的设置参数,得到配置后的初始脚本包括:在预置的初始脚本输入基础特征值的维度以及类别标签的维度,得到基础脚本;在所述基础脚本中分别添加一个多维全连接层以及一个二维全连接层,得到候选脚本;计算所述候选脚本的交叉熵数值,并计算所述交叉熵数值的损失函数,通过函数优化器对所述交叉熵数值的损失函数进行优化,得到配置后的初始脚本。
可选的,在本发明第一方面的第五种实现方式中,所述通过预置的特征提取器对每个待检测图像进行卷积计算,得到所述多个待检测图像对应的多个待检测特征向量包括:在预置的特征提取器中,将所述多个待检测图像输入到第一卷积层中,分别对每个待检测图像依次做第一卷积计算以及第一最大化池化,得到多个第一卷积特征图;将所述多个第一卷积特征图输入第二卷积层中,分别对每个第一卷积特征图依次做第二卷积计算以及第二最大化池化,得到多个第二卷积特征图;将所述多个第二卷积特征图输入第三卷积层中,分别对每个第二卷积特征图依次做第三卷积计算以及第三最大化池化,得到多个第三卷积特征图;将所述多个第三卷积特征图输入第四卷积层中,分别对每个第三卷积特征图依次做第四卷积计算以及第四最大化池化,得到多个第四卷积特征图;将所述多个第四卷积特征图输入第五卷积层中,分别对每个第四卷积特征图依次做第五卷积计算以及第五最大化池化,得到多个第五卷积特征图;将多个第五卷积特征图输入全连接层中,采用线性整流函数分别对每个第五卷积特征图进行修正,将每个修正后的第五卷积特征图作为待检测特征向量,得到多个待检测特征向量。
本发明第二方面提供了一种运输车辆到站检测装置,包括:获取模块,用于获取多个待检测图像,所述待检测图像用于显示车辆停靠位置上是否停靠运输车辆;卷积计算模块,用于通过预置的特征提取器对每个待检测图像进行卷积计算,得到所述多个待检测图像对应的多个待检测特征向量;训练模块,用于根据预置的分类函数确定每个待检测特征向量的类别标签,得到多个类别标签,并利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果;比对模块,用于获取目标待识别图像,采用预置深度学习网络解析所述目标待识别图像,得到目标待确认结果,将所述目标待确认结果与所述待检测图像的训练结果进行比对,得到目标待识别图像的目标识别结果,其中,所述目标识别结果包括第一识别结果与第二识别结果,所述第一识别结果用于指示车辆停靠位置上已停靠运输车辆,所述第二识别结果用于指示车辆停靠位置上未停靠运输车辆。
可选的,在本发明第二方面的第一种实现方式中,所述训练模块包括:第一计算单元,用于采用卷积神经网络计算所述多个待检测特征向量的基础特征值,得到多个基础特征值;第二计算单元,用于通过所述多个基础特征值以及预置的分类函数,计算每个待检测特征向量对应的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应;训练单元,用于利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果。
可选的,在本发明第二方面的第二种实现方式中,所述第二计算单元具体用于:采用预置的分类函数分别计算所述多个基础特征值中目标基础特征值与多个预置类别特征值之间的相似匹配值,得到多个相似匹配值;在所述多个相似匹配值中选取数值最大的目标相似匹配值,将计算所述目标相似匹配度的预置类别特征值所对应的标准类别标签确定为目标基础特征值的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应。
可选的,在本发明第二方面的第三种实现方式中,所述训练单元包括:划分子单元,用于采用数据集划分函数将多个类别标签进行划分,得到训练标签集、验证标签集及测试标签集;配置子单元,用于配置预置的初始脚本的设置参数,得到配置后的初始脚本;训练子单元,用于将所述训练标签集中的多个类别标签输入到所述配置后的初始脚本中,通过所述配置后的初始脚本对所述训练标签集中的多个类别标签进行训练,得到所述多个类别标签的待验证模型;验证子单元,用于将所述验证标签集中的多个类别标签输入到所述待验证模型中,得到所述验证标签集中的多个类别标签对应的多个验证结果,计算所述多个验证结果的准确度,并判断所述多个验证结果的准确度是否大于标准预测准确度;测试子单元,若所述多个验证结果的准确度大于标准预测准确度,则用于将所述待验证模型确定为待测试模型,将所述测试标签集中的多个类别标签输入到所述待测试模型中,得到所述测试标签集中的多个类别标签对应的多个测试结果,计算所述多个测试结果的准确度,并判断所述多个测试结果的准确度是否大于预期预测准确度;确定子单元,若所述待测试模型的准确度大于预期预测准确度,则用于将所述待测试模型确定为迁移学习模型,将所述测试结果确定为待检测图像的训练结果。
可选的,在本发明第二方面的第四种实现方式中,所述配置子单元具体用于:在预置的初始脚本输入基础特征值的维度以及类别标签的维度,得到基础脚本;在所述基础脚本中分别添加一个多维全连接层以及一个二维全连接层,得到候选脚本;计算所述候选脚本的交叉熵数值,并计算所述交叉熵数值的损失函数,通过函数优化器对所述交叉熵数值的损失函数进行优化,得到配置后的初始脚本。
可选的,在本发明第二方面的第五种实现方式中,所述卷积计算模块具体用于:在预置的特征提取器中,将所述多个待检测图像输入到第一卷积层中,分别对每个待检测图像依次做第一卷积计算以及第一最大化池化,得到多个第一卷积特征图;将所述多个第一卷积特征图输入第二卷积层中,分别对每个第一卷积特征图依次做第二卷积计算以及第二最大化池化,得到多个第二卷积特征图;将所述多个第二卷积特征图输入第三卷积层中,分别对每个第二卷积特征图依次做第三卷积计算以及第三最大化池化,得到多个第三卷积特征图;将所述多个第三卷积特征图输入第四卷积层中,分别对每个第三卷积特征图依次做第四卷积计算以及第四最大化池化,得到多个第四卷积特征图;将所述多个第四卷积特征图输入第五卷积层中,分别对每个第四卷积特征图依次做第五卷积计算以及第五最大化池化,得到多个第五卷积特征图;将多个第五卷积特征图输入全连接层中,采用线性整流函数分别对每个第五卷积特征图进行修正,将每个修正后的第五卷积特征图作为待检测特征向量,得到多个待检测特征向量。
本发明第三方面提供了一种运输车辆到站检测设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述运输车辆到站检测设备执行上述的运输车辆到站检测方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的运输车辆到站检测方法。
本发明提供的技术方案中,获取多个待检测图像,所述待检测图像用于显示车辆停靠位置上是否停靠运输车辆;通过预置的特征提取器对每个待检测图像进行卷积计算,得到所述多个待检测图像对应的多个待检测特征向量;根据预置的分类函数确定每个待检测特征向量的类别标签,得到多个类别标签,并利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果;获取目标待识别图像,采用预置深度学习网络解析所述目标待识别图像,得到目标待确认结果,将所述目标待确认结果与所述待检测图像的训练结果进行比对,得到目标待识别图像的目标识别结果,其中,所述目标识别结果包括第一识别结果与第二识别结果,所述第一识别结果用于指示车辆停靠位置上已停靠运输车辆,所述第二识别结果用于指示车辆停靠位置上未停靠运输车辆。本发明实施例中,利用VGG16与迁移学习模型对大量待检测图像进行训练,得到迁移学习模型,将目标待识别图像输入到迁移学习模型中,即可得到目标待识别图像中车辆停靠位置上是否有运输车辆存在的目标识别结果。通过建立迁移学习模型实现对目标待识别图像的识别,能够准确判断运输车辆是否停靠在停车场的指定位置上,达到实时监控运输车辆位置的效果,提高了运输车辆的监控效率。
附图说明
图1为本发明实施例中运输车辆到站检测方法的一个实施例示意图;
图2为本发明实施例中运输车辆到站检测方法的另一个实施例示意图;
图3为本发明实施例中运输车辆到站检测装置的一个实施例示意图;
图4为本发明实施例中运输车辆到站检测装置的另一个实施例示意图;
图5为本发明实施例中运输车辆到站检测设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种运输车辆到站检测方法、装置、设备及存储介质,利用VGG16与迁移学习模型对大量待检测图像进行训练,得到迁移学习模型,将目标待识别图像输入到迁移学习模型中,即可得到目标待识别图像中车辆停靠位置上是否有运输车辆存在的目标识别结果。通过建立迁移学习模型实现对目标待识别图像的识别,能够准确判断运输车辆是否停靠在停车场的指定位置上,达到实时监控运输车辆位置的效果,提高了运输车辆的监控效率。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中运输车辆到站检测方法的一个实施例包括:
101、获取多个待检测图像,待检测图像用于显示车辆停靠位置上是否停靠运输车辆;
可以理解的是,本发明的执行主体可以为运输车辆到站检测装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
需要说明的是,为了检测货物运输车辆是否停靠在停车场的指定位置上,则需要利用停车场的监控设备检测停车场的运输车辆停车情况,因此这里的多个待检测图像指的是多个安置在停车场的摄像头所捕获的图像,在多个待检测图像中,所显示的图像为不同拍摄角度下车辆停靠位置上有无运输车辆的画面。此外,此处并不对多个待检测图像的格式进行限定,多个待检测图像的格式可以为JPEG、TIFF、RAW等。
进一步说明的是,为了能够更迅速更准确的识别出车辆停靠位置上是否有停靠的运输车辆,需要利用大量的待检测图像建立一个能够识别出图像上是否有运输车辆的模型,因此,在此处需要收集大量的待检测图片,通过服务器对这些待检测图片进行训练,进而建立预测模型。一般情况下,为了使迁移学习模型的准确率更高,服务器选取2000-5000个待检测图片进行训练,服务器至少选取1000个待检测图片进行训练以保证迁移学习模型的准确率。在本申请中,并不对多个待检测图像的数量进行限定,可以根据实际情况选择不同数量的待检测图像。
102、通过预置的特征提取器对每个待检测图像进行卷积计算,得到多个待检测图像对应的多个待检测特征向量;
服务器在对多个待检测图像进行训练时,首先需要将每个待检测图像转化成能够代表该待检测图像的待检测特征向量,这里利用的预置的特征提取器即为VGG16中的深度网络结构,该深度网络结构中包括五个卷积网络层以及对应的池化层,将每个待检测图片输入到VGG16中的深度网络结构中后,即会得到每个待检测图片对应的待检测特征向量。需要说明的是,VGG16中的深度网络结构将244×244×3维度的待检测图片转化成4096维度的待检测特征向量,能够将待检测图片中每一个维度的信息量大大提高,从而降低了计算资源的消耗。
103、根据预置的分类函数确定每个待检测特征向量的类别标签,得到多个类别标签,并利用预置的迁移学习模型对多个类别标签进行训练,得到待检测图像的训练结果;
服务器利用预置的分类函数确定每个待检测特征向量的类别标签,这里的预置的分类函数为softmax分类函数,softmax分类函数可以理解为归一化,例如,待检测图片的类别有十种,将待检测图片输入到softmax分类函数后,经过一系列的分析处理,通过softmax分类函数输出的即为一个十维度的向量,该向量的第一个数值为当前待检测图片属于第一类别的概率值,该向量的第二个数值为当前待检测图片属于第二类别的概率值,……,该向量的第十个数值为当前待检测图片属于第十类别的概率值,这十个概率值之和为1。通过预置的分类函数即可计算出每个待检测特征向量的类别标签。
服务器利用预置的迁移学习模型对类别标签进行训练,这里预置的迁移学习模型指的是将一个预训练的模型被重新用在另一个任务中,以本申请的实施例来说:源任务为识别待检测图片,而目标任务为识别待检测图片有无运输车辆,并将有运输车辆的待检测图片分为一类,将无运输车辆的待检测图片分为另一类。一般情况下,利用VGG16网络实现识别待检测图片的源任务时,机器学习任务要求待检测图片的测试集和训练集有相同的概率分布,然而在训练待检测图片的过程中缺乏具有针对性的数据集来满足识别待检测图片中有无运输车辆的训练任务,而迁移学习可以进一步的优化VGG16网络,令VGG16网络可以更加快捷的实现目标任务。在本申请中,利用迁移学习模型对多个类别标签进行训练,得到待检测图像的训练结果。
104、获取目标待识别图像,采用预置深度学习网络解析目标待识别图像,得到目标待确认结果,将目标待确认结果与待检测图像的训练结果进行比对,得到目标待识别图像的目标识别结果,其中,目标识别结果包括第一识别结果与第二识别结果,第一识别结果用于指示车辆停靠位置上已停靠运输车辆,第二识别结果用于指示车辆停靠位置上未停靠运输车辆。
服务器获取目标待识别图像,目标待识别图像指的是需要识别出某个车辆停靠位置上是否停靠运输车辆的图像,该目标待识别图像是停车场中某个位置上的摄像设备捕获的,本申请中,并不对目标待识别图像的画面进行限定。在获取到目标待识别图像后,利用预置深度学习网络对目标待识别图像进行解析,预置深度学习网络指的是VGG16,将244×244×3维的目标待检测图像输入到VGG16后,经过一系列的卷积神经网络和池化网络处理之后,输出一个4096维目标待检测特征向量,然后将目标待检测特征向量输入到3层全连接的神经网络处理,最终服务器通过softmax规范化得到目标待检测图像的目标待确认结果。最后由服务器将目标待确认结果与通过迁移学习模型计算出来的训练结果进行比对,从而确定目标待识别图像的目标识别结果。
需要说明的是,在进行目标待确认结果与训练结果的比对时,采用的是相似度检测算法,通过比对两者之间的相似度确定目标待确认结果为待检测图像的训练结果中的哪一个。进一步说明的是,这里目标识别结果仅存在两类,第一类目标识别结果为第一识别结果,其中,第一识别结果用于指示车辆停靠位置上已停靠运输车辆,当运输车辆在指定时间内停靠在车辆停靠位置上时,说明运输车辆在指定时刻之前将货物运输到指定位置上,未影响货物运输的运输效率;第二类目标识别结果为第二识别结果,其中,第二识别结果用于指示车辆停靠位置上未停靠运输车辆,当运输车辆在指定时间内未停靠在车辆停靠位置上,说明运输车辆在指定时刻之内未将货物运输到指定位置上,影响货物运输的运输效率。此外,待检测图像的训练结果亦仅存在两类,待检测图像的训练结果与目标识别结果的存在结果相同。
本发明实施例中,利用VGG16与迁移学习模型对大量待检测图像进行训练,得到迁移学习模型,将目标待识别图像输入到迁移学习模型中,即可得到目标待识别图像中车辆停靠位置上是否有运输车辆存在的目标识别结果。通过建立迁移学习模型实现对目标待识别图像的识别,能够准确判断运输车辆是否停靠在停车场的指定位置上,达到实时监控运输车辆位置的效果,提高了运输车辆的监控效率。
请参阅图2,本发明实施例中运输车辆到站检测方法的另一个实施例包括:
201、获取多个待检测图像,待检测图像用于显示车辆停靠位置上是否停靠运输车辆;
需要说明的是,为了检测货物运输车辆是否停靠在停车场的指定位置上,则需要利用停车场的监控设备检测停车场的运输车辆停车情况,因此这里的多个待检测图像指的是多个安置在停车场的摄像头所捕获的图像,在多个待检测图像中,所显示的图像为不同拍摄角度下车辆停靠位置上有无运输车辆的画面。此外,此处并不对多个待检测图像的格式进行限定,多个待检测图像的格式可以为JPEG、TIFF、RAW等。
进一步说明的是,为了能够更迅速更准确的识别出车辆停靠位置上是否有停靠的运输车辆,需要利用大量的待检测图像建立一个能够识别出图像上是否有运输车辆的模型,因此,在此处需要收集大量的待检测图片,通过服务器对这些待检测图片进行训练,进而建立预测模型。一般情况下,服务器选取1000个待检测图片进行训练,但在本申请中,并不对多个待检测图像的数量进行限定,可以根据实际情况选择不同数量的待检测图像。
202、通过预置的特征提取器对每个待检测图像进行卷积计算,得到多个待检测图像对应的多个待检测特征向量;
服务器首先在预置的特征提取器中,将多个待检测图像输入到第一卷积层中,分别对每个待检测图像依次做第一卷积计算以及第一最大化池化,得到多个第一卷积特征图;其次服务器将多个第一卷积特征图输入第二卷积层中,分别对每个第一卷积特征图依次做第二卷积计算以及第二最大化池化,得到多个第二卷积特征图;然后服务器将多个第二卷积特征图输入第三卷积层中,分别对每个第二卷积特征图依次做第三卷积计算以及第三最大化池化,得到多个第三卷积特征图;服务器将多个第三卷积特征图输入第四卷积层中,分别对每个第三卷积特征图依次做第四卷积计算以及第四最大化池化,得到多个第四卷积特征图;服务器将多个第四卷积特征图输入第五卷积层中,分别对每个第四卷积特征图依次做第五卷积计算以及第五最大化池化,得到多个第五卷积特征图;最后服务器将多个第五卷积特征图输入全连接层中,采用线性整流函数分别对每个第五卷积特征图进行修正,将每个修正后的第五卷积特征图作为待检测特征向量,得到多个待检测特征向量。
预置特征提取器指的是VGG16中的深度网络结构,其由五个卷积网络层以及对应的最大池化层构成,相邻卷积网络层之间使用最大化池层(max-pooling)分开,所有隐层的激活单元都采用ReLU函数。VGG16中的深度网络结构的作用是缩小服务器获取到待检测图像的尺寸,并提取待检测图片的特征向量,将提取到的待检测特征向量替代待检测图片,便于后续步骤的操作。
举例说明:将一个224×224×3的待检测图像输入到VGG16中后,待检测图像经过的操作步骤为:步骤1、服务器对224×224×3的待检测图像经64个3×3的卷积核作两次第一卷积计算,经第一卷积计算后对应的待检测图像的尺寸变为224×224×64;步骤2、服务器对第一卷积计算后对应的待检测图像进行第一最大池化,第一最大池化单元的尺寸为2×2(效果为图像尺寸减半),经第一最大池化后得到的待检测图像的第一卷积特征图的尺寸变为112×112×64;步骤3、服务器对第一卷积特征图经128个3×3的卷积核作两次第二卷积计算,经第二卷积计算后对应的待检测图像的尺寸变为112×112×128;步骤4、服务器对第二卷积计算后对应的待检测图像进行单元尺寸为2×2的第二最大池化,经第二最大池化后得到的待检测图像的第二卷积特征图的尺寸变为56×56×128;步骤5、服务器对第二卷积特征图经256个3×3的卷积核作两次第三卷积计算,经第三卷积计算后对应的待检测图像的尺寸变为56×56×256;步骤6、服务器对第三卷积计算后对应的待检测图像进行单元尺寸为2×2的第三最大池化,经第三最大池化后得到的待检测图像的第三卷积特征图的尺寸变为28×28×256;步骤7、服务器对第三卷积特征图经512个3×3的卷积核作两次第四卷积计算,经第四卷积计算后对应的待检测图像的尺寸变为28×28×512;步骤8、服务器对第四卷积计算后对应的待检测图像进行单元尺寸为2×2的第四最大池化,经第四最大池化后得到的待检测图像的第四卷积特征图的尺寸变为14×14×512;步骤9、服务器对第四卷积特征图经512个3×3的卷积核作两次第五卷积计算,经第五卷积计算后对应的待检测图像的尺寸变为14×14×512;步骤10、服务器对第五卷积计算后对应的待检测图像进行单元尺寸为2×2的第五最大池化,经第五最大池化后得到的待检测图像的第五卷积特征图的尺寸变为7×7×512;步骤11、服务器将第五卷积特征图输入到两层1×1×4096及一层1×1×1000的全连接层中,并采用线性整流函数ReLU对第五卷积特征图进行修正,得到待检测图像的待检测特征向量。
203、采用卷积神经网络计算多个待检测特征向量的基础特征值,得到多个基础特征值;
待服务器计算出多个待检测图像对应的多个待检测特征向量之后,服务器需要通过卷积神经网络计算出多个待检测特征向量的基础特征值,这里的卷积神经网络是VGG16中的卷积神经网络,利用VGG16的卷积神经网络能够快速及有效的计算出待检测特征向量的基础特征值。由卷积神经网络计算待检测特征向量的基础特征值的部分代码如下:
for each in classes:
print("Starting{}images".format(each))
class_path=data_dir+each
files=os.listdir(class_path)
for ii,file in enumerate(files,1):
204、通过多个基础特征值以及预置的分类函数,计算每个待检测特征向量对应的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应;
服务器采用预置的分类函数分别计算多个基础特征值中目标基础特征值与多个预置类别特征值之间的相似匹配值,得到多个相似匹配值;服务器在多个相似匹配值中选取数值最大的目标相似匹配值,将计算目标相似匹配度的预置类别特征值所对应的标准类别标签确定为目标基础特征值的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应。
这里的预置的分类函数指的是softmax函数,softmax分类函数可以理解为归一化,通过softmax分类函数可以计算出基础特征值分别与多个预置类别特征值之间的相似匹配值,将相似匹配值的数值最大对应预置类别特征值所对应的类别标签确定为该待检测特征向量的类别标签,且每个类别标签与待检测图像一一对应。此外,服务器在计算类别标签后会将类别标签单独存放在标签数组中,便于服务器的后续操作。
例如:已知待检测特征向量的基础特征值A,预置类别特征值a、b、c、d,a所对应的标准类别标签a'为卡车,b所对应的标准类别标签b'为轿车,c所对应的标准类别标签c'为面包车,d所对应的标准类别标签d'为摩托车,通过预置的分类函数分别计算A与a、A与b、A与c、A与d之间的相似匹配值为0.9520、0.6059、0.4836、0.1281,则在这四个相似匹配值中选择相似匹配值的数值最大的0.9520作为目标相似匹配值,将计算目标相似匹配度的预置类别特征值a所对应的标准类别标签a'确定为目标基础特征值的类别标签,即基础特征值A对应的类别标签为a'卡车。
205、利用预置的迁移学习模型对多个类别标签进行训练,得到待检测图像的训练结果;
服务器首先采用数据集划分函数将多个类别标签进行划分,得到训练标签集、验证标签集及测试标签集;其次服务器配置预置的初始脚本的设置参数,得到配置后的初始脚本;服务器将训练标签集中的多个类别标签输入到配置后的初始脚本中,通过配置后的初始脚本对训练标签集中的多个类别标签进行训练,得到多个类别标签的待验证模型;服务器将验证标签集中的多个类别标签输入到待验证模型中,得到验证标签集中的多个类别标签对应的多个验证结果,计算多个验证结果的准确度,并判断多个验证结果的准确度是否大于标准预测准确度;若多个验证结果的准确度大于标准预测准确度,则服务器将待验证模型确定为待测试模型,将测试标签集中的多个类别标签输入到待测试模型中,得到测试标签集中的多个类别标签对应的多个测试结果,计算多个测试结果的准确度,并判断多个测试结果的准确度是否大于预期预测准确度;若待测试模型的准确度大于预期预测准确度,则服务器将待测试模型确定为迁移学习模型,将测试结果确定为待检测图像的训练结果。
服务器待计算得到每个待检测图像对应的类别标签后,就可以通过预置的迁移学习模型对多个待检测图像进行训练。在利用迁移学习模型进行训练时,必不可少的两个训练步骤就是验证和测试,因此在训练的过程中,服务器会对多个类别标签进行抽取并划分,使得有足够的数据进行训练、验证及测试,一般情况下,训练、验证及测试利用到的类别标签的最优数量比为8:1:1,也就是当选取1000个类别标签时,进行训练操作的类别标签数为800个,进行验证的类别标签数为100个,进行测试的类别标签数为100个。此外,多个类别标签的划分数量比还可以为7:2:1,在本申请中,并不对多个类别标签的划分数量比进行限定,具体的划分数量比可以根据实际的情况进行设定。
服务器在进行训练之前,需要配置预置的初始脚本(模型),配置预置的初始脚本的过程如下:服务器首先在预置的初始脚本输入基础特征值的维度以及类别标签的维度,得到基础脚本,一般情况下,基础特征值的维度为32,类别标签的维度为64;其次服务器在基础脚本中分别添加一个多维全连接层以及一个二维全连接层,得到候选脚本,在本申请中,添加的多维全连接层的维数为256维,因为输入待检测图像的维数为224×224×3,因此对应全连接层的维数为256。此外,因为服务器需要将待检测图片分为两类,所以另一全连接层的维数为2维;然后服务器计算候选脚本的交叉熵数值,并计算交叉熵数值的损失函数,将损失函数调入候选脚本中,最后服务器通过函数优化器对交叉熵数值的损失函数进行优化,得到配置后的初始脚本,在本申请中,利用到的函数优化器为自适应矩估计优化器(adaptive moment estimation optimizer,AdamOptimizer)。配置初始脚本的部分代码如下:
inputs_=tf.placeholder(tf.float32,shape=[None,codes.shape[1]])
labels_=tf.placeholder(tf.int64,shape=[None,labels_vecs.shape[1]])
fc=tf.contrib.layers.fully_connected(inputs_,256)
logits=tf.contrib.layers.fully_connected(fc,labels_vecs.shape[1],activation_fn=None)
cross_entropy=tf.nn.softmax_cross_entropy_with_logits(labels=labels_,logits=logits)
cost=tf.reduce_mean(cross_entropy)
optimizer=tf.train.AdamOptimizer().minimize(cost)
predicted=tf.nn.softmax(logits)
服务器待配置好预置的初始脚本后,将训练标签集中的多个类别标签输入到初始脚本中,并对初始脚本进行训练,得到一个需要验证标签集进行验证的待验证模型,然后服务器利用验证标签集中的多个类别标签对待验证模型进行验证,将验证标签集中每个类别标签对应的基础特征值输入到待验证模型中,输出通过待验证模型计算的验证结果,并将该验证结果与已知的类别标签进行比对,判断多个验证结果的准确度是否大于标准预测准确度,这里的标准预测准确度一般设定为0.86,具体的标准预测准确度数值可以根据实际情况进行设定。若多个验证结果的准确度大于标准预测准确度,则服务器将待验证模型确定为待测试模型,服务器还需要将测试标签集中的多个类别标签输入到待测试模型中,进一步计算待测试模型的准确度,服务器判断待测试模型的准确度的判定方法与判定待验证模型的准确度的方法相似,将测试标签集中每个类别标签对应的基础特征值输入到待测试模型中,输出通过待测试模型计算的测试结果,并将该测试结果与已知的类别标签进行比对,判断多个测试结果的准确度是否大于预期预测准确度,这里的预期预测准确度一般设定为0.92,具体的预期预测准确度数值可以根据实际情况进行设定。若待测试模型的准确度大于预期预测准确度,则服务器将待测试模型确定为迁移学习模型,将测试结果确定为待检测图像的训练结果。
进一步说明的是,待检测图片的训练结果为两类,一类训练结果用于指示车辆停靠位置上停靠运输车辆,另一类训练结果用于指示车辆停靠位置上未停靠运输车辆。此外,待检测图片通过迁移学习模型得到的测试结果是利用超文本5.0(HTML5)记录的结果。
206、获取目标待识别图像,采用预置深度学习网络解析目标待识别图像,得到目标待确认结果,将目标待确认结果与待检测图像的训练结果进行比对,得到目标待识别图像的目标识别结果,其中,目标识别结果包括第一识别结果与第二识别结果,第一识别结果用于指示车辆停靠位置上已停靠运输车辆,第二识别结果用于指示车辆停靠位置上未停靠运输车辆。
服务器获取目标待识别图像,目标待识别图像指的是需要识别出某个车辆停靠位置上是否停靠运输车辆的图像,该目标待识别图像是停车场中某个位置上的摄像设备捕获的,本申请中,并不对目标待识别图像的拍摄角度进行限定。在获取到目标待识别图像后,利用预置深度学习网络对目标待识别图像进行解析,这里的预置深度学习网络指的是VGG16,将244×244×3维的目标待检测图像输入到VGG16后,经过一系列的卷积神经网络和池化网络处理之后,输出一个4096维目标待检测特征向量,然后将目标待检测特征向量输入到3层全连接的神经网络处理,服务器通过softmax规范化得到目标待检测图像的目标待确认结果。再由服务器将目标待确认结果与通过迁移学习模型计算出来的训练结果进行比对,从而确定目标待识别图像的目标识别结果。
需要说明的是,在获取目标待识别图像时,服务器在预置时段内获取摄像设备中的待识别图像,例如,每30秒时间流内截取一次待识别图像,这样获取目标待识别图像的方式可以减少识别待识别图像的资源消耗。在进行目标待确认结果与训练结果的比对时,采用的是相似度检测算法,通过比对两者之间的相似度确定目标待确认结果为待检测图像的训练结果中的哪一个。
进一步说明的是,这里目标识别结果仅存在两类,第一类目标识别结果为第一识别结果,其中,第一识别结果用于指示车辆停靠位置上已停靠运输车辆,当运输车辆在指定时间内停靠在车辆停靠位置上时,说明运输车辆在指定时刻之前将货物运输到指定位置上,未影响货物运输的运输效率;第二类目标识别结果为第二识别结果,其中,第二识别结果用于指示车辆停靠位置上未停靠运输车辆,当运输车辆在指定时间内未停靠在车辆停靠位置上,说明运输车辆在指定时刻之内未将货物运输到指定位置上,影响货物运输的运输效率。此外,待检测图像的训练结果亦仅存在两类,待检测图像的训练结果与目标识别结果的存在结果相同。
本发明实施例中,利用VGG16与迁移学习模型对大量待检测图像进行训练,得到迁移学习模型,将目标待识别图像输入到迁移学习模型中,即可得到目标待识别图像中车辆停靠位置上是否有运输车辆存在的目标识别结果。通过建立迁移学习模型实现对目标待识别图像的识别,能够准确判断运输车辆是否停靠在停车场的指定位置上,达到实时监控运输车辆位置的效果,提高了运输车辆的监控效率。
上面对本发明实施例中运输车辆到站检测方法进行了描述,下面对本发明实施例中运输车辆到站检测装置进行描述,请参阅图3,本发明实施例中运输车辆到站检测装置一个实施例包括:
获取模块301,用于获取多个待检测图像,待检测图像用于显示车辆停靠位置上是否停靠运输车辆;卷积计算模块302,用于通过预置的特征提取器对每个待检测图像进行卷积计算,得到多个待检测图像对应的多个待检测特征向量;训练模块303,用于根据预置的分类函数确定每个待检测特征向量的类别标签,得到多个类别标签,并利用预置的迁移学习模型对多个类别标签进行训练,得到待检测图像的训练结果;比对模块304,用于获取目标待识别图像,采用预置深度学习网络解析目标待识别图像,得到目标待确认结果,将目标待确认结果与待检测图像的训练结果进行比对,得到目标待识别图像的目标识别结果,其中,目标识别结果包括第一识别结果与第二识别结果,第一识别结果用于指示车辆停靠位置上已停靠运输车辆,第二识别结果用于指示车辆停靠位置上未停靠运输车辆。
本发明实施例中,利用VGG16与迁移学习模型对大量待检测图像进行训练,得到迁移学习模型,将目标待识别图像输入到迁移学习模型中,即可得到目标待识别图像中车辆停靠位置上是否有运输车辆存在的目标识别结果。通过建立迁移学习模型实现对目标待识别图像的识别,能够准确判断运输车辆是否停靠在停车场的指定位置上,达到实时监控运输车辆位置的效果,提高了运输车辆的监控效率。
请参阅图4,本发明实施例中运输车辆到站检测装置的另一个实施例包括:
获取模块301,用于获取多个待检测图像,待检测图像用于显示车辆停靠位置上是否停靠运输车辆;卷积计算模块302,用于通过预置的特征提取器对每个待检测图像进行卷积计算,得到多个待检测图像对应的多个待检测特征向量;训练模块303,用于根据预置的分类函数确定每个待检测特征向量的类别标签,得到多个类别标签,并利用预置的迁移学习模型对多个类别标签进行训练,得到待检测图像的训练结果;比对模块304,用于获取目标待识别图像,采用预置深度学习网络解析目标待识别图像,得到目标待确认结果,将目标待确认结果与待检测图像的训练结果进行比对,得到目标待识别图像的目标识别结果,其中,目标识别结果包括第一识别结果与第二识别结果,第一识别结果用于指示车辆停靠位置上已停靠运输车辆,第二识别结果用于指示车辆停靠位置上未停靠运输车辆。
可选的,训练模块303包括:第一计算单元3031,用于采用卷积神经网络计算多个待检测特征向量的基础特征值,得到多个基础特征值;第二计算单元3032,用于通过多个基础特征值以及预置的分类函数,计算每个待检测特征向量对应的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应;训练单元3033,用于利用预置的迁移学习模型对多个类别标签进行训练,得到待检测图像的训练结果。
可选的,第二计算单元3032还可以具体用于:采用预置的分类函数分别计算多个基础特征值中目标基础特征值与多个预置类别特征值之间的相似匹配值,得到多个相似匹配值;在多个相似匹配值中选取数值最大的目标相似匹配值,将计算目标相似匹配度的预置类别特征值所对应的标准类别标签确定为目标基础特征值的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应。
可选的,训练单元3033包括:划分子单元30331,用于采用数据集划分函数将多个类别标签进行划分,得到训练标签集、验证标签集及测试标签集;配置子单元30332,用于配置预置的初始脚本的设置参数,得到配置后的初始脚本;训练子单元30333,用于将训练标签集中的多个类别标签输入到配置后的初始脚本中,通过配置后的初始脚本对训练标签集中的多个类别标签进行训练,得到多个类别标签的待验证模型;验证子单元30334,用于将验证标签集中的多个类别标签输入到待验证模型中,得到验证标签集中的多个类别标签对应的多个验证结果,计算多个验证结果的准确度,并判断多个验证结果的准确度是否大于标准预测准确度;测试子单元30335,若多个验证结果的准确度大于标准预测准确度,则用于将待验证模型确定为待测试模型,将测试标签集中的多个类别标签输入到待测试模型中,得到测试标签集中的多个类别标签对应的多个测试结果,计算多个测试结果的准确度,并判断多个测试结果的准确度是否大于预期预测准确度;确定子单元30336,若待测试模型的准确度大于预期预测准确度,则用于将待测试模型确定为迁移学习模型,将测试结果确定为待检测图像的训练结果。
可选的,配置子单元30332还可以具体用于:在预置的初始脚本输入基础特征值的维度以及类别标签的维度,得到基础脚本;在基础脚本中分别添加一个多维全连接层以及一个二维全连接层,得到候选脚本;计算候选脚本的交叉熵数值,并计算交叉熵数值的损失函数,通过函数优化器对交叉熵数值的损失函数进行优化,得到配置后的初始脚本。
可选的,卷积计算模块302还可以具体用于:在预置的特征提取器中,将多个待检测图像输入到第一卷积层中,分别对每个待检测图像依次做第一卷积计算以及第一最大化池化,得到多个第一卷积特征图;将多个第一卷积特征图输入第二卷积层中,分别对每个第一卷积特征图依次做第二卷积计算以及第二最大化池化,得到多个第二卷积特征图;将多个第二卷积特征图输入第三卷积层中,分别对每个第二卷积特征图依次做第三卷积计算以及第三最大化池化,得到多个第三卷积特征图;将多个第三卷积特征图输入第四卷积层中,分别对每个第三卷积特征图依次做第四卷积计算以及第四最大化池化,得到多个第四卷积特征图;将多个第四卷积特征图输入第五卷积层中,分别对每个第四卷积特征图依次做第五卷积计算以及第五最大化池化,得到多个第五卷积特征图;将多个第五卷积特征图输入全连接层中,采用线性整流函数分别对每个第五卷积特征图进行修正,将每个修正后的第五卷积特征图作为待检测特征向量,得到多个待检测特征向量。
本发明实施例中,利用VGG16与迁移学习模型对大量待检测图像进行训练,得到迁移学习模型,将目标待识别图像输入到迁移学习模型中,即可得到目标待识别图像中车辆停靠位置上是否有运输车辆存在的目标识别结果。通过建立迁移学习模型实现对目标待识别图像的识别,能够准确判断运输车辆是否停靠在停车场的指定位置上,达到实时监控运输车辆位置的效果,提高了运输车辆的监控效率。
上面图3和图4从模块化功能实体的角度对本发明实施例中的运输车辆到站检测装置进行详细描述,下面从硬件处理的角度对本发明实施例中运输车辆到站检测设备进行详细描述。
图5是本发明实施例提供的一种运输车辆到站检测设备的结构示意图,该运输车辆到站检测设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对运输车辆到站检测设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在运输车辆到站检测设备500上执行存储介质530中的一系列指令操作。
运输车辆到站检测设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的运输车辆到站检测设备结构并不构成对运输车辆到站检测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述运输车辆到站检测方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种运输车辆到站检测方法,其特征在于,所述运输车辆到站检测方法包括:
获取多个待检测图像,所述待检测图像用于显示车辆停靠位置上是否停靠运输车辆;
通过预置的特征提取器对每个待检测图像进行卷积计算,得到所述多个待检测图像对应的多个待检测特征向量;
根据预置的分类函数确定每个待检测特征向量的类别标签,得到多个类别标签,并利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果;
获取目标待识别图像,采用预置深度学习网络解析所述目标待识别图像,得到目标待确认结果,将所述目标待确认结果与所述待检测图像的训练结果进行比对,得到目标待识别图像的目标识别结果,其中,所述目标识别结果包括第一识别结果与第二识别结果,所述第一识别结果用于指示车辆停靠位置上已停靠运输车辆,所述第二识别结果用于指示车辆停靠位置上未停靠运输车辆。
2.根据权利要求1所述的运输车辆到站检测方法,其特征在于,所述根据预置的分类函数确定每个待检测特征向量的类别标签,得到多个类别标签,并利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果包括:
采用卷积神经网络计算所述多个待检测特征向量的基础特征值,得到多个基础特征值;
通过所述多个基础特征值以及预置的分类函数,计算每个待检测特征向量对应的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应;
利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果。
3.根据权利要求2所述的运输车辆到站检测方法,其特征在于,所述通过所述多个基础特征值以及预置的分类函数,计算每个待检测特征向量对应的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应包括:
采用预置的分类函数分别计算所述多个基础特征值中目标基础特征值与多个预置类别特征值之间的相似匹配值,得到多个相似匹配值;
在所述多个相似匹配值中选取数值最大的目标相似匹配值,将计算所述目标相似匹配度的预置类别特征值所对应的标准类别标签确定为目标基础特征值的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应。
4.根据权利要求2所述的运输车辆到站检测方法,其特征在于,所述利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果包括:
采用数据集划分函数将多个类别标签进行划分,得到训练标签集、验证标签集及测试标签集;
配置预置的初始脚本的设置参数,得到配置后的初始脚本;
将所述训练标签集中的多个类别标签输入到所述配置后的初始脚本中,通过所述配置后的初始脚本对所述训练标签集中的多个类别标签进行训练,得到所述多个类别标签的待验证模型;
将所述验证标签集中的多个类别标签输入到所述待验证模型中,得到所述验证标签集中的多个类别标签对应的多个验证结果,计算所述多个验证结果的准确度,并判断所述多个验证结果的准确度是否大于标准预测准确度;
若所述多个验证结果的准确度大于标准预测准确度,则将所述待验证模型确定为待测试模型,将所述测试标签集中的多个类别标签输入到所述待测试模型中,得到所述测试标签集中的多个类别标签对应的多个测试结果,计算所述多个测试结果的准确度,并判断所述多个测试结果的准确度是否大于预期预测准确度;
若所述待测试模型的准确度大于预期预测准确度,则将所述待测试模型确定为迁移学习模型,将所述测试结果确定为待检测图像的训练结果。
5.根据权利要求4所述的方法,其特征在于,在配置预置的初始脚本的设置参数,得到配置后的初始脚本包括:
在预置的初始脚本输入基础特征值的维度以及类别标签的维度,得到基础脚本;
在所述基础脚本中分别添加一个多维全连接层以及一个二维全连接层,得到候选脚本;
计算所述候选脚本的交叉熵数值,并计算所述交叉熵数值的损失函数,通过函数优化器对所述交叉熵数值的损失函数进行优化,得到配置后的初始脚本。
6.根据权利要求1-5中任一项所述的运输车辆到站检测方法,其特征在于,所述通过预置的特征提取器对每个待检测图像进行卷积计算,得到所述多个待检测图像对应的多个待检测特征向量包括:
在预置的特征提取器中,将所述多个待检测图像输入到第一卷积层中,分别对每个待检测图像依次做第一卷积计算以及第一最大化池化,得到多个第一卷积特征图;
将所述多个第一卷积特征图输入第二卷积层中,分别对每个第一卷积特征图依次做第二卷积计算以及第二最大化池化,得到多个第二卷积特征图;
将所述多个第二卷积特征图输入第三卷积层中,分别对每个第二卷积特征图依次做第三卷积计算以及第三最大化池化,得到多个第三卷积特征图;
将所述多个第三卷积特征图输入第四卷积层中,分别对每个第三卷积特征图依次做第四卷积计算以及第四最大化池化,得到多个第四卷积特征图;
将所述多个第四卷积特征图输入第五卷积层中,分别对每个第四卷积特征图依次做第五卷积计算以及第五最大化池化,得到多个第五卷积特征图;
将多个第五卷积特征图输入全连接层中,采用线性整流函数分别对每个第五卷积特征图进行修正,将每个修正后的第五卷积特征图作为待检测特征向量,得到多个待检测特征向量。
7.一种运输车辆到站检测装置,其特征在于,所述运输车辆到站检测装置包括:
获取模块,用于获取多个待检测图像,所述待检测图像用于显示车辆停靠位置上是否停靠运输车辆;
卷积计算模块,用于通过预置的特征提取器对每个待检测图像进行卷积计算,得到所述多个待检测图像对应的多个待检测特征向量;
训练模块,用于根据预置的分类函数确定每个待检测特征向量的类别标签,得到多个类别标签,并利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果;
比对模块,用于获取目标待识别图像,采用预置深度学习网络解析所述目标待识别图像,得到目标待确认结果,将所述目标待确认结果与所述待检测图像的训练结果进行比对,得到目标待识别图像的目标识别结果,其中,所述目标识别结果包括第一识别结果与第二识别结果,所述第一识别结果用于指示车辆停靠位置上已停靠运输车辆,所述第二识别结果用于指示车辆停靠位置上未停靠运输车辆。
8.根据权利要求7所述的运输车辆到站检测装置,其特征在于,所述训练模块包括:
第一计算单元,用于采用卷积神经网络计算所述多个待检测特征向量的基础特征值,得到多个基础特征值;
第二计算单元,用于通过所述多个基础特征值以及预置的分类函数,计算每个待检测特征向量对应的类别标签,得到多个类别标签,其中,每个类别标签与待检测图像一一对应;
训练单元,用于利用预置的迁移学习模型对所述多个类别标签进行训练,得到待检测图像的训练结果。
9.一种运输车辆到站检测设备,其特征在于,所述运输车辆到站检测设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述运输车辆到站检测设备执行如权利要求1-6中任意一项所述的运输车辆到站检测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述运输车辆到站检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010462723.9A CN111666848B (zh) | 2020-05-27 | 2020-05-27 | 运输车辆到站检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010462723.9A CN111666848B (zh) | 2020-05-27 | 2020-05-27 | 运输车辆到站检测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111666848A true CN111666848A (zh) | 2020-09-15 |
CN111666848B CN111666848B (zh) | 2023-04-18 |
Family
ID=72384937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010462723.9A Active CN111666848B (zh) | 2020-05-27 | 2020-05-27 | 运输车辆到站检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111666848B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613363A (zh) * | 2020-12-11 | 2021-04-06 | 浙江大华技术股份有限公司 | 一种车辆图像划分的方法、装置及存储介质 |
CN112990536A (zh) * | 2021-01-27 | 2021-06-18 | 广东工业大学 | 一种基于分位数卷积网络的公交到站时间预测方法 |
CN113821674A (zh) * | 2021-11-23 | 2021-12-21 | 北京中超伟业信息安全技术股份有限公司 | 一种基于孪生神经网络的智能货物监管方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170140253A1 (en) * | 2015-11-12 | 2017-05-18 | Xerox Corporation | Multi-layer fusion in a convolutional neural network for image classification |
US20180260621A1 (en) * | 2017-03-10 | 2018-09-13 | Baidu Online Network Technology (Beijing) Co., Ltd. | Picture recognition method and apparatus, computer device and computer- readable medium |
CN110889428A (zh) * | 2019-10-21 | 2020-03-17 | 浙江大搜车软件技术有限公司 | 图像识别方法、装置、计算机设备与存储介质 |
-
2020
- 2020-05-27 CN CN202010462723.9A patent/CN111666848B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170140253A1 (en) * | 2015-11-12 | 2017-05-18 | Xerox Corporation | Multi-layer fusion in a convolutional neural network for image classification |
US20180260621A1 (en) * | 2017-03-10 | 2018-09-13 | Baidu Online Network Technology (Beijing) Co., Ltd. | Picture recognition method and apparatus, computer device and computer- readable medium |
CN110889428A (zh) * | 2019-10-21 | 2020-03-17 | 浙江大搜车软件技术有限公司 | 图像识别方法、装置、计算机设备与存储介质 |
Non-Patent Citations (1)
Title |
---|
田佳鹭;邓立国;: "基于改进VGG16的猴子图像分类方法" * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613363A (zh) * | 2020-12-11 | 2021-04-06 | 浙江大华技术股份有限公司 | 一种车辆图像划分的方法、装置及存储介质 |
CN112613363B (zh) * | 2020-12-11 | 2024-04-05 | 浙江大华技术股份有限公司 | 一种车辆图像划分的方法、装置及存储介质 |
CN112990536A (zh) * | 2021-01-27 | 2021-06-18 | 广东工业大学 | 一种基于分位数卷积网络的公交到站时间预测方法 |
CN112990536B (zh) * | 2021-01-27 | 2022-06-03 | 广东工业大学 | 一种基于分位数卷积网络的公交到站时间预测方法 |
CN113821674A (zh) * | 2021-11-23 | 2021-12-21 | 北京中超伟业信息安全技术股份有限公司 | 一种基于孪生神经网络的智能货物监管方法及系统 |
CN113821674B (zh) * | 2021-11-23 | 2022-02-25 | 北京中超伟业信息安全技术股份有限公司 | 一种基于孪生神经网络的智能货物监管方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111666848B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111666848B (zh) | 运输车辆到站检测方法、装置、设备及存储介质 | |
CN111310645B (zh) | 货物堆积量的溢仓预警方法、装置、设备及存储介质 | |
CN109165623B (zh) | 基于深度学习的水稻病斑检测方法及系统 | |
CN107273832B (zh) | 基于积分通道特征与卷积神经网络的车牌识别方法及系统 | |
EP2648159A1 (en) | Object detecting method and object detecting device using same | |
CN110969166A (zh) | 一种巡检场景下小目标识别方法和系统 | |
CN104036284A (zh) | 基于Adaboost算法的多尺度行人检测方法 | |
CN111274926B (zh) | 图像数据筛选方法、装置、计算机设备和存储介质 | |
CN111311540A (zh) | 车辆定损方法、装置、计算机设备和存储介质 | |
CN110780965B (zh) | 基于视觉的流程自动化方法、设备及可读存储介质 | |
CN110245554B (zh) | 一种行人运动趋势的预警的方法、系统平台及存储介质 | |
CN115343676B (zh) | 密封电子设备内部多余物定位技术的特征优化方法 | |
Li et al. | Robust vehicle detection in high-resolution aerial images with imbalanced data | |
CN111767915A (zh) | 车牌检测方法、装置、设备及存储介质 | |
CN111091551A (zh) | 一种铁路货车制动梁支柱开口销丢失故障检测方法 | |
EP2860661A1 (en) | Mean shift tracking method | |
CN114494161A (zh) | 基于图像对比的受电弓异物检测方法、设备及存储介质 | |
CN111626578A (zh) | 物流货车的调配方法、装置、设备及存储介质 | |
Soon et al. | Malaysian car number plate detection and recognition system | |
CN112215222A (zh) | 车牌识别方法、装置、设备及存储介质 | |
CN116189286A (zh) | 一种视频图像暴力行为检测模型及检测方法 | |
US11887396B2 (en) | Method for identifying a hand pose in a vehicle | |
KR101503398B1 (ko) | 이동물체 분류장치 및 분류방법 | |
KR20170104756A (ko) | 국부지역별 크기 특정 차량 분류 방법 및 이를 이용한 차량검출방법 | |
US20240046625A1 (en) | De-biasing datasets for machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |