CN106780727B - 一种车头检测模型重建方法及装置 - Google Patents
一种车头检测模型重建方法及装置 Download PDFInfo
- Publication number
- CN106780727B CN106780727B CN201611226498.9A CN201611226498A CN106780727B CN 106780727 B CN106780727 B CN 106780727B CN 201611226498 A CN201611226498 A CN 201611226498A CN 106780727 B CN106780727 B CN 106780727B
- Authority
- CN
- China
- Prior art keywords
- vector
- image
- target
- detection
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 310
- 238000000034 method Methods 0.000 title claims abstract description 118
- 239000013598 vector Substances 0.000 claims abstract description 525
- 238000012545 processing Methods 0.000 claims abstract description 172
- 230000003137 locomotive effect Effects 0.000 claims abstract description 124
- 230000009467 reduction Effects 0.000 claims abstract description 12
- 238000011176 pooling Methods 0.000 claims description 128
- 230000008569 process Effects 0.000 claims description 67
- 238000002372 labelling Methods 0.000 claims description 33
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000004927 fusion Effects 0.000 claims description 8
- 230000005764 inhibitory process Effects 0.000 claims description 8
- 238000013527 convolutional neural network Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000945 filler Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/48—Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/584—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种车头检测模型重建方法及装置,用于提高车头区域检测的准确性。该重建方法包括:(1)获取至少一个第一车头图像,并将至少一个第一车头图像进行缩小处理得到对应的至少一个第二车头图像;(2)确定第一目标车头图像和第二目标车头图像;(3)按照第一模型的网络参数对第二目标车头图像进行图像检测得到检测向量;(4)确定检测向量与参考向量的向量参数差异;(5)判断向量参数差异是否满足预设条件;(6)若是,则调整第一模型的网络参数得到目标模型,若否,则调整第一模型的网络参数得到第二模型,将第二模型的网络参数作为第一模型的网络参数并重复执行步骤(2)至步骤(6)。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种车头检测模型重建方法及装置。
背景技术
随着现代交通技术以及经济的快速发展,汽车已经成为人们日常生活中一种重要的交通工具,这必然对交通管理有一个更高的要求,而随着对城市交通管理、高速公路收费、停车场管理等的自动化,车牌识别技术的研究成为一个非常重要的发展方向。
车牌是车辆的唯一身份标识,车牌识别技术(Vehicle License PlateRecognition,VLPR)是指能够检测到受监控路面的车辆并自动提取车辆牌照信息(含汉字字符、英文字母、阿拉伯数字及号牌颜色)进行处理的技术,该技术可以在汽车不做任何改动的情况下,实现对汽车身份的自动登记及验证,作为现代智能交通系统中的重要组成部分之一,对于维护交通安全和城市治安,防止交通堵塞,实现交通自动化管理有着现实的意义。
目前,车牌识别设备已广泛应用于停车场、高速公路、城市道路等区域进行车牌抓拍及识别。其中,车牌识别率随着图像识别算法及摄像机分辨率、宽动态、对比度等性能的提升,已经达到98%以上的指标。然而,伴随着类似车牌污损、车牌识别区域受曝光及背光的影响,在短期内以提升车牌识别率来进一步满足市场更快更准确的识别率需求较难以实现。同时,当前卡口场景下的车牌识别无法解决无牌车的快速通行和自动收费的问题,但在这个背景下,通过车型识别,提供汽车辅助信息联合判断停车场环境下的车辆通行条件,将增加通行的流畅性和用户体验。
车型识别包括检测和识别两个部分,一般来说,车头区域检测的准确性决定了车型识别结果的对错。在传统的车头检测方法中,主要是人为选取特征实现车头的检测,该方法可以通过训练图像目标区域人为选择的特征,获得对目标区域的识别能力,再通过级联、滑窗或目标候选区域随机选择的方式对待识别区域,并进行一一识别排除过滤,最后可以通过识别图像目标区域的真伪判断是否为待检测目标,达到检测的目的。然而,传统的车头检测方法无法表征更多不同场景及环境下的特征形态,对人为选择的特征具有较大的依赖性,且存在拟合效果不佳,检测速度过慢的问题。
因此,有必要提供一种方法,以解决上述传统的车头检测方法中出现的问题。
发明内容
本发明实施例提供了一种车头检测模型重建方法及装置,通过自学习特征的方式拟合不同场景下各种角度及尺度的车头图像,可以提高车头检测尺度及角度的鲁棒性,还可以提高车头检测的检测速度和效率。
本发明第一方面提供一种车头检测模型重建方法,可包括:
(1)获取至少一个第一车头图像,并将至少一个第一车头图像进行缩小处理,得到对应的至少一个第二车头图像;
(2)确定第一目标车头图像和第二目标车头图像,第二目标车头图像为至少一个第二车头图像中的任意一个,第一目标车头图像为至少一个第一车头图像中与第二目标车头图像对应的一个;
(3)按照第一模型的网络参数对第二目标车头图像进行图像检测,得到第二目标车头图像的检测向量;
(4)确定检测向量与参考向量的向量参数差异,参考向量为第二目标车头图像基于第一目标车头图像的标注结果进行获取得到,参考向量与检测向量的维度相同;
(5)判断向量参数差异是否满足预设条件;
(6)若是,则根据向量参数差异调整第一模型的网络参数,得到目标模型,若否,则根据向量参数差异调整第一模型的网络参数,得到第二模型,将第二模型的网络参数作为第一模型的网络参数并重复执行步骤(2)至步骤 (6)。
进一步地,判断向量参数差异是否满足预设条件包括:
判断向量参数差异是否小于第一阈值;或,
判断向量参数差异是否小于第一阈值,且判断向量参数差异小于第一阈值的次数是否大于第二阈值;或,
判断向量参数差异的确定次数是否为第一预设次数的倍数。
进一步地,判断向量参数差异的确定次数是否为第一预设次数的倍数包括:
判断向量参数差异的确定次数是否为第一预设次数的倍数,且判断确定次数的向量参数差异的加权计算值是否小于第一阈值。
进一步地,在获取至少一个第一车头图像,并将至少一个第一车头图像进行缩小处理,得到对应的至少一个第二车头图像之前,该方法还包括:
对至少一个第一车头图像进行灰度处理。
进一步地,网络参数包括卷积层参数、池化层参数、全连接层参数;
卷积层参数以及池化层参数均为一个或以上,按照第一模型的网络参数对第二目标车头图像进行图像检测,得到第二目标车头图像的检测向量包括:
按照第一卷积层参数以及第二池化层参数对第一目标车头图像进行一次目标处理,得到第一处理图像,目标处理包括卷积处理和池化处理,卷积处理用于得到第一图像,池化处理用于得到第二图像,第一图像的像素尺寸为第二图像的像素尺寸的预设倍数;
按照第二卷积层参数以及第二池化层参数将第一处理图像进行K次目标处理,得到第二处理图像,K为自然数;
按照全连接层参数将第二处理图像进行全连接层处理,得到第二目标车头图像的检测向量。
进一步地,向量参数差异为向量参数方差值,根据向量参数差异调整第一模型的网络参数包括:
根据向量参数方差值调整第一模型中卷积层的卷积核参数;
根据向量参数方差值调整第一模型中卷积层的卷积核参数包括:
在利用向量参数方差值确定第N层池化层的向量损失后,根据第N层池化层的向量损失确定第N层卷积层的向量损失,并根据第N层卷积层的像素损失调整第N层卷积层的卷积核参数,第一模型包括N层池化层和N层卷积层,N为大于零的整数;
根据第N-M层池化层的向量损失确定第N-M层卷积层的向量损失后,并根据第N-M层卷积层的向量损失确定第N-M-1层卷积层的卷积核损失,M为自然数。
进一步地,在确定检测向量与参考向量的向量参数差异之前,该方法还包括:
对第二目标车头图像进行划块处理,得到至少一个区域块;
获取至少一个区域块基于原始向量的第二预设次数的标注结果,得到第二目标车头图像的参考向量,原始向量为根据第一目标图像的标注结果得到。
进一步地,检测向量、参考向量、原始向量均包括目标位置的坐标参数、目标区域的尺寸参数;
检测向量、参考向量还包括车头参数或背景参数。
进一步地,该方法还包括:
获取待检测车头图像;
按照目标模型的网络参数对待检测车头图像进行图像检测,得到待检测车头图像的目标检测向量;
从目标检测向量中获取具有车头参数的第一检测向量;
将第一检测向量进行拟合处理,得到待检测车头图像中车头区域的坐标。
进一步地,在按照目标模型的网络参数对待检测车头图像进行图像检测,得到待检测车头图像的目标检测向量之前,该方法还包括:
对待检测车头图像进行灰度处理。
进一步地,从目标检测向量中获取具有车头参数的第一检测向量包括:
获取目标检测向量的置信度;
从目标检测向量中获取置信度大于预设阈值的子目标检测向量为第一检测向量。
进一步地,拟合处理为最大非线性抑制融合。
进一步地,在将第一检测向量进行预设处理,得到车头图像中车头区域的坐标之后,方法还包括:
根据车头区域的坐标在待检测车头图像中确定车头区域图像。
本发明第二方面提供一种车头检测模型重建装置,可包括:
获取单元,用于执行:
(1)获取至少一个第一车头图像,并将至少一个第一车头图像进行缩小处理,得到对应的至少一个第二车头图像;
处理单元,用于执行:
(2)确定第一目标车头图像和第二目标车头图像,第二目标车头图像为至少一个第二车头图像中的任意一个,第一目标车头图像为至少一个第一车头图像中与第二目标车头图像对应的一个;
(3)按照第一模型的网络参数对第二目标车头图像进行图像检测,得到第二目标车头图像的检测向量;
(4)确定检测向量与参考向量的向量参数差异,参考向量为第二目标车头图像基于第一目标车头图像的标注结果进行获取得到,参考向量与检测向量的维度相同;
(5)判断向量参数差异是否满足预设条件;
(6)若是,则根据向量参数差异调整第一模型的网络参数,得到目标模型,若否,则根据向量参数差异调整第一模型的网络参数,得到第二模型,将第二模型的网络参数作为第一模型的网络参数并重复执行步骤(2)至步骤 (6)。
进一步地,处理单元,具体用于执行:
判断向量参数差异是否小于第一阈值;或,
判断向量参数差异是否小于第一阈值,且判断向量参数差异小于第一阈值的次数是否大于第二阈值;或,
判断向量参数差异的确定次数是否为第一预设次数的倍数。
进一步地,处理单元,还具体用于执行:
判断向量参数差异的确定次数是否为第一预设次数的倍数,且判断确定次数的向量参数差异的加权计算值是否小于第一阈值。
进一步地,获取单元,还具体用于执行:
对至少一个第一车头图像进行灰度处理。
进一步地,网络参数包括卷积层参数、池化层参数、全连接层参数;
卷积层参数以及池化层参数均为一个或以上,处理单元,具体用于执行:
按照第一卷积层参数以及第二池化层参数对第一目标车头图像进行一次目标处理,得到第一处理图像,目标处理包括卷积处理和池化处理,卷积处理用于得到第一图像,池化处理用于得到第二图像,第一图像的像素尺寸为第二图像的像素尺寸的预设倍数;
按照第二卷积层参数以及第二池化层参数将第一处理图像进行K次目标处理,得到第二处理图像,K为自然数;
按照全连接层参数将第二处理图像进行全连接层处理,得到第二目标车头图像的检测向量。
进一步地,向量参数差异为向量参数方差值,处理单元,具体用于执行:
根据向量参数方差值调整第一模型中卷积层的卷积核参数;
处理单元,具体用于执行:
在利用向量参数方差值确定第N层池化层的向量损失后,根据第N层池化层的向量损失确定第N层卷积层的向量损失,并根据第N层卷积层的像素损失调整第N层卷积层的卷积核参数,第一模型包括N层池化层和N层卷积层,N为大于零的整数;
根据第N-M层池化层的向量损失确定第N-M层卷积层的向量损失后,并根据第N-M层卷积层的向量损失确定第N-M-1层卷积层的卷积核损失,M为自然数。
进一步地,处理单元,还具体用于执行:
对第二目标车头图像进行划块处理,得到至少一个区域块;
获取至少一个区域块基于原始向量的第二预设次数的标注结果,得到第二目标车头图像的参考向量,原始向量为根据第一目标图像的标注结果得到。
进一步地,检测向量、参考向量、原始向量均包括目标位置的坐标参数、目标区域的尺寸参数;
检测向量、参考向量还包括车头参数或背景参数。
进一步地,获取单元,还具体用于执行:
获取待检测车头图像;
处理单元,还具体用于执行:
按照目标模型的网络参数对待检测车头图像进行图像检测,得到待检测车头图像的目标检测向量;
从目标检测向量中获取具有车头参数的第一检测向量;
将第一检测向量进行拟合处理,得到待检测车头图像中车头区域的坐标。
进一步地,获取单元,还具体用于执行:
对待检测车头图像进行灰度处理。
进一步地,处理单元,具体用于执行:
获取目标检测向量的置信度;
从目标检测向量中获取置信度大于预设阈值的子目标检测向量为第一检测向量。
进一步地,拟合处理为最大非线性抑制融合。
进一步地,处理单元,还具体用于执行:
根据车头区域的坐标在待检测车头图像中确定车头区域图像。
从以上技术方案可以看出,本发明实施例具有以下优点:
本实施例中,提供了一种车头检测模型重建方法,通过获取的至少一个第一车头图像进行相应的处理,可以不断对第一模型的网络参数进调整,以得到用于车头检测的较为精准的目标模型,该方法基于第一模型的网络参数,自学习的特征具有多样性,能够表征较多不同场景及环境下的特征形态,具有较好的拟合效果,检测效果较优,且在对应的车头检测方法中,可以直接对待检测车头图像进行相应的处理,有利于避免划窗、随机选择待识别区域等耗时重复的操作,可以加快车头检测的速度,实现车头检测的实时性。
附图说明
图1为本发明实施例中车头检测模型重建方法一个实施例示意图;
图2为本发明实施例中车头检测模型重建方法的图像检测示意图;
图3为本发明实施例中车头检测模型重建方法另一实施例示意图;
图4为本发明实施例中车头检测模型重建方法另一实施例示意图;
图5为本发明实施例中车头检测模型重建方法另一实施例示意图;
图6为本发明实施例中基于目标模型的车头检测方法一个实施例示意图;
图7为本发明实施例中基于目标模型的车头检测方法另一实施例示意图;
图8为本发明实施例中车头检测模型重建装置一个实施例示意图;
具体实施方式
本发明实施例提供了一种车头检测模型重建方法及装置,通过自学习特征的方式拟合不同场景下各种角度及尺度的车头图像,可以提高车头检测尺度及角度的鲁棒性,还可以提高车头检测的检测速度和效率。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例中的具体流程进行描述,请参阅图1,本发明实施例中车头检测模型重建方法一个实施例包括:
101、获取至少一个第一车头图像,并将至少一个第一车头图像进行缩小处理,得到对应的至少一个第二车头图像;
本实施例中,为了可以对待检测车头图像进行准确识别,可以利用大量的车头图像作为得到目标模型的训练集样本,选取的过程可以通过人工的方式进行选取,例如选取1万张清晰的不同车辆的车头图像,之后可以在大量的车头图像中获取至少一个第一车头图像,并可以将这至少一个第一车头图像进行缩小处理,得到对应的至少一个第二车头图像。
例如,假设收集了1万张清晰的车头图像,可以将这1万张清晰的车头图像作为第一车头图像,并可以依次进行缩小处理,如由像素尺寸1080*1080 缩小为像素尺寸224*224,得到对应的1万张第二车头图像。
具体的,在第一车头图像进行缩小处理前,可以对第一车头图像进行标注处理,作为得到目标模型的原始向量,即训练标签,原始向量可以包括目标位置的坐标参数以及目标区域的尺寸参数(4个参数,即4个维度)。第一车头图像的图像内容可以包括车头区域和背景区域,在标注过程中,可以对车头区域进行标注,具体的,可以标注车头区域的左上角的横纵坐标,以及车头区域的长、宽。则原始向量可以包括车头区域的左上角的横纵坐标参数,以及车头区域的长、宽参数。在实际应用中,每一个第一车头图像可以对应有与其名称对应的诸如txt文件,该txt文件中可以记录有车头个数以及原始向量。
可以理解的是,在一个第一车头图像中,可以包括一个车头区域,或一个以上的不同车辆的车头区域,那么对应的,若第一车头图像中只有一个车头区域,那么可以记录车头个数为1,且可以记录该车头区域对应的原始向量,具体可如下方式记录:车头1横坐标X、车头1纵坐标Y、车头1长度L、车头1宽度W。若第二车头图像中有N个不同车辆的车头区域,那么可以记录车头个数为N,且可以记录每一个车头区域对应的原始向量,具体可如下方式记录:车头1横坐标X、车头1纵坐标Y、车头1长度L、车头1宽度W;车头2横坐标X、车头2纵坐标Y、车头2长度L、车头2宽度W;车头N 横坐标X、车头N纵坐标Y、车头N长度L、车头2宽度W。其中,N为正整数。
可以理解的是,本实施例中,以车头区域的左上角的横纵坐标参数作为原始向量的部分参数仅为举例说明,以进一步获得车头区域的长、宽尺寸参数,在实际应用中,也可以记录车头区域的右上角的横纵坐标参数、或右下角等,具体此处不做限定。
102、确定第一目标车头图像和第二目标车头图像;
本实施例中,获取至少一个第一车头图像,并将至少一个第一车头图像进行缩小处理,得到对应的至少一个第二车头图像后,可以确定第一目标车头图像和第二目标车头图像。其中,第二目标车头图像可以为至少一个第二车头图像中的任意一个,第一目标车头图像可以为至少一个第一车头图像中与第二目标车头图像对应的一个。
具体的,在至少一个第二车头图像中,可以随机确定一个第二车头图像作为第二目标车头图像,并可以在至少一个第一车头图像中,选取与第二目标车头图像对应的一个第一车头图像作为第一目标车头图像。即第二目标车头图像由第一目标车头图像进行缩小处理得到。
可以理解的是,本实施例中的第一目标车头图像可以对应有原始向量记录于对应的txt文件中。
103、按照第一模型的网络参数对第二目标车头图像进行图像检测,得到第二目标车头图像的检测向量;
本实施例中,确定第一目标车头图像和第二目标车头图像后,可以按照第一模型的网络参数对第二目标车头图像进行图像检测,得到第二目标车头图像的检测向量。
具体的,第一模型即卷积神经网络,卷积神经网络可以包括有第一预设次数的卷积处理、第二预设次数的池化处理、第三预设次数的全连接层处理,其中,每一次卷积处理可以包括有预设数量的卷积层,每一个卷积层可以对应有第一预设大小的卷积核,每一次池化处理可以对应有第二预设大小的池化核。在实际应用中,可以将第二目标车头图像生成HDF5格式的数据用于训练第一模型,即卷积神经网络。本实施例中,可以将第二目标车头图像输入第一模型中,按照第一模型的网络参数对第二目标车头图像进行一次迭代操作,第二区域块进行诸如卷积处理、池化处理、全连接层处理的图像检测后,可以得到第二目标车头图像的检测向量。
可以理解的是,第二目标车头图像的检测向量的参数个数具体可以视图像检测过程中划分的区域块的设置而定,例如,将像素尺寸224*224的第二目标车头图像100个区域块进行图像检测,第二目标车头图像的检测向量的维度与100个区域块相关,且每一个区域块对应有相应的维度,即为子检测向量。
需要说明的是,本实施例中的第一预设次数、第二预设次数、第三预设次数、预设数量、第一预设大小以及第二预设次数大小可以根据需要进行设置,具体此处不做限定。
本实施例中,检测向量可以包括车头参数或背景参数、目标位置的坐标参数、目标区域的尺寸参数(5个参数,即5个维度)。即对于第二目标车头图像而言,每一个区域块若包括车头区域,则该区域块的检测结果可以包括车头参数、目标位置的坐标参数、目标区域的尺寸参数,若全部为背景区域,则该区域块的检测结果可以包括背景参数、目标位置的坐标参数、目标区域的尺寸参数。其中,目标位置可以为诸如车头区域的左上角的横纵坐标参数,目标区域可以以该左上角以及车头区域的右下角构成的方形区域,目标区域的尺寸参数则可以根据该左上角的横纵坐标参数、第一目标车头图像标注的原始向量以及第一目标车头图像与第二目标车头图像的缩小比例进行计算得到。在实际应用中,若区域块全部为背景区域,那么目标位置的坐标参数以及目标区域的尺寸参数可以为预设数值,如0,此处不做限定。
可以理解的是,检测向量中目标位置的坐标参数对应的目标位置除了上述说明的内容,在实际应用中,也可以是车头区域的其它位置,具体可根据原始向量中目标位置参数对应的目标位置而定,此处不做限定。
需要说明的是,本实施例中第二目标车头图像的检测向量,是卷积神经网络基于预设设置对第二目标车头图像进行自动检测、区域识别的结果,
104、确定检测向量与参考向量的向量参数差异;
本实施例中,按照第一模型的网络参数对第二区域块进行图像检测,得到第二目标车头图像的检测向量后,可以采用预设计算方式计算检测向量与参考向量的向量参数差异,从而可以确定检测向量与参考向量的向量参数差异。其中,参考向量可以为第二目标车头图像基于第一目标车头图像的标注结果进行获取得到,参考向量可以与检测向量的维度相同。
具体的,为了训练第一模型的识别准确度,可以对第二目标车头图像进行人为的标注处理,得到并记录第二目标车头图像的参考向量,以和第二目标车头图像的检测向量进行对比,不断调整地第一模型,使得获得的第二目标车头图像。与检测向量一样,参考向量也可以包括车头参数或背景参数、目标位置的坐标参数、目标区域的尺寸参数(5个参数,即5个维度)。本实施例中在确定检测向量与参考向量的向量参数差异之前,可以对第二目标车头图像按照如下方式进行处理:
对第二目标车头图像进行划块处理,得到至少一个区域块;
获取至少一个区域块基于原始向量的第二预设次数的标注结果,得到第二目标车头图像的参考向量,原始向量为根据第一目标图像的标注结果得到。
即第二目标车头图像可以划分为一个或以上的区域块,每一个区域块均可以进行人为的标注处理,得到一个标注结果,即子参考向量,所有区域块的标注结果的集合即为第二目标车头图像的参考向量。对于对一个区域块而言,若包括车头区域,则该区域块的标注结果可以包括车头参数、目标位置的坐标参数、目标区域的尺寸参数,若全部为背景区域,则该区域块的标注结果可以包括背景参数、目标位置的坐标参数、目标区域的尺寸参数。其中,目标位置可以为诸如车头区域的左上角的横纵坐标参数,目标区域可以以该左上角以及车头区域的右下角构成的方形区域,目标区域的尺寸参数则可以标注后根据该左上角的横纵坐标参数、第一目标车头图像标注的原始向量以及第一目标车头图像与第二目标车头图像的缩小比例进行计算得到。在实际应用中,若区域块全部为背景区域,那么目标位置的坐标参数以及目标区域的尺寸参数可以以预设数值进行标注并记录,如0,此处不做限定。
可以理解的是,本实施例中第二预设次数可以为一次或以上,以提高参考向量的判断基准,对应的,若可以获取第二目标车头图像的区域块的多次标注结果,则第二目标车头图像的划分区域块在第一模型中也应该对应相应的检测结果,以使得参考向量与检测向量的维度相同。例如,假设预设次数为2次,则一个区域块可以对应2次标注结果,可以得到10个对应参数,那么第二目标图像的每一个划分区域块也应该得到10个对应参数。
进一步的,得到第二目标参数的检测向量与参考向量后,可以将检测向量中的参数与参考向量的对应参数以预设计算方式进行计算,得到对应的向量参数差异。
105、判断向量参数差异是否满足预设条件,若是,则执行步骤106,若否,则执行步骤102;
本实施例中,确定检测向量与参考向量的向量参数差异后,可以判断向量参数差异是否满足预设条件。
可以理解的是,本实施例中的预设条件可以预先设置,可以是根据数据统计进行设置,也可以是用户自定义设置,具体此处不做限定。
106、根据向量参数差异调整第一模型的网络参数,得到目标模型。
本实施例中,若判断检测向量与参考向量的向量参数差异满足预设条件,则可以根据向量参数差异调整第一模型的网络参数,得到目标模型。
具体的,当检测向量与参考向量的向量参数差异满足预设条件时,说明第一模型的网络较为合适,将该第一模型用于车头检测中,车牌的识别率较高,但为了加强第一模型对车头的识别率,可以将确定的向量参数差异作为损失函数在卷积神经网络中进行反向传播而调整网络参数,并可以将网络参数得到调整后的第一模型作为目标模型,以在实际应用中实现对待检测车头图像的识别。
进一步的,本实施例中,若判断检测向量与参考向量的向量参数差异不满足预设条件,那么为了得到目标模型,也可以根据向量参数差异调整第一模型的网络参数得到第二模型后,将第二模型的网络参数作为第一模型的网络参数并重复执行步骤102至步骤106。可以理解的是,在重复执行步骤102 至步骤106的过程中,第一模型的网络参数可以不断得到调整,而第二目标车头图像不会在卷积神经网络中重复进行迭代操作,直到所有第二车头图像作为第二目标车头图像全部进行一次迭代操作后仍未获得目标模型的情况下才会重复,即在该情况下,第一目标车头图像和第二目标车头图像的确定是随机但不重复的。
可以理解的是,本实施例中,目标模型的确定方式基于预设条件的设立可以不同,下面以向量参数差异为向量参数方差值为例分别进行说明:
请参阅图2,本发明实施例中车头检测模型重建方法另一实施例包括:
201、对至少一个第一车头图像进行灰度处理;
本实施例中,为了可以对待检测车头图像进行准确识别,可以利用大量的车头图像作为得到目标模型的训练集样本,选取的过程可以通过人工的方式进行选取,例如选取1万张清晰的不同车辆的车头图像后,为了减少图像处理的计算量,之后可以在大量的车头图像中获选取至少一个第一车头图像,可以对该选取的至少一个第一图像进行灰度处理,使得第一图像可以为灰度图像。
例如,假设手机了1万张清晰的车头图像,则可以将这1万张清晰的车头图像作为第一车头图像,并可以对这1万张第一车头图像进行灰度处理,得到1万张灰度处理后的第一车头图像。
本实施例中的步骤202至步骤203与图1中的步骤101至步骤102相同,此处不再赘述。
204、按照第一模型的网络参数对第二目标车头图像进行图像检测,得到第二目标车头图像的检测向量;
本实施例中,确定第一目标车头图像和第二目标车头图像后,可以按照第一模型的网络参数对第二目标车头图像进行图像检测,得到第二目标车头图像的检测向量。
基于图1所示实施例中的步骤103说明的内容,本实施例中,对第二目标车头图像的图像检测过程进行如下的具体说明:
1、按照第一卷积层参数以及第二池化层参数对第一目标车头图像进行一次目标处理,得到第一处理图像,目标处理包括卷积处理和池化处理,卷积处理用于得到第一图像,池化处理用于得到第二图像,第一图像的像素尺寸为第二图像的像素尺寸的预设倍数;
2、按照第二卷积层参数以及第二池化层参数将第一处理图像进行K次目标处理,得到第二处理图像,K为自然数;
3、按照全连接层参数将第二处理图像进行全连接层处理,得到第二目标车头图像的检测向量。
具体的,第一模型,即卷积神经网络的网络参数可以包括卷积层参数、池化层参数、全连接层参数,且卷积层参数以及池化层参数均为一个或以上。其中,第二目标图像输入第一模型中依次进行一次卷积处理、一次池化处理后,可以得到第一处理图像,若第一模型包括一层以上的卷积层以及池化层,则第一处理图像可以根据卷积层以及池化层的个数,再次依次进行相应次数的卷积处理以及池化处理,得到第二处理图像,并可以将第二处理图像进行全连接层处理,得到第二目标车头图像的检测向量,若第一模型只包括一层卷积层以及一层池化层,则K为0,第一处理图像即为第二处理图像,可以将第一处理图像进行全连接层处理,得到第二目标车头图像的检测向量。
例如,假设第二目标车头图像为像素尺寸224*224的灰度图像,如图3 所示,可采用上述图像检测过程进行相应的处理:
1、在卷积神经网络中输入224*224的第二目标车头图像(输入图像),将第二目标车头图像进行第一层卷积处理,得到第一卷积处理结果(C1)。该第一层卷积处理可以由16个卷积层组成,每个卷积层的卷积核大小为3*3,通过在第二目标车头图像的左下左右各增添1个填充像素的方式,在第一层卷积处理后,可以输出16个224*224大小的输出图像;该16个224*224大小的输出图像为第一层池化处理的输入图像,经过第一层池化处理后,得到第一池化处理结果(P1)。第一层池化处理可以由16个池化层组成,每个池化层的池化核大小为2*2,采用Max Pooling的方式,可以输出16个112*112 大小的输出图像;
2、将输出的16个112*112大小的输出图像进行第二层卷积处理,得到第一卷积处理结果(C2)。该第二层卷积处理可以由16个卷积层组成,每个卷积层的卷积核大小为1*1,在第二层卷积处理后,可以输出16个112*112 大小的输出图像;该16个112*112大小的输出图像为第二层池化处理的输入图像,经过第二层池化处理后,得到第二池化处理结果(P2)。第二层池化处理可以由32个池化层组成,每个池化层的池化核大小为2*2,采用MaxPooling的方式,可以输出32个56*56大小的输出图像;
3、将输出的32个56*56大小的输出图像进行第三层卷积处理,得到第三卷积处理结果(C3),该第三层卷积处理可以由32个卷积层组成,每个卷积层的卷积核大小为3*3,通过在32个56*56大小的输出图像的左下左右各增添1个填充像素的方式,在第三层卷积处理后,可以输出32个56*56大小的输出图像;该32个56*56大小的输出图像为第三层池化处理的输入图像,经过第三层池化处理后,得到第三池化处理结果(P3)。第三层池化处理可以由32个池化层组成,每个池化层的池化核大小为2*2,采用Max Pooling 的方式,可以输出32个28*28大小的输出图像;
4、将输出的32个28*28大小的输出图像进行第四层卷积处理,得到第四卷积处理结果(C4)。该第四层卷积处理可以由32个卷积层组成,每个卷积层的卷积核大小为1*1,在第三层卷积处理后,可以输出32个28*28大小的输出图像;该32个28*28大小的输出图像为第四层池化处理的输入图像,经过第四层池化处理后,得到第四池化处理结果(P4)。第四层池化处理可以由32个池化层组成,每个池化层的池化核大小为2*2,采用Max Pooling 的方式,可以输出32个14*14大小的输出图像;
5、将输出的32个14*14大小的输出图像进行第三层卷积处理,得到第五卷积处理结果(C5),该第五层卷积处理可以由64个卷积层组成,每个卷积层的卷积核大小为3*3,通过在32个14*14大小的输出图像的左下左右各增添1个填充像素的方式,在第五层卷积处理后,可以输出64个14*14大小的输出图像;该64个14*14大小的输出图像为第五层池化处理的输入图像,经过第五层池化处理后,得到第五池化处理结果(P5)。第五层池化处理可以由64个池化层组成,每个池化层的池化核大小为2*2,采用Max Pooling 的方式,可以输出64个7*7大小的输出图像;
6、将64个7*7大小的输入图像进行全连接层处理,得到全连接层处理结果(FC),即可以得到1452*1的检测向量。其中,由于P5到FC的前向传播过程中,可以先将P5拉成一维的向量,由于P5输出64个7*7大小的图,所以拉成一维向量即为3136*1。P5到FC中间的网络参数个数为1452*3136 个,即1452*1的输出向量的每个值都由3136*1的向量卷积得来。
可以理解的是,在上述图像检测的过程中,增添填充像素的目的在于使得卷积处理时的输入图像以及输出图像保持相同像素尺寸,保留图像边缘信息的提取,防止图像信息的损失,具体填充像素的大小可根据卷积处理中卷积层的卷积核大小以及输入卷积层的图像的像素尺寸进行设置,具体此处不做限定。
本实施例中的部分内容与图1所示实施例中的步骤103说明的内容相同,此处不再赘述。
205、确定检测向量与参考向量的向量参数方差值;
本实施例中,按照第一模型的网络参数对第二区域块进行图像检测,得到第二目标车头图像的检测向量后,可以采用预设计算方式计算检测向量与参考向量的向量参数差异,从而可以确定检测向量与参考向量的向量参数差异。其中,参考向量可以为第二目标车头图像基于第一目标车头图像的标注结果进行获取得到,参考向量可以与检测向量的维度相同。
基于图1所示实施例中的步骤104以及本实施例中步骤204说明的内容,本实施例中,对参考向量的获取进行如下的举例说明:
将灰度处理后的第一车头图像缩小为诸如像素尺寸224*224的第二车头图像,并在第一车头图像以及第二车头图像中确定对应的第一目标车头图像和第二目标车头图像后,可以将第二目标车头图像划分为11*11的区域块,得到121个区域块,并可以以每个区域块为中心,进行两次人为的标注,则 121个区域块可以得到242个标注结果,每一个标注结果可以包括诸如车头参数或背景参数、车头区域的左上角的横纵坐标参数、车头区域的尺寸参数,将所有标注结果进行记录后,集合所有的标注结果可以得到1425*1的参考向量。其中,1452为11*11(5*2+2)的计算结果,11*11标识121个区域块, 5*2标识每个区域块进行两次标注,每一次标注可以记录5个参数,2表示类别种类(即车头和背景)。
可以理解的是,在实际应用中,类别种类还可以包括对人的识别,从而当类别种类包括人时,类别种类可以为3,那么得到的参考向量的参数个数会发生变化,同样的,第二目标车头图像的检测向量在图像检测后得到的检测向量的参数个数也会发生变化,此处不做限定。
具体的,得到第二目标车头图像的检测向量和参考向量后,可以计算检测向量和参考向量的向量参数差异,即向量参数方差值作为损失函数,在第一模型中,计算最后一层卷积处理中卷积层的损失(向量参数方差值)可以采用如下公式:
其中,表示第i个区域块的第j次标注,Xi表示检测向量中第i个区域块的目标位置的横坐标参数,Xi'表示参考向量中第i个区域块的横坐标参数,Yi表示检测向量中第i个区域块的目标位置的纵坐标参数,Yi'表示参考向量中第i个区域块的目标区域的纵坐标参数,Wi表示检测向量中第i个区域块的目标区域的宽,Wi'表示参考向量中第i个区域块的宽, Yi表示检测向量中第i个区域块的目标区域的长,Yi'表示参考向量中第i个区域块的目标区域的长。
进一步的,上述公式中的λcoord可以设置为5,增加对区域块的选择准确度的关注。可以理解的是,λcoord除了是5,还可以采用其它数值,可根据实际需要进行设置,此处不做限定。
206、判断向量参数方差值是否小于第一阈值,若是,则执行步骤207,若否,则执行步骤203;
本实施例中,确定检测向量与参考向量的向量参数方差值后,可以判断向量参数方差值是否小于第一阈值。
具体的,本实施例中,可以设置第一阈值,以作为第一模型的判断标准,在实际应用中,可以一次对一个第二目标车头图像在第一模型中进行迭代操作,在图像检测得到检测向量后,即可对检测向量与参考向量的向量参数方差值进行一次判断操作。
可以理解的是,本实施例中的第一阈值可以预先设置,可以是根据数据统计进行设置,也可以是用户自定义设置,具体此处不做限定。
207、根据向量参数方差值调整第一模型中卷积层的卷积核参数,得到目标模型。
本实施例中,若判断向量参数方差值小于第一阈值,则可以根据向量参数方差值调整第一模型中卷积层的卷积核参数,得到目标模型。
本实施例中,根据向量参数方差值调整第一模型中卷积层的卷积核参数的具体方式可以为:
在利用向量参数方差值确定第N层池化层的向量损失后,根据第N层池化层的向量损失确定第N层卷积层的向量损失,并根据第N层卷积层的像素损失调整第N层卷积层的卷积核参数,第一模型包括N层池化层和N层卷积层,N为大于零的整数;
根据第N-M层池化层的向量损失确定第N-M层卷积层的向量损失后,并根据第N-M层卷积层的向量损失确定第N-M-1层卷积层的卷积核损失,得到目标模型,M为自然数。
具体的,确定检测向量与参考向量的向量参数方差值后,可以利用该像向量参数方差值在第一模型中反向传播,由第一模型的最底层的池化处理一层一层向顶层的卷积处理传播,即根据向量参数方差值计算第一模型最后一层的池化处理中池化层的向量损失,以该向量损失计算倒数第二层的卷积层的向量损失,以该向量损失调整倒数第二层的卷积处理中卷积层的卷积核参数,同时,若N大于1,则倒数第二层的卷积处理中卷积层的向量损失可以用来确定倒数第三层的池化处理中池化层的向量损失,倒数第三层的池化处理中池化层的向量损失可以计算倒数第四层的卷积处理中卷积层的向量损失,且该向量损失则可以用来调整倒数第四层的卷积处理中卷积层的卷积核参数,以此类推,直到第一模型所有层的卷积处理中卷积层的卷积核参数得到调整后反向传播结束。
以图3为例对反向传播过程加以说明:FC输出的检测向量和参考向量,根据上述公式计算对应的向量损失(向量参数方差值)后,可以根据该向量参数方差值,计算第五层卷积处理中卷积层的向量损失。具体过程可如下说明:
1、反向传播的时候,第N层的向量损失可以由第N+1层的向量损失计算得到。由于第五层池化处理后不需要经过卷积处理,所以第五层池化处理中池化层的向量损失由FC全连接层处理得到的检测向量与参考向量的向量参数方差值计算。在实际应用中,第五层池化处理中池化处理没有权值参数,不需要进行权重调整,但反向传播过程必须经过第五层池化处理才能向顶层一层层传播;
2、第五层池化处理向第五层卷积处理的逆向传播过程中,由于第五层池化处理将输入图像的大小缩小了1倍,所以损失的向量维度也缩小了一倍,同时,将第五层池化处理中池化层的向量损失用于计算第五层卷积处理中卷积层的向量损失,根据第五层卷积处理中卷积层的向量损失,可以修改第五层卷积处理中3*3大小的卷积核的网络权重,且由于第五层卷积处理输出的图像即第五层池化处理输入的14*14大小的图像,那么可以由第五层池化处理得到的64个7*7的输出图像,进行反池化处理,得到64个14*14的输出图像,并可以对这64个14*14的输出图像进行像素填充,得到64个16*16 大小的图像,进而可以对64个16*16大小的图像进行14*14大小的卷积处理,得到64个3*3大小的卷积核权重调整差值,可以得到64个3*3大小的卷积核权重调整差值,利用该卷积核权重调整差值即可调整第五层卷积处理中卷积层的卷积核的值,由此得到第五层卷积处理中卷积层的卷积核的调整信息,而后可以依次对第四层、第三层、第二层、第一层卷积处理中卷积层的卷积核参数进行调整,其它层的反向传播过程类似。
基于上述说明,本实施例中,在调整第五层卷积处理中卷积层的卷积核的值时,可以设置卷积神经网络的学习速率,可以设置为诸如0.0001,学习速率的设置目的是为了防止卷积核参数调整的过快,陷入无限循环的震荡。可以理解的是,学习速率的数值不能设置的过小,不然增加陷入局部极小值的风险。
进一步的,本实施例中,若判断检测向量与参考向量的向量参数方差值不小于第一阈值,那么为了得到目标模型,也可以根据向量参数方差值调整第一模型中卷积层的卷积核参数得到第二模型后,将第二模型中卷积层的卷积核参数作为第一模型中卷积层的卷积核参数并重复执行步骤203至步骤 207。可以理解的是,在重复执行步骤203至步骤207的过程中,第一模型中卷积层的卷积核参数可以不断得到调整,而第二目标车头图像不会在卷积神经网络中重复进行迭代操作,直到所有第二车头图像作为第二目标车头图像全部进行一次迭代操作后仍未获得目标模型的情况下才会重复,即在该情况下,第一目标车头图像和第二目标车头图像的确定是随机但不重复的。
请参阅图4,本发明实施例中车头检测模型重建方法另一实施例包括:
本实施例中的步骤401至步骤405与图2所示实施例中的步骤201至步骤205相同,此处不再相同。
406、判断向量参数方差值是否小于第一阈值,若是,则执行步骤407,若否,则执行步骤403;
本实施例中,确定检测向量与参考向量的向量参数方差值后,可以判断向量参数方差值是否小于第一阈值。
具体的,本实施例中,可以设置第一阈值,以作为第一模型的判断标准,在实际应用中,可以一次对一个第二目标车头图像在第一模型中进行迭代操作,在图像检测得到检测向量后,即可对检测向量与参考向量的向量参数方差值进行一次判断操作。
可以理解的是,本实施例中的第一阈值可以预先设置,可以是根据数据统计进行设置,也可以是用户自定义设置,具体此处不做限定。
407、判断向量参数方差值小于第一阈值的次数是否大于第二阈值,若是,则执行步骤408,若否,则执行步骤403;
本实施中,若检测向量与参考向量的向量参数方差值小于第一阈值,可以进一步判断向量参数方差值小于第一阈值的次数是否大于第二阈值。
具体的,可以一次对一个第二目标车头图像在第一模型中进行迭代操作,在图像检测得到检测向量后,即可在检测向量与参考向量的向量参数方差值小于第一阈值的情况下,判断向量参数方差值小于第一阈值的次数是否大于第二阈值。例如,第二阈值为50次,前面在第一模型中进行了30次迭代操作,有25次迭代操作后确定的向量参数方差值小于第一阈值,当在第一模型中进行第31次迭代操作后,若第31次迭代操作后确定的向量参数方差值小于第一阈值,则意味着向量参数方差值小于第一阈值的次数为26次,进而可以判断基于第31次迭代操作的26次是否大于50次。
可以理解的是,本实施例中的第二阈值可以预先设置,可以是根据数据统计进行设置,也可以是用户自定义设置,具体此处不做限定。
本实施例中的步骤408与图2所示实施例中的步骤207相同,此处不再赘述。
可以理解的是,基于步骤407说明的内容,本实施例中,若一次对一个第二目标车头图像在第一模型中进行迭代操作后,若在判断向量参数方差值小于第一阈值的情况下,且向量参数方差值小于第一阈值的次数大于第二阈值,则可以以向量参数方差值小于第一阈值的次数大于第二阈值时的最后一次的向量参数方差值对第一模型中卷积层的卷积核参数进行调整,得到目标模型。例如,假设第二阈值为50次,那么在第80次迭代操作后,若判断第 80次迭代操作的向量参数方差值小于第一阈值,且第80次迭代操作后得到的向量参数方差值小于第一阈值的次数为51次,则可以将第80次迭代操作得到的向量参数方差值对第一模型中卷积层的卷积核参数进行调整,得到目标模型。可以理解的是,以第80次对第一模型调整得到的目标模型为例,该第一模型中卷积层的卷积核参数在前79次的迭代操作中已经经过了不断地调整。
进一步的,基于图1所示实施例中步骤106和图2所示实施例中步骤207 说明的内容,本实施例中,若判断检测向量与参考向量的向量参数方差值不小于第一阈值,或向量参数方差值小于第一阈值的次数不大于第二阈值,那么为了得到目标模型,也可以根据向量参数方差值调整第一模型中卷积层的卷积核参数得到第二模型后,将第二模型中卷积层的卷积核参数作为第一模型中卷积层的卷积核参数并重复执行步骤403至步骤408。可以理解的是,在重复执行步骤403至步骤408的过程中,第一模型中卷积层的卷积核参数可以不断得到调整,而第二目标车头图像不会在卷积神经网络中重复进行迭代操作,直到所有第二车头图像作为第二目标车头图像全部进行一次迭代操作后仍未获得目标模型的情况下才会重复,即在该情况下,第一目标车头图像和第二目标车头图像的确定是随机但不重复的。
请参阅图5,本发明实施例中车头检测模型重建方法另一实施例包括:
本实施例中的步骤501至步骤505与图2所示实施例中的步骤201至步骤205相同,此处不再相同。
506、判断向量参数方差值的确定次数是否为第一预设次数的倍数,若是,则执行步骤507,若否,则执行步骤503。
本实施例中,确定检测向量与参考向量的向量参数方差值后,可以判断向量参数方差值的确定次数是否为预设次数的倍数。
具体的,一方面,可以一次对一个第二目标车头图像在第一模型中进行迭代操作,在图像检测得到检测向量后,即可确定检测向量与参考向量的向量参数方差值,并可以对向量参数方差值的确定次数进行判断操作。
另一方面,为了减少第一模型训练的偶然性,增加训练的第一模型的鲁棒性,能更快使向量参数方差值收敛,可以依次对预设数量的第二目标车头图像在第一模型中进行迭代操作,在图像检测得到预设数量的检测向量,并可以在得到预设数量的检测向量与对应的参考向量的向量参数方差值后,对向量参数方差值的确定次数进行判断操作。其中,预设数量可以即为预设次数。
进一步的,本实施例中,在依次对预设数量的第二目标车头图像在第一模型中进行迭代操作的基础上,将得到的预设数量的向量参数方差值再进行加权计算,得到诸如平均值后,可以判断该平均值是否小于第一阈值,若小于,则可以执行步骤507,若不小于,则执行步骤503。例如,在第一模型中对50个第二目标车头图像进行迭代操作,得到50个向量参数方差值后,可以判断50个向量参数方差值的平均值是否小于第一阈值。
可以理解的是,本实施例中的预设次数可以预先设置,可以是根据数据统计进行设置,也可以是用户自定义设置,具体此处不做限定。
本实施例中的步骤507与图2所示实施例中的步骤207相同,此处不再赘述。
可以理解的是,基于步骤506说明的内容,本实施例中,一方面,若一次对一个第二目标车头图像在第一模型中进行迭代操作后,判断向量参数方差值的确定次数为预设次数的倍数,则可以在确定次数为预设次数的倍数时,以该确定次数中最后一次的向量参数方差值对第一模型中卷积层的卷积核参数进行调整,得到目标模型。例如,假设预设次数为1万次,那么可以将第1 万次迭代操作得到的向量参数方差值对第一模型中卷积层的卷积核参数进行调整,得到目标模型,也可以将第2万次得到的向量参数方差值对第一模型中卷积层的卷积核参数进行调整,得到目标模型,即可以将第A万次调整得到的目标模型进行存储,由此可以得到多个目标模型,具体在实际应用中目标模型的选取可由用户决定。可以理解的是,以第1万次对第一模型调整得到的目标模型为例,该第一模型中卷积层的卷积核参数在前9999次的迭代操作中已经经过了不断地调整。其中,A为大于零的自然数。
另一方面,若依次对预设数量的第二目标车头图像在第一模型中进行迭代操作后,判断向量参数方差值的确定次数为预设次数的倍数,则可以在确定次数为预设次数的倍数时,即在第一模型中进行预设数量的迭代操作后,可以将得到的预设数量的向量参数方差值再进行加权计算,得到诸如平均值,再可以以该诸如平均值对第一模型中卷积层的卷积核参数进行调整,得到目标模型。例如,假设预设次数为50次,则可以将进行50次迭代操作后确定的50个向量参数方差值加权计算,得到诸如50个向量参数方差值的平均值,并可以以该平均值对第一模型中卷积层的卷积核参数进行调整,得到目标模型。
进一步的,在依次对预设数量的第二局部图像在第一模型中进行迭代操作的基础上,将得到的预设数量的向量参数方差值再进行加权计算,得到诸如平均值后,若判断该平均值小于第一阈值,则可以以平均值对第一模型中卷积层的卷积核参数进行调整,得到目标模型。例如,假设预设次数为50次,则可以将进行50次迭代操作后确定的50个向量参数方差值加权计算,得到诸如50个向量参数方差值的平均值,并可以在该平均值小于第一阈值时,以该第一阈值对第一模型中卷积层的卷积核参数进行调整,得到目标模型。
需要说明的是,基于图1所示实施例中步骤106以及图2所示实施例中步骤207说明的内容,本实施例中,若判断向量参数方差值的确定次数不为预设次数的倍数,那么为了得到目标模型,也可以根据每一次得到的向量参数方差值调整第一模型的卷积层参数得到第二模型后,将第二模型的卷积层参数作为第一模型中卷积层的卷积核参数并重复执行步骤503至步骤507。同时,若判断上述说明的平均值不小于第一阈值,也可以以该平均值调整第一模型的卷积层参数得到第二模型后,将第二模型的卷积层参数作为第一模型中卷积层的卷积核参数并重复执行步骤503至步骤507。可以理解的是,在重复执行步骤503至步骤507的过程中,第一模型中卷积层的卷积核参数可以不断得到调整,而第二目标车头图像不会在卷积神经网络中重复进行迭代操作,直到所有第二车头图像作为第二目标车头图像全部进行一次迭代操作后仍未获得目标模型的情况下才会重复,即在该情况下,第一目标车头图像和第二目标车头图像的确定是随机但不重复的。
上面对如何得到目标模型进行了说明,下面基于目标模型,对如何车头进行检测进行说明,请参阅图6,本发明实施例中基于目标模型的车头检测方法一个实施例包括:
601、获取待检测车头图像;
本实施例中,在获取到待测车辆压地感的车头图像后,可以将车头图像进行缩小处理,得到待检测车头图像。例如,将车头图像缩小为像素尺寸 224*224的待检测车头图像。
本实施例中的部分内容与图1所示实施例中的步骤101说明的内容相同,此处不再赘述。
602、按照目标模型的网络参数对待检测车头图像进行图像检测,得到待检测车头图像的目标检测向量;
本实施例中,获取待检测车头图像后,可以按照目标模型的网络参数对待检测车头图像进行图像检测,得到待检测车头图像的目标检测向量。
本实施例中,基于上述说明的车头检测模型重建方法中确定的目标模型,该目标模型采用图像像素级别的训练方式自学习特征识别第二目标车头图像,自学习特征具有多样性,可以表征不同场景及环境下的特征形态,因此,可以将待检测车头图像输入目标模型直接进行图像检测,得到待检测车头图像的目标检测向量。例如,假设待检测车头图像的像素尺寸为224*224,图像检测后,可以得到1452维的目标检测向量。
本实施例中,待检测车头图像的卷积处理过程可参照图1所示实施例中步骤103以及图2所示实施例中步骤204说明的内容,此处不再赘述。
603、从目标检测向量中获取具有车头参数的第一检测向量;
本实施例中,按照目标模型的网络参数对待检测车头图像进行图像检测,得到待检测车头图像的目标检测向量后,可以从目标检测向量中获取具有车头参数的第一检测向量。
具体的,目标检测向量可以包括车头/背景参数、目标位置的坐标参数、目标区域的尺寸参数,为了尽可能地排除待检测车头图像中的背景部分,可以在目标检测向量中排除背景参数,以及背景参数对应的目标位置的坐标参数、目标区域的尺寸参数,得到具有车头参数的第一检测向量。
604、将第一检测向量进行拟合处理,得到待检测车头图像中车头区域的坐标。
本实施例中,从目标检测向量中获取具有车头参数的第一检测向量后,可以将第一检测向量进行拟合处理,得到待检测车头图像中车头区域的坐标。
具体的,将第一检测向量进行拟合处理后,可以确定待检测车头图像中车头区域的坐标,以方形的车头区域为例,根据拟合处理结果,可以确定车头区域四个顶角的坐标。
进一步的,获得待检测车头图像中车头区域的坐标后,还可以根据待检测车头图像与待测车辆压地感的车头图像之间的缩放比例,确定待测车辆压地感的车头图像中车头区域的坐标,从而可以确定待测车辆压地感的车头图像中的车头区域。
可以理解的是,在实际应用中,待检测车头图像中存在背景图像,在车头检测的过程中,主要是对待检测车头图像中的车头部分进行检测识别,请参阅图7,本发明实施例中基于目标模型的车头检测方法另一实施例包括:
701、对待检测车头图像进行灰度处理;
本实施例中,在对目标模型的实际测试中,可以获取待检测车头图像,并可以对待检测车头图像进行灰度处理。
本实施例中,在获取到待测车辆压地感的车头图像后,可以将车头图像进行缩小处理,得到待检测车头图像。例如,将车头图像缩小为像素尺寸 224*224的待检测车头图像。
本实施例中的部分内容与图1所示实施例中的步骤101说明的内容相同,此处不再赘述。
本实施例中,在得到待检测车头图像后,为了减少图像处理的计算量,可以对待检测车头图像进行灰度处理。
702、获取待检测车头图像;
本实施例中,对待检测车头图像进行灰度处理后,可以获取灰度处理后的待检测车头图像。
本实施例中的步骤703与图6所示实施例中的步骤602相同,此处不再赘述。
704、获取目标检测向量的置信度;
本实施例中,按照目标模型的网络参数对待检测车头图像进行图像检测,得到待检测车头图像的目标检测向量,可以获取目标检测向量的置信度。
例如,当灰度处理后的待检测车头图像输入目标模型中进行相应的图像检测后,可以得到1452维的目标检测向量,那么意味着图像检测过程中,待检测车牌图像划分成了121个区域块,每个区域块对应2次检测结果,每次检测结果(子目标检测向量)可以对应5个参数,其中1个参数可以为车头参数或背景参数。在实际应用中,可以对每一次子目标检测向量设置置信度,该置信度可以用来表示区域块中是否包括车头区域,即车头参数或背景参数的表征。
705、从目标检测向量中获取置信度大于预设阈值的子目标检测向量为第一检测向量;
本实施例中,获取目标检测向量的置信度后,可以从目标检测向量中获取置信度大于预设阈值的子目标检测向量为第一检测向量
具体的,本实施例中,可以预先设置预设阈值作为判断检测向量的置信度的基准,即判断对应的区域块中是否包含车头区域。例如,假设预设阈值为0.3,该预设阈值0.3可以作为每个区域块是否含有车头区域的基准,那么在得到诸如1452维的目标检测向量,可以将预设阈值0.3与子目标检测向量的置信度一一对比,则可以从检测向量中获取置信度大于预设阈值0.3的子目标检测向量为第一检测向量。可以理解的是,本实施例中的预设阈值还可以是其它数值,本实施例仅为举例说明。
706、将第一检测向量进行最大非线性抑制融合,得到待检测车头图像中车头区域的坐标;
本实施例中,从目标检测向量中获取置信度大于预设阈值的子目标检测向量为第一检测向量后,可以将第一检测向量进行最大非线性抑制融合,得到待检测车头图像中车头区域的坐标。
在实际应用中,在待检测车头图像中可能存在多辆车的情况,当有多辆车在待检测车头图像中时,会有多个大于预设阈值0.3的区域块的子目标检测向量的输出。同时,由于待检测车头图像中车头区域可能包含多个区域块,那么多个区域块对应的子目标检测向量的置信度都会大于预设阈值0.3,但由于多辆车在待检测车头图像中的车头区域相差不大,从而通过非最大化抑制方法,可以解决多个区域块中相同位置的问题。
本实施例中的部分内容与图6所示实施例中的步骤604说明的内容相同,此处不再赘述。
707、根据车头区域的坐标在待检测车头图像中确定车头区域图像。
本实施例中,将第一检测向量进行最大非线性抑制融合,得到待检测车头图像中车头区域的坐标后,可以根据车头区域的坐标在待检测车头图像中确定车头区域图像。
例如,以方形的车头区域为例,确定待检测车头图像中车头区域的诸如四个顶角的坐标,可以以该四个顶角的坐标构成的方形区域为车头区域,其它背景部分可以删除。
进一步的,在待检测车头图像中确定车头区域图像后,还可以根据待检测车头图像与待测车辆压地感的车头图像之间的缩放比例,确定待测车辆压地感的车头图像中的车头区域图像,其它背景部分可以删除。
上面对本发明实施例中的车头检测模型重建方法进行了描述,下面分别对本发明实施例中的车头检测模型重建装置进行描述,请参阅图8,本发明实施例中车头检测模型重建装置一个实施例包括:
获取单元801,可以用于执行:
(1)获取至少一个第一车头图像,并将至少一个第一车头图像进行缩小处理,得到对应的至少一个第二车头图像;
处理单元802,可以用于执行:
(2)确定第一目标车头图像和第二目标车头图像,第二目标车头图像为至少一个第二车头图像中的任意一个,第一目标车头图像为至少一个第一车头图像中与第二目标车头图像对应的一个;
(3)按照第一模型的网络参数对第二目标车头图像进行图像检测,得到第二目标车头图像的检测向量;
(4)确定检测向量与参考向量的向量参数差异,参考向量为第二目标车头图像基于第一目标车头图像的标注结果进行获取得到,参考向量与检测向量的维度相同;
(5)判断向量参数差异是否满足预设条件;
(6)若是,则根据向量参数差异调整第一模型的网络参数,得到目标模型,若否,则根据向量参数差异调整第一模型的网络参数,得到第二模型,将第二模型的网络参数作为第一模型的网络参数并重复执行步骤(2)至步骤 (6)。
可选的,在本发明的一些实施例中,处理单元802,可以具体用于执行:
判断向量参数差异是否小于第一阈值;或,
判断向量参数差异是否小于第一阈值,且判断向量参数差异小于第一阈值的次数是否大于第二阈值;或,
判断向量参数差异的确定次数是否为第一预设次数的倍数。
可选的,在本发明的一些实施例中,处理单元802,可以具体用于执行:
判断向量参数差异的确定次数是否为第一预设次数的倍数,且判断确定次数的向量参数差异的加权计算值是否小于第一阈值。
可选的,在本发明的一些实施例中,获取单元801,还可以具体用于执行:
对至少一个第一车头图像进行灰度处理。
可选的,在本发明的一些实施例中,网络参数包括卷积层参数、池化层参数、全连接层参数;
卷积层参数以及池化层参数均为一个或以上,处理单元802,可以具体用于执行:
按照第一卷积层参数以及第二池化层参数对第一目标车头图像进行一次目标处理,得到第一处理图像,目标处理包括卷积处理和池化处理,卷积处理用于得到第一图像,池化处理用于得到第二图像,第一图像的像素尺寸为第二图像的像素尺寸的预设倍数;
按照第二卷积层参数以及第二池化层参数将第一处理图像进行K次目标处理,得到第二处理图像,K为自然数;
按照全连接层参数将第二处理图像进行全连接层处理,得到第二目标车头图像的检测向量。
可选的,在本发明的一些实施例中,向量参数差异为向量参数方差值,处理单元802,可以具体用于执行:
根据向量参数方差值调整第一模型中卷积层的卷积核参数;
处理单元802,可以具体用于执行:
在利用向量参数方差值确定第N层池化层的向量损失后,根据第N层池化层的向量损失确定第N层卷积层的向量损失,并根据第N层卷积层的像素损失调整第N层卷积层的卷积核参数,第一模型包括N层池化层和N层卷积层,N为大于零的整数;
根据第N-M层池化层的向量损失确定第N-M层卷积层的向量损失后,并根据第N-M层卷积层的向量损失确定第N-M-1层卷积层的卷积核损失,M为自然数。
可选的,在本发明的一些实施例中,处理单元802,还可以具体用于执行:
对第二目标车头图像进行划块处理,得到至少一个区域块;
获取至少一个区域块基于原始向量的第二预设次数的标注结果,得到第二目标车头图像的参考向量,原始向量为根据第一目标图像的标注结果得到。
可选的,在本发明的一些实施例中,检测向量、参考向量、原始向量均包括目标位置的坐标参数、目标区域的尺寸参数;
检测向量、参考向量还包括车头参数或背景参数。
可选的,在本发明的一些实施例中,获取单元801,可以具体用于执行:
获取待检测车头图像;
处理单元802,可以具体用于执行:
按照目标模型的网络参数对待检测车头图像进行图像检测,得到待检测车头图像的目标检测向量;
从目标检测向量中获取具有车头参数的第一检测向量;
将第一检测向量进行拟合处理,得到待检测车头图像中车头区域的坐标。
可选的,在本发明的一些实施例中,获取单元801,还可以具体用于执行:
对待检测车头图像进行灰度处理。
可选的,在本发明的一些实施例中,处理单元802,可以具体用于执行:
获取目标检测向量的置信度;
从目标检测向量中获取置信度大于预设阈值的子目标检测向量为第一检测向量。
可选的,在本发明的一些实施例中,拟合处理为最大非线性抑制融合。
可选的,在本发明的一些实施例中,处理单元802,还可以具体用于执行:
根据车头区域的坐标在待检测车头图像中确定车头区域图像。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (26)
1.一种车头检测模型重建方法,其特征在于,包括:
(1)获取至少一个第一车头图像,并将所述至少一个第一车头图像进行缩小处理,得到对应的至少一个第二车头图像;
(2)确定第一目标车头图像和第二目标车头图像,所述第二目标车头图像为所述至少一个第二车头图像中的任意一个,所述第一目标车头图像为所述至少一个第一车头图像中与所述第二目标车头图像对应的一个;
(3)按照第一模型的网络参数对所述第二目标车头图像进行图像检测,得到所述第二目标车头图像的检测向量;
(4)确定所述检测向量与参考向量的向量参数差异,所述参考向量为所述第二目标车头图像基于所述第一目标车头图像的标注结果进行获取得到,所述参考向量与所述检测向量的维度相同;
(5)判断所述向量参数差异是否满足预设条件;
(6)若是,则根据所述向量参数差异调整所述第一模型的网络参数,得到目标模型,若否,则根据所述向量参数差异调整所述第一模型的网络参数,得到第二模型,将所述第二模型的网络参数作为第一模型的网络参数并重复执行步骤(2)至步骤(6)。
2.根据权利要求1所述的车头检测模型重建方法,其特征在于,所述判断所述向量参数差异是否满足预设条件包括:
判断所述向量参数差异是否小于第一阈值;或,
判断所述向量参数差异是否小于所述第一阈值,且判断所述向量参数差异小于第一阈值的次数是否大于第二阈值;或,
判断所述向量参数差异的确定次数是否为第一预设次数的倍数。
3.根据权利要求2所述的车头检测模型重建方法,其特征在于,所述判断所述向量参数差异的确定次数是否为第一预设次数的倍数包括:
判断所述向量参数差异的确定次数是否为第一预设次数的倍数,且判断所述确定次数的向量参数差异的加权计算值是否小于所述第一阈值。
4.根据权利要求2或3所述的车头检测模型重建方法,其特征在于,在所述获取至少一个第一车头图像,并将所述至少一个第一车头图像进行缩小处理,得到对应的至少一个第二车头图像之前,所述方法还包括:
对所述至少一个第一车头图像进行灰度处理。
5.根据权利要求4所述的车头检测模型重建方法,其特征在于,所述网络参数包括卷积层参数、池化层参数、全连接层参数;
所述卷积层参数以及所述池化层参数均为一个或以上,所述按照第一模型的网络参数对所述第二目标车头图像进行图像检测,得到所述第二目标车头图像的检测向量包括:
按照第一卷积层参数以及第二池化层参数对所述第一目标车头图像进行一次目标处理,得到第一处理图像,所述目标处理包括卷积处理和池化处理,所述卷积处理用于得到第一图像,所述池化处理用于得到第二图像,所述第一图像的像素尺寸为所述第二图像的像素尺寸的预设倍数;
按照第二卷积层参数以及第二池化层参数将所述第一处理图像进行K次所述目标处理,得到第二处理图像,所述K为自然数;
按照所述全连接层参数将所述第二处理图像进行全连接层处理,得到所述第二目标车头图像的检测向量。
6.根据权利要求5所述的车头检测模型重建方法,其特征在于,所述向量参数差异为向量参数方差值,所述根据所述向量参数差异调整所述第一模型的网络参数包括:
根据所述向量参数方差值调整所述第一模型中卷积层的卷积核参数;
所述根据所述向量参数方差值调整所述第一模型中卷积层的卷积核参数包括:
在利用所述向量参数方差值确定第N层池化层的向量损失后,根据所述第N层池化层的向量损失确定第N层卷积层的向量损失,并根据所述第N层卷积层的像素损失调整所述第N层卷积层的卷积核参数,所述第一模型包括N层池化层和N层卷积层,所述N为大于零的整数;
根据所述第N-M层池化层的向量损失确定第N-M层卷积层的向量损失后,并根据所述第N-M层卷积层的向量损失确定第N-M-1层卷积层的卷积核损失,所述M为自然数。
7.根据权利要求6所述的车头检测模型重建方法,其特征在于,在所述确定所述检测向量与参考向量的向量参数差异之前,所述方法还包括:
对所述第二目标车头图像进行划块处理,得到至少一个区域块;
获取所述至少一个区域块基于原始向量的第二预设次数的标注结果,得到所述第二目标车头图像的参考向量,所述原始向量为根据所述第一目标图像的标注结果得到。
8.根据权利要求7所述的车头检测模型重建方法,其特征在于,所述检测向量、所述参考向量、所述原始向量均包括目标位置的坐标参数、目标区域的尺寸参数;
所述检测向量、所述参考向量还包括车头参数或背景参数。
9.根据权利要求1所述的车头检测模型重建方法,其特征在于,所述方法还包括:
获取待检测车头图像;
按照目标模型的网络参数对所述待检测车头图像进行图像检测,得到所述待检测车头图像的目标检测向量;
从所述目标检测向量中获取具有车头参数的第一检测向量;
将所述第一检测向量进行拟合处理,得到所述待检测车头图像中车头区域的坐标。
10.根据权利要求9所述的车头检测模型重建方法,其特征在于,在所述按照目标模型的网络参数对所述待检测车头图像进行图像检测,得到所述待检测车头图像的目标检测向量之前,所述方法还包括:
对所述待检测车头图像进行灰度处理。
11.根据权利要求10所述的车头检测模型重建方法,其特征在于,所述从所述目标检测向量中获取具有车头参数的第一检测向量包括:
获取所述目标检测向量的置信度;
从所述目标检测向量中获取所述置信度大于预设阈值的子目标检测向量为第一检测向量。
12.根据权利要求11所述的车头检测模型重建方法,其特征在于,所述拟合处理为最大非线性抑制融合。
13.根据权利要求9至12中任一项所述的车头检测模型重建方法,其特征在于,在所述将所述第一检测向量进行预设处理,得到所述车头图像中车头区域的坐标之后,所述方法还包括:
根据所述车头区域的坐标在所述待检测车头图像中确定车头区域图像。
14.一种车头检测模型重建装置,其特征在于,包括:
获取单元,用于执行:
(1)获取至少一个第一车头图像,并将所述至少一个第一车头图像进行缩小处理,得到对应的至少一个第二车头图像;
处理单元,用于执行:
(2)确定第一目标车头图像和第二目标车头图像,所述第二目标车头图像为所述至少一个第二车头图像中的任意一个,所述第一目标车头图像为所述至少一个第一车头图像中与所述第二目标车头图像对应的一个;
(3)按照第一模型的网络参数对所述第二目标车头图像进行图像检测,得到所述第二目标车头图像的检测向量;
(4)确定所述检测向量与参考向量的向量参数差异,所述参考向量为所述第二目标车头图像基于所述第一目标车头图像的标注结果进行获取得到,所述参考向量与所述检测向量的维度相同;
(5)判断所述向量参数差异是否满足预设条件;
(6)若是,则根据所述向量参数差异调整所述第一模型的网络参数,得到目标模型,若否,则根据所述向量参数差异调整所述第一模型的网络参数,得到第二模型,将所述第二模型的网络参数作为第一模型的网络参数并重复执行步骤(2)至步骤(6)。
15.根据权利要求14所述的车头检测模型重建装置,其特征在于,所述处理单元,具体用于执行:
判断所述向量参数差异是否小于第一阈值;或,
判断所述向量参数差异是否小于所述第一阈值,且判断所述向量参数差异小于第一阈值的次数是否大于第二阈值;或,
判断所述向量参数差异的确定次数是否为第一预设次数的倍数。
16.根据权利要求14所述的车头检测模型重建装置,其特征在于,所述处理单元,还具体用于执行:
判断所述向量参数差异的确定次数是否为第一预设次数的倍数,且判断所述确定次数的向量参数差异的加权计算值是否小于第一阈值。
17.根据权利要求15或16所述的车头检测模型重建装置,其特征在于,所述获取单元,还具体用于执行:
对所述至少一个第一车头图像进行灰度处理。
18.根据权利要求17所述的车头检测模型重建装置,其特征在于,所述网络参数包括卷积层参数、池化层参数、全连接层参数;
所述卷积层参数以及所述池化层参数均为一个或以上,所述处理单元,具体用于执行:
按照第一卷积层参数以及第二池化层参数对所述第一目标车头图像进行一次目标处理,得到第一处理图像,所述目标处理包括卷积处理和池化处理,所述卷积处理用于得到第一图像,所述池化处理用于得到第二图像,所述第一图像的像素尺寸为所述第二图像的像素尺寸的预设倍数;
按照第二卷积层参数以及第二池化层参数将所述第一处理图像进行K次所述目标处理,得到第二处理图像,所述K为自然数;
按照所述全连接层参数将所述第二处理图像进行全连接层处理,得到所述第二目标车头图像的检测向量。
19.根据权利要求18所述的车头检测模型重建装置,其特征在于,所述向量参数差异为向量参数方差值,所述处理单元,具体用于执行:
根据所述向量参数方差值调整所述第一模型中卷积层的卷积核参数;
所述处理单元,具体用于执行:
在利用所述向量参数方差值确定第N层池化层的向量损失后,根据所述第N层池化层的向量损失确定第N层卷积层的向量损失,并根据所述第N层卷积层的像素损失调整所述第N层卷积层的卷积核参数,所述第一模型包括N层池化层和N层卷积层,所述N为大于零的整数;
根据所述第N-M层池化层的向量损失确定第N-M层卷积层的向量损失后,并根据所述第N-M层卷积层的向量损失确定第N-M-1层卷积层的卷积核损失,所述M为自然数。
20.根据权利要求19所述的车头检测模型重建装置,其特征在于,所述处理单元,还具体用于执行:
对所述第二目标车头图像进行划块处理,得到至少一个区域块;
获取所述至少一个区域块基于原始向量的第二预设次数的标注结果,得到所述第二目标车头图像的参考向量,所述原始向量为根据所述第一目标图像的标注结果得到。
21.根据权利要求20所述的车头检测模型重建装置,其特征在于,所述检测向量、所述参考向量、所述原始向量均包括目标位置的坐标参数、目标区域的尺寸参数;
所述检测向量、所述参考向量还包括车头参数或背景参数。
22.根据权利要求14所述的车头检测模型重建装置,其特征在于,
所述获取单元,还具体用于执行:
获取待检测车头图像;
所述处理单元,还具体用于执行:
按照目标模型的网络参数对所述待检测车头图像进行图像检测,得到所述待检测车头图像的目标检测向量;
从所述目标检测向量中获取具有车头参数的第一检测向量;
将所述第一检测向量进行拟合处理,得到所述待检测车头图像中车头区域的坐标。
23.根据权利要求22所述的车头检测模型重建装置,其特征在于,所述获取单元,还具体用于执行:
对所述待检测车头图像进行灰度处理。
24.根据权利要求23所述的车头检测模型重建装置,其特征在于,所述处理单元,具体用于执行:
获取所述目标检测向量的置信度;
从所述目标检测向量中获取所述置信度大于预设阈值的子目标检测向量为第一检测向量。
25.根据权利要求24所述的车头检测模型重建装置,其特征在于,所述拟合处理为最大非线性抑制融合。
26.根据权利要求22至25中任一项所述的车头检测模型重建装置,其特征在于,所述处理单元,还具体用于执行:
根据所述车头区域的坐标在所述待检测车头图像中确定车头区域图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611226498.9A CN106780727B (zh) | 2016-12-27 | 2016-12-27 | 一种车头检测模型重建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611226498.9A CN106780727B (zh) | 2016-12-27 | 2016-12-27 | 一种车头检测模型重建方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106780727A CN106780727A (zh) | 2017-05-31 |
CN106780727B true CN106780727B (zh) | 2020-09-08 |
Family
ID=58922008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611226498.9A Active CN106780727B (zh) | 2016-12-27 | 2016-12-27 | 一种车头检测模型重建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106780727B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018200534A1 (de) * | 2018-01-15 | 2019-07-18 | Robert Bosch Gmbh | Verfahren zum Betreiben eines künstlichen neuronalen Netzes |
CN108875535B (zh) * | 2018-02-06 | 2023-01-10 | 北京旷视科技有限公司 | 图像检测方法、装置和系统及存储介质 |
CN110738212B (zh) * | 2018-07-19 | 2022-11-08 | 北京四维图新科技股份有限公司 | 一种卷积网络模型的获取方法、装置及处理设备 |
CN109359574B (zh) * | 2018-09-30 | 2021-05-14 | 宁波工程学院 | 基于信道级联的广域视场行人检测方法 |
CN109284735B (zh) * | 2018-10-17 | 2019-11-29 | 思百达物联网科技(北京)有限公司 | 鼠情监控方法、装置及存储介质 |
CN111243085B (zh) * | 2020-01-20 | 2021-06-22 | 北京字节跳动网络技术有限公司 | 图像重建网络模型的训练方法、装置和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103489317A (zh) * | 2013-10-10 | 2014-01-01 | 扬州瑞控汽车电子有限公司 | 一种不同场景下的车辆检测方法 |
CN104091151A (zh) * | 2014-06-30 | 2014-10-08 | 南京信息工程大学 | 基于Gabor特征提取和稀疏表示的车辆识别方法 |
CN105184309A (zh) * | 2015-08-12 | 2015-12-23 | 西安电子科技大学 | 基于cnn和svm的极化sar图像分类 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5529910B2 (ja) * | 2012-03-12 | 2014-06-25 | 本田技研工業株式会社 | 車両周辺監視装置 |
-
2016
- 2016-12-27 CN CN201611226498.9A patent/CN106780727B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103489317A (zh) * | 2013-10-10 | 2014-01-01 | 扬州瑞控汽车电子有限公司 | 一种不同场景下的车辆检测方法 |
CN104091151A (zh) * | 2014-06-30 | 2014-10-08 | 南京信息工程大学 | 基于Gabor特征提取和稀疏表示的车辆识别方法 |
CN105184309A (zh) * | 2015-08-12 | 2015-12-23 | 西安电子科技大学 | 基于cnn和svm的极化sar图像分类 |
Also Published As
Publication number | Publication date |
---|---|
CN106780727A (zh) | 2017-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106780727B (zh) | 一种车头检测模型重建方法及装置 | |
CN110363182B (zh) | 基于深度学习的车道线检测方法 | |
CN107563372B (zh) | 一种基于深度学习ssd框架的车牌定位方法 | |
CN106651774B (zh) | 一种车牌超分辨率模型重建方法及装置 | |
CN103049763B (zh) | 一种基于上下文约束的目标识别方法 | |
CN111553397B (zh) | 基于区域全卷积网络和自适应的跨域目标检测方法 | |
CN106599792B (zh) | 一种手部驾驶违规行为的检测方法 | |
CN108875600A (zh) | 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质 | |
CN107633226B (zh) | 一种人体动作跟踪特征处理方法 | |
CN111126258A (zh) | 图像识别方法及相关装置 | |
CN109948593A (zh) | 基于结合全局密度特征的mcnn人群计数方法 | |
CN108805016B (zh) | 一种头肩区域检测方法及装置 | |
CN109583483A (zh) | 一种基于卷积神经网络的目标检测方法和系统 | |
CN111209858B (zh) | 一种基于深度卷积神经网络的实时车牌检测方法 | |
CN114758288A (zh) | 一种配电网工程安全管控检测方法及装置 | |
CN110276264A (zh) | 一种基于前景分割图的人群密度估计方法 | |
CN111160205A (zh) | 一种交通场景嵌入式多类目标端对端统一检测方法 | |
CN104463240B (zh) | 一种仪表定位方法及装置 | |
CN108305260A (zh) | 一种图像中角点的检测方法、装置及设备 | |
CN116645592B (zh) | 一种基于图像处理的裂缝检测方法和存储介质 | |
CN110930384A (zh) | 基于密度信息的人群计数方法、装置、设备以及介质 | |
CN110796230A (zh) | 卷积神经网络的训练及使用方法、设备及存储介质 | |
CN116883588A (zh) | 一种大场景下的三维点云快速稠密重建方法及系统 | |
CN115631344A (zh) | 一种基于特征自适应聚合的目标检测方法 | |
CN103593639A (zh) | 嘴唇检测和跟踪方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |