CN106682600A - 一种目标检测方法及终端 - Google Patents

一种目标检测方法及终端 Download PDF

Info

Publication number
CN106682600A
CN106682600A CN201611163021.0A CN201611163021A CN106682600A CN 106682600 A CN106682600 A CN 106682600A CN 201611163021 A CN201611163021 A CN 201611163021A CN 106682600 A CN106682600 A CN 106682600A
Authority
CN
China
Prior art keywords
pending image
driver
car plate
candidate frame
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611163021.0A
Other languages
English (en)
Inventor
龚敏
曾儿孟
刘凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN HARZONE TECHNOLOGY Co Ltd
Original Assignee
SHENZHEN HARZONE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN HARZONE TECHNOLOGY Co Ltd filed Critical SHENZHEN HARZONE TECHNOLOGY Co Ltd
Priority to CN201611163021.0A priority Critical patent/CN106682600A/zh
Publication of CN106682600A publication Critical patent/CN106682600A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/597Recognising the driver's state or behaviour, e.g. attention or drowsiness
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/54Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

本发明实施例提供了一种目标检测方法及终端,所述方法包括:获取待处理图像,其中,所述待处理图像中包含车牌及驾驶员;计算所述待处理图像的聚合通道特征,所述聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征;根据所述聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌;对所述多个候选框进行合理性判别,得到所述多个得分;选取所述多个得分中的最高得分;在所述最高得分大于预设阈值时,将所述最高得分对应的候选框所在区域确定为目标区域。通过本发明实施例可提高检测多目标的效率以及可靠性。

Description

一种目标检测方法及终端
技术领域
本发明涉及视频监控技术领域,具体涉及一种目标检测方法及终端。
背景技术
基于机器视觉的目标检测技术是人工智能领域的核心,其在自动驾驶、机器人和航天探索等场合扮演着重要的角色。随着人们生活水平的不断提升,城市小汽车的数量持续增长,与此同时,不安全驾驶行为也成为城市安全的重要隐患。因此,通过摄像头的实施监控,同时,通过机器视觉技术分析驾驶员的行为,成为有效地监管驾驶员行为规范、增加车辆安全系数以及降低交通事故的重要手段。而通过监测的视频图像获取驾驶员的位置信息是该手段的重要技术,这为后续的判断驾驶员是否存在开车打电话等行为有着重大帮助。
目前,视频监控下的驾驶员检测方法主要分成两种:基于目标先验信息的方法和基于机器学习的方法。基于先验信息主要是指使用了车体水平位置、车体角点以及车窗位置等简单的车辆特征进而对驾驶员定位。基于机器学习的方法是最常用的方法,它主要是将目标进行特征提取,采用相应地特征描述方法进行表示,然后,以机器学习的方法对目标样本进行训练,得到准确的目标检测模型。在检测测试阶段,待检测样本以相同的特征表示方法,通过该模型判断是否为检测的目标。但是,通常会遇到以下情况,例如,车牌与驾驶员不搭配(例如,车位为王某,车牌为AAAAA,而现在在车牌为AAAAA的车上的驾驶员为张某),便无法准确识别出车牌与驾驶员是否匹配。
发明内容
本发明实施例提供了一种目标检测方法及终端,以期对驾驶员和车牌进行准确识别。
本发明实施例第一方面提供了一种目标检测方法,包括:
获取待处理图像,其中,所述待处理图像中包含车牌及驾驶员;
计算所述待处理图像的聚合通道特征,所述聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征;
根据所述聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌;
对所述多个候选框进行合理性判别,得到所述多个得分;
选取所述多个得分中的最高得分;
在所述最高得分大于预设阈值时,将所述最高得分对应的候选框所在区域确定为目标区域。
可选地,所述计算所述待处理图像的聚合通道特征,包括:
计算所述待处理图像的梯度图;
计算所述待处理图像的LUV色彩空间的三个通道;
根据所述梯度图确定6个方向梯度直方图特征。
可选地,所述计算所述待处理图像的梯度图,包括:
采用如下公式对所述待处理图像进行采样,得到采样图像:
I′(x,y)=I(x/τ,y/τ)
其中,I(x,y)为所述待处理图像,x,y表示所述待处理图像的横坐标和纵坐标,τ为采样因子,I′(x,y)为采样图像;
采用如下公式确定所述采样图像对应的梯度图:
其中,G[I′(x,y)]为梯度图。
可选地,所述对所述多个候选框进行合理性判别,包括:
采用目标分类器对所述多个候选框进行合理性判别。
可选地,在所述获取待处理图像之前,所述方法还包括:
获取正样本集和负样本集,其中,所述正样本符合正常情况下的驾驶员与车牌之间的位置关系的图像,所述负样本为不符合正常情况下的驾驶员与车牌之间的位置关系的图像;
对所述正样本集和所述负样本集进行训练,得到所述目标分类器。
本发明实施例第二方面提供了一种终端,包括:
获取单元,用于获取待处理图像,其中,所述待处理图像中包含车牌及驾驶员;
计算单元,用于计算所述待处理图像的聚合通道特征,所述聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征;
检测单元,用于根据所述聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌;
判别单元,用于对所述多个候选框进行合理性判别,得到所述多个得分;
选取单元,用于选取所述多个得分中的最高得分;
确定单元,用于在所述最高得分大于预设阈值时,将所述最高得分对应的候选框所在区域确定为目标区域。
可选地,所述计算单元包括:
第一计算模块,用于计算所述待处理图像的梯度图;
第二计算模块,用于计算所述待处理图像的LUV色彩空间的三个通道;
第一确定模块,用于根据所述梯度图确定6个方向梯度直方图特征。
可选地,所述第一计算模块包括:
采样模块,用于采用如下公式对所述待处理图像进行采样,得到采样图像:
I′(x,y)=I(x/τ,y/τ)
其中,I(x,y)为所述待处理图像,x,y表示所述待处理图像的横坐标和纵坐标,τ为采样因子,I′(x,y)为采样图像;
第二确定模块,用于采用如下公式确定所述采样图像对应的梯度图:
其中,G[I′(x,y)]为梯度图。
可选地,所述判别单元具体用于:
采用目标分类器对所述多个候选框进行合理性判别。
可选地,所述获取单元,还具体用于:
在所述获取待处理图像之前,获取正样本集和负样本集,其中,所述正样本符合正常情况下的驾驶员与车牌之间的位置关系的图像,所述负样本为不符合正常情况下的驾驶员与车牌之间的位置关系的图像;
所述终端还包括:
训练单元,用于对所述正样本集和所述负样本集进行训练,得到所述目标分类器。
实施本发明实施例,具有如下有益效果:
通过本发明实施例,获取待处理图像,其中,待处理图像中包含车牌及驾驶员,计算待处理图像的聚合通道特征,聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征,根据聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌,然后对多个候选框进行合理性判别,得到多个得分,选取多个得分中的最高得分,在最高得分大于预设阈值时,将最高得分对应的候选框所在区域确定为目标区域。如此,对驾驶员和车牌进行准确识别。另外,在提高检测效率的同时,增加了多个目标检测的可靠性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种目标检测方法的第一实施例流程示意图;
图2是本发明实施例提供的一种目标检测方法的第二实施例流程示意图;
图3a是本发明实施例提供的一种终端的第一实施例结构示意图;
图3b是本发明实施例提供的图3a所描述的终端的第一检测单元的结构示意图;
图3c是本发明实施例提供的图3a所描述的终端的又一结构示意图;
图4是本发明实施例提供的一种终端的第二实施例结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明实施例所描述终端可以包括智能手机(如Android手机、iOS手机、WindowsPhone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备(MID,Mobile InternetDevices)或穿戴式设备等,上述仅是举例,而非穷举,包含但不限于上述终端。
深度学习作为机器学习研究中的一个新领域,这两年在图像识别、语音识别以及自然语言处理方面取得了巨大的成功。深度学习是通过构建多层神经网络模型来训练数据,可以学习出有用的特征,通过对大量样本学习可以得到很高的识别正确率。但是在同时需要识别多个属性时,已有的深度学习方法往往是通过将各个属性独立出来,为每一个属性训练一个模型,这无疑大大增加了复杂度。因此,如何将各个属性联系起来,通过设计一个模型即可对多个属性进行识别成为当下继续解决的问题。
请参阅图1,为本发明实施例提供的一种目标检测方法的第一实施例流程示意图。本实施例中所描述的目标检测方法,包括以下步骤:
101、获取待处理图像,其中,所述待处理图像中包含车牌及驾驶员。
其中,待处理图像可为包含车牌和驾驶员的图像。
102、计算所述待处理图像的聚合通道特征,所述聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征。
可选地,上述步骤102中,所述计算所述待处理图像的聚合通道特征,可包括如下步骤:
21)、计算所述待处理图像的梯度图;
22)、计算所述待处理图像的LUV色彩空间的三个通道;
23)、根据所述梯度图确定6个方向梯度直方图特征。
进一步可选地,上述步骤21中,计算所述待处理图像的梯度图,可包括如下步骤:
211)、采用如下公式对所述待处理图像进行采样,得到采样图像:
I′(x,y)=I(x/τ,y/τ)
其中,I(x,y)为所述待处理图像,x,y表示所述待处理图像的横坐标和纵坐标,τ为采样因子,I′(x,y)为采样图像;
212)、采用如下公式确定所述采样图像对应的梯度图:
其中,G[I′(x,y)]为梯度图。
在训练生成检测模型后,就可以对进行目标检测。在目标检测过程,首先是对待检测图像进行金字塔聚合特征提取,再采用滑窗的办法检测每个可能出现目标的区域。在这一步中,最为关键和耗时的部分则是为金字塔的每层图像进行特征提取。为了提高检测效率,采用一种多尺度特征的近似估计方法,该方法极大降低特征提取消耗的时间。计算的方法是在计算相邻尺度的特征时使用当前尺度的特征去近似的估计,以此省略重复计算特征的过程。这其实就是以采样的方法减少特征计算的消耗,源图像I(x,y),采样因子τ,采用后的图像为I′(x,y),变换的公式为:
I′(x,y)=I(x/τ,y/τ)
所以,采样图像的梯度图与源图像的梯度图关系表示为:
进而采样图的总梯度幅值与源图像的梯度幅值之间关系表示为:
作为目标检测的重要部分,目标特征的描述是实现任务的重要步骤。在本发明实施例中,选取待处理图像的颜色信息,梯度幅值信息以及方向梯度直方图信息特征。其中,颜色信息以LUV特征为佳(即将待处理图像转化为LUV颜色空间),方向梯度直方图中,将梯度划分为6个方向区间并根据每个像素点的梯度赋值大小投射到每个区间上,作为各区间的权重大小,最后统计出各区间的大小。所以,LUV三个通道、一个梯度幅值以及六个方向梯度直方图特征组合作为第一种聚合通道特征(Aggregated Channel Feature,ACF)。
其中,上述梯度图梯度幅值和方向梯度直方图采用如下计算方法:
给定的待处理图像I(x,y),x和y分别表示待处理图像的像素点坐标,因此,在点(x,y)处的梯度计算方法为:
其中,梯度大小定义为:
梯度方向则表示为:
因此,待处理图像的梯度计算公式简化为:
|G[I(x,y)]|=|I(x,y)-I(x+1,y)|+|I(x,y)-I(x,y+1)|
<3.3>如果有多个车牌,则遍历<驾驶员,车牌>组合,按<.3.2>合理性判断。
103、根据所述聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌。
可选地,上述步骤103中,对所述聚合通道特征进行驾驶员检测和车牌检测,可包括如下步骤:
31)、采用第一预设算法对所述聚合通道特征进行驾驶员检测,得到多个驾驶员候选框;
32)、采用第二预设算法对所述聚合通道特征进行车牌检测,得到多个车牌候选框;
33)、根据所述和多个驾驶员候选框和所述多个车牌候选框得到多个候选框,每一候选框中包含一个驾驶员和车牌。
上述第一预设算法可包括但不仅限于:HOG、Adaboost、Harris角点检测、支持向量机SVM等等,上述第二预设算法可包括但不仅限于:HOG、Adaboost、Harris角点检测、支持向量机SVM等等。第一预设算法和第二预设算法可为同一算法或者不同的算法。例如,可采用HOG和AdaBoost的检测对法对车牌和驾驶员进行检测。又例如,基于颜色信息、梯度信息和方向梯度直方图信息的聚合通道特征对检测方法。为了在测试阶段,多目标检测能共享单次计算的聚合通道特征,本发明实施例中可采用了基于聚合通道与AdaBoost算法进行驾驶员检测和车牌检测,得到ACF。
104、对所述多个候选框进行合理性判别,得到所述多个得分。
可选地,采用目标分类器对所述多个候选框进行合理性判别。
通常情况下,为了提高驾驶员检测的准确率,驾驶员验证也是关键的一步。从日常的活动可以考虑到,正常行驶的车辆,每一辆车只有一个车牌和一个驾驶员,并且驾驶员和车牌的位置具有一定的模式,即驾驶员总是出现在车牌的右上部分。为了更好的表示驾驶员和车牌的相对位置关系,设计了一个基于几何位置约束的鲁棒性强的特征描述方法。
驾驶员所在位置表示为:中心(xj,yj),宽高表示为Wj和Hj;而车牌所在位置表示为:中心(xc,yc),宽高表示为Wc和Hc;此外驾驶员中心和车牌中心又组成一个新的矩形,其宽高分别为:Wn和Hn。所以,驾驶员与车牌的相对位置特征可以由:新组成矩形的宽高比、驾驶员宽度Wj与新矩形宽度Wn之比、车牌宽度Wc与驾驶员宽度Wj之比、车牌宽度Wc与新矩形宽度Wn之比等组成特征,训练一个SVM的合理性判别模型,以判断初步检测驾驶员位置和车牌位置的准确性。
105、选取所述多个得分中的最高得分。
106、在所述最高得分大于预设阈值时,将所述最高得分对应的候选框所在区域确定为目标区域。
其中,上述预设阈值可由系统默认或者用户自行设置。
本发明实施例中,通过多尺度的特征近似估计方法计算,得到每个图像尺度的包含颜色LUV信息、梯度幅值信息、梯度直方图信息的驾驶员检测和车牌共享的第一级聚合通道特征,然后在第二级中进行ACF特征的驾驶员和车牌的检测。最后就是对检测的车牌和驾驶进行几何位置约束的<驾驶员,车牌>的合理性判别:
在多张图像进行检测时,可设置如下规则:
1)如果检测到有0个驾驶员,则直接检测下一张图像
2)如果检测出1个驾驶员,则为检测出的最终驾驶员
3)如果有多个驾驶员,则
<3.1>如果有0个车牌,则选择驾驶员分数高的作为最终的驾驶员
<3.2>如果有1车牌,则将车牌与驾驶员组成<.驾驶员,车牌>特征,并用SVM判别模式进行合理性判断,如果有多个合理组合,则选择分数最高的作为最终的输出,如果均判别为不合理组合,则表示车牌识别出错。
上述本发明实施例中可将驾驶员与车牌结合起来进来检测,不仅可用于检测是否是车主驾驶自己的车辆,而且,可以用于检测驾驶员是否在自己的驾驶区域。
可以看出,通过本发明实施例,获取待处理图像,其中,待处理图像中包含车牌及驾驶员,计算待处理图像的聚合通道特征,聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征,根据聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌,然后对多个候选框进行合理性判别,得到多个得分,选取多个得分中的最高得分,在最高得分大于预设阈值时,将最高得分对应的候选框所在区域确定为目标区域。如此,对驾驶员和车牌进行准确识别。另外,在提高检测效率的同时,增加了多个目标检测的可靠性。
与上述一致地,请参阅图2,为本发明实施例提供的一种目标检测方法的第二实施例流程示意图。本实施例中所描述的目标检测方法,包括以下步骤:
201、获取正样本集和负样本集,其中,所述正样本符合正常情况下的驾驶员与车牌之间的位置关系的图像,所述负样本为不符合正常情况下的驾驶员与车牌之间的位置关系的图像。
其中,步骤201中的正样本集可为符合正常情况下的驾驶员与车牌之间的位置关系的图像,例如,驾驶员在驾驶位置,车牌在车牌指定位置,正样本集中包含多个正样本。负样本集则为用户想识别之外的图像,负样本集中包含多个负样本。上述正样本集和负样本集的包含的样本数量当然越多,训练出来的模型越准确,但是,正样本和负样本的数量越多,也会增加训练时候的计算成本。
202、对所述正样本集和所述负样本集进行训练,得到目标分类器。
203、获取待处理图像,其中,所述待处理图像中包含车牌及驾驶员。
204、计算所述待处理图像的聚合通道特征,所述聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征。
205、根据所述聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌。
206、采用所述目标分类器对所述多个候选框进行合理性判别,得到所述多个得分。
207、选取所述多个得分中的最高得分。
208、在所述最高得分大于预设阈值时,将所述最高得分对应的候选框所在区域确定为目标区域。
其中,上述步骤203-步骤208可参照图1所描述的目标检测方法的对应步骤,在此不再赘述。
可以看出,通过本发明实施例,获取正样本集和负样本集,其中,正样本符合正常情况下的驾驶员与车牌之间的位置关系的图像,负样本为不符合正常情况下的驾驶员与车牌之间的位置关系的图像,对正样本集和负样本集进行训练,得到目标分类器,获取待处理图像,其中,待处理图像中包含车牌及驾驶员,计算待处理图像的聚合通道特征,聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征,根据聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌,然后对多个候选框进行合理性判别,得到多个得分,选取多个得分中的最高得分,在最高得分大于预设阈值时,将最高得分对应的候选框所在区域确定为目标区域。如此,对驾驶员和车牌进行准确识别。另外,在提高检测效率的同时,增加了多个目标检测的可靠性。
与上述一致地,以下为实施上述目标检测方法的装置,具体如下:
请参阅图3a,为本发明实施例提供的一种终端的第一实施例结构示意图。本实施例中所描述的终端,包括:获取单元301、计算单元302、检测单元303、判断单元304、选取单元305和确定单元306,具体如下:
获取单元301,用于获取待处理图像,其中,所述待处理图像中包含车牌及驾驶员;
计算单元302,用于计算所述待处理图像的聚合通道特征,所述聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征;
检测单元303,用于根据所述聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌;
判别单元304,用于对所述多个候选框进行合理性判别,得到所述多个得分;
选取单元305,用于选取所述多个得分中的最高得分;
确定单元306,用于在所述最高得分大于预设阈值时,将所述最高得分对应的候选框所在区域确定为目标区域。
可选地,如图3b,图3b为图3a所描述的终端的第一检测单元302的具体细化结构,所述计算单元302可包括:第一计算模块3021、第二计算模块3022和第一确定模块3023,具体如下:
第一计算模块3021,用于计算所述待处理图像的梯度图;
第二计算模块3022,用于计算所述待处理图像的LUV色彩空间的三个通道;
第一确定模块3023,用于根据所述梯度图确定6个方向梯度直方图特征。
可选地,所述第一计算模块3021包括:采样模块(图中未标出)和第二确定模块(图中未标出),具体如下:
采样模块,用于采用如下公式对所述待处理图像进行采样,得到采样图像:
I′(x,y)=I(x/τ,y/τ)
其中,I(x,y)为所述待处理图像,x,y表示所述待处理图像的横坐标和纵坐标,τ为采样因子,I′(x,y)为采样图像;
第二确定模块,用于采用如下公式确定所述采样图像对应的梯度图:
其中,G[I′(x,y)]为梯度图。
可选地,所述判别单元304具体用于:
采用目标分类器对所述多个候选框进行合理性判别。
可选地,如图3c,图3c为图3a所描述的终端又一变型结构,其还包括:训练单元307,具体如下:
所述获取单元301,还具体用于:
在所述获取待处理图像之前,获取正样本集和负样本集,其中,所述正样本符合正常情况下的驾驶员与车牌之间的位置关系的图像,所述负样本为不符合正常情况下的驾驶员与车牌之间的位置关系的图像;
训练单元307,用于对所述正样本集和所述负样本集进行训练,得到所述目标分类器。
可以看出,通过本发明实施例所描述的终端,获取待处理图像,其中,待处理图像中包含车牌及驾驶员,计算待处理图像的聚合通道特征,聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征,根据聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌,然后对多个候选框进行合理性判别,得到多个得分,选取多个得分中的最高得分,在最高得分大于预设阈值时,将最高得分对应的候选框所在区域确定为目标区域。如此,对驾驶员和车牌进行准确识别。另外,在提高检测效率的同时,增加了多个目标检测的可靠性。
与上述一致地,请参阅图4,为本发明实施例提供的一种终端的第二实施例结构示意图。本实施例中所描述的终端,包括:至少一个输入设备1000;至少一个输出设备2000;至少一个处理器3000,例如CPU;和存储器4000,上述输入设备1000、输出设备2000、处理器3000和存储器4000通过总线5000连接。
其中,上述输入设备1000具体可为触控面板、物理按键或者鼠标。
上述输出设备2000具体可为显示屏。
上述存储器4000可以是高速RAM存储器,也可为非易失存储器(non-volatilememory),例如磁盘存储器。上述存储器4000用于存储一组程序代码,上述输入设备1000、输出设备2000和处理器3000用于调用存储器4000中存储的程序代码,执行如下操作:
上述处理器3000,用于:
获取待处理图像,其中,所述待处理图像中包含车牌及驾驶员;
计算所述待处理图像的聚合通道特征,所述聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征;
根据所述聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌;
对所述多个候选框进行合理性判别,得到所述多个得分;
选取所述多个得分中的最高得分;
在所述最高得分大于预设阈值时,将所述最高得分对应的候选框所在区域确定为目标区域。
可选地,上述处理器3000计算所述待处理图像的聚合通道特征,包括:
计算所述待处理图像的梯度图;
计算所述待处理图像的LUV色彩空间的三个通道;
根据所述梯度图确定6个方向梯度直方图特征。
可选地,上述处理器3000计算所述待处理图像的梯度图,包括:
采用如下公式对所述待处理图像进行采样,得到采样图像:
I′(x,y)=I(x/τ,y/τ)
其中,I(x,y)为所述待处理图像x,y表示所述待处理图像的横坐标和纵坐标,τ为采样因子,I′(x,y)为采样图像;
采用如下公式确定所述采样图像对应的梯度图:
其中,G[I′(x,y)]为梯度图。
可选地,上述处理器3000对所述多个候选框进行合理性判别,包括:
采用目标分类器对所述多个候选框进行合理性判别。
可选地,上述处理器3000,在所述获取待处理图像之前,还具体用于:
获取正样本集和负样本集,其中,所述正样本符合正常情况下的驾驶员与车牌之间的位置关系的图像,所述负样本为不符合正常情况下的驾驶员与车牌之间的位置关系的图像;
对所述正样本集和所述负样本集进行训练,得到所述目标分类器。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任何一种目标检测方法的部分或全部步骤。
尽管在此结合各实施例对本发明进行了描述,然而,在实施所要求保护的本发明过程中,本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书,可理解并实现所述公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
本领域技术人员应明白,本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机程序存储/分布在合适的介质中,与其它硬件一起提供或作为硬件的一部分,也可以采用其他分布形式,如通过Internet或其它有线或无线电信系统。
本发明是参照本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管结合具体特征及其实施例对本发明进行了描述,显而易见的,在不脱离本发明的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本发明的示例性说明,且视为已覆盖本发明范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种目标检测方法,其特征在于,包括:
获取待处理图像,其中,所述待处理图像中包含车牌及驾驶员;
计算所述待处理图像的聚合通道特征,所述聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征;
根据所述聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌;
对所述多个候选框进行合理性判别,得到所述多个得分;
选取所述多个得分中的最高得分;
在所述最高得分大于预设阈值时,将所述最高得分对应的候选框所在区域确定为目标区域。
2.根据权利要求1所述的方法,其特征在于,所述计算所述待处理图像的聚合通道特征,包括:
计算所述待处理图像的梯度图;
计算所述待处理图像的LUV色彩空间的三个通道;
根据所述梯度图确定6个方向梯度直方图特征。
3.根据权利要求2所述的方法,其特征在于,所述计算所述待处理图像的梯度图,包括:
采用如下公式对所述待处理图像进行采样,得到采样图像:
I′(x,y)=I(x/τ,y/τ)
其中,I(x,y)为所述待处理图像,x,y表示所述待处理图像的横坐标和纵坐标,τ为采样因子,I′(x,y)为采样图像;
采用如下公式确定所述采样图像对应的梯度图:
G &lsqb; I &prime; ( x , y ) &rsqb; &ap; 1 &tau; G &lsqb; I ( x &tau; , y &tau; ) &rsqb;
其中,G[I′(x,y)]为梯度图。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述对所述多个候选框进行合理性判别,包括:
采用目标分类器对所述多个候选框进行合理性判别。
5.根据权利要求4所述的方法,其特征在于,在所述获取待处理图像之前,所述方法还包括:
获取正样本集和负样本集,其中,所述正样本符合正常情况下的驾驶员与车牌之间的位置关系的图像,所述负样本为不符合正常情况下的驾驶员与车牌之间的位置关系的图像;
对所述正样本集和所述负样本集进行训练,得到所述目标分类器。
6.一种终端,其特征在于,包括:
获取单元,用于获取待处理图像,其中,所述待处理图像中包含车牌及驾驶员;
计算单元,用于计算所述待处理图像的聚合通道特征,所述聚合通道特征中包含LUV色彩空间的三个通道、梯度幅值、6个方向梯度直方图特征;
检测单元,用于根据所述聚合通道特征进行驾驶员检测和车牌检测,得到多个候选框,每一候选框中包含一个驾驶员和车牌;
判别单元,用于对所述多个候选框进行合理性判别,得到所述多个得分;
选取单元,用于选取所述多个得分中的最高得分;
确定单元,用于在所述最高得分大于预设阈值时,将所述最高得分对应的候选框所在区域确定为目标区域。
7.根据权利要求6所述的终端,其特征在于,所述计算单元包括:
第一计算模块,用于计算所述待处理图像的梯度图;
第二计算模块,用于计算所述待处理图像的LUV色彩空间的三个通道;
第一确定模块,用于根据所述梯度图确定6个方向梯度直方图特征。
8.根据权利要求7所述的终端,其特征在于,所述第一计算模块包括:
采样模块,用于采用如下公式对所述待处理图像进行采样,得到采样图像:
I′(x,y)=I(x/τ,y/τ)
其中,I(x,y)为所述待处理图像,x,y表示所述待处理图像的横坐标和纵坐标,τ为采样因子,I′(x,y)为采样图像;
第二确定模块,用于采用如下公式确定所述采样图像对应的梯度图:
G &lsqb; I &prime; ( x , y ) &rsqb; &ap; 1 &tau; G &lsqb; I ( x &tau; , y &tau; ) &rsqb;
其中,G[I′(x,y)]为梯度图。
9.根据权利要求6至8任一项所述的终端,其特征在于,所述判别单元具体用于:
采用目标分类器对所述多个候选框进行合理性判别。
10.根据权利要求9所述的终端,其特征在于,所述获取单元,还具体用于:
在所述获取待处理图像之前,获取正样本集和负样本集,其中,所述正样本符合正常情况下的驾驶员与车牌之间的位置关系的图像,所述负样本为不符合正常情况下的驾驶员与车牌之间的位置关系的图像;
所述终端还包括:
训练单元,用于对所述正样本集和所述负样本集进行训练,得到所述目标分类器。
CN201611163021.0A 2016-12-15 2016-12-15 一种目标检测方法及终端 Pending CN106682600A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611163021.0A CN106682600A (zh) 2016-12-15 2016-12-15 一种目标检测方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611163021.0A CN106682600A (zh) 2016-12-15 2016-12-15 一种目标检测方法及终端

Publications (1)

Publication Number Publication Date
CN106682600A true CN106682600A (zh) 2017-05-17

Family

ID=58869393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611163021.0A Pending CN106682600A (zh) 2016-12-15 2016-12-15 一种目标检测方法及终端

Country Status (1)

Country Link
CN (1) CN106682600A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197622A (zh) * 2017-12-26 2018-06-22 新智数字科技有限公司 一种车牌检测方法、装置以及设备
CN108875537A (zh) * 2018-02-28 2018-11-23 北京旷视科技有限公司 对象检测方法、装置和系统及存储介质
CN109583267A (zh) * 2017-09-28 2019-04-05 京东方科技集团股份有限公司 车辆用目标检测方法、车辆用目标检测装置和车辆
CN109993035A (zh) * 2017-12-29 2019-07-09 深圳市优必选科技有限公司 基于嵌入式系统的人体检测的方法以及装置
CN110046557A (zh) * 2019-03-27 2019-07-23 北京好运达智创科技有限公司 基于深度神经网络判别的安全帽、安全带检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102282572A (zh) * 2009-01-14 2011-12-14 A9.Com有限公司 表示图像块的方法和系统
CN103886308A (zh) * 2014-04-15 2014-06-25 中南大学 一种使用聚合通道特征和软级联分类器的行人检测方法
CN105138987A (zh) * 2015-08-26 2015-12-09 电子科技大学 一种基于聚合通道特征和运动估计的车辆检测方法
CN105184779A (zh) * 2015-08-26 2015-12-23 电子科技大学 一种基于快速特征金字塔的车辆多尺度跟踪方法
CN105787470A (zh) * 2016-03-25 2016-07-20 黑龙江省电力科学研究院 一种基于聚合多通道特征对图像中输电线路杆塔进行检测的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102282572A (zh) * 2009-01-14 2011-12-14 A9.Com有限公司 表示图像块的方法和系统
CN103886308A (zh) * 2014-04-15 2014-06-25 中南大学 一种使用聚合通道特征和软级联分类器的行人检测方法
CN105138987A (zh) * 2015-08-26 2015-12-09 电子科技大学 一种基于聚合通道特征和运动估计的车辆检测方法
CN105184779A (zh) * 2015-08-26 2015-12-23 电子科技大学 一种基于快速特征金字塔的车辆多尺度跟踪方法
CN105787470A (zh) * 2016-03-25 2016-07-20 黑龙江省电力科学研究院 一种基于聚合多通道特征对图像中输电线路杆塔进行检测的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
周爱军 等: "基于视频图像Harris角点检测的车型识别", 《扬州大学学报(自然科学版)》 *
李庆武等: "基于多尺度聚合通道特征的实时行人检测", 《电子测量与仪器学报》 *
胥小马: "使用多特征和多线索的驾驶员人脸检测技术", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
袁 俊 等: "一种复杂交通场景中的车辆检测与跟踪方法", 《工业控制计算机》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583267A (zh) * 2017-09-28 2019-04-05 京东方科技集团股份有限公司 车辆用目标检测方法、车辆用目标检测装置和车辆
CN109583267B (zh) * 2017-09-28 2022-04-08 京东方科技集团股份有限公司 车辆用目标检测方法、车辆用目标检测装置和车辆
US11482013B2 (en) 2017-09-28 2022-10-25 Beijing Boe Technology Development Co., Ltd. Object tracking method, object tracking apparatus, vehicle having the same, and computer-program product
CN108197622A (zh) * 2017-12-26 2018-06-22 新智数字科技有限公司 一种车牌检测方法、装置以及设备
CN109993035A (zh) * 2017-12-29 2019-07-09 深圳市优必选科技有限公司 基于嵌入式系统的人体检测的方法以及装置
CN109993035B (zh) * 2017-12-29 2021-06-29 深圳市优必选科技有限公司 基于嵌入式系统的人体检测的方法以及装置
CN108875537A (zh) * 2018-02-28 2018-11-23 北京旷视科技有限公司 对象检测方法、装置和系统及存储介质
CN110046557A (zh) * 2019-03-27 2019-07-23 北京好运达智创科技有限公司 基于深度神经网络判别的安全帽、安全带检测方法

Similar Documents

Publication Publication Date Title
CN106682600A (zh) 一种目标检测方法及终端
CN103886308B (zh) 一种使用聚合通道特征和软级联分类器的行人检测方法
CN109858389B (zh) 基于深度学习的直梯人数统计方法及系统
CN103390164B (zh) 基于深度图像的对象检测方法及其实现装置
CN102968646B (zh) 一种基于机器学习的车牌检测方法
CN110018524A (zh) 一种基于视觉-属性的x射线安检违禁品识别方法
CN109325418A (zh) 基于改进YOLOv3的道路交通环境下行人识别方法
CN107316010A (zh) 一种识别前方车辆尾灯及判断其状态的方法
CN105160317A (zh) 一种基于区域分块行人性别识别方法
CN106326893A (zh) 一种基于区域辨别的车辆颜色识别方法
CN104680124A (zh) 检测行人的影像处理装置及其方法
CN104123543A (zh) 一种基于人脸识别的眼球运动识别方法
CN108681693A (zh) 基于可信区域的车牌识别方法
CN106650660A (zh) 一种车型识别方法及终端
CN104715244A (zh) 一种基于肤色分割和机器学习的多视角人脸检测方法
CN102855500A (zh) 一种基于Haar和HoG特征的前车检测方法
CN108647708A (zh) 驾驶员评估方法、装置、设备和存储介质
KR102105954B1 (ko) 사고위험 감지시스템 및 감지방법
CN104182769B (zh) 一种车牌检测方法及系统
CN111931683B (zh) 图像识别方法、装置及计算机可读存储介质
CN104156717A (zh) 基于图像处理技术的驾驶员驾车打电话违章识别方法
CN108090459A (zh) 一种适用于车载视觉系统的交通标志检测识别方法
CN104915642A (zh) 前方车辆测距方法及装置
CN101183428A (zh) 一种图像检测方法及装置
CN103390151A (zh) 人脸检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170517

RJ01 Rejection of invention patent application after publication